LlamGPT - 基于Llama2的聊天机器人
2024/01 作者:ihunter 0 次 0
git clone https://github.com/getumbrel/llama-gpt.git
cd llama-gpt
现在可以使用以下任何模型运行 LlamaGPT,具体取决于你的硬件:
模型大小 | 使用的模型 | 所需的最低 RAM | 如何启动 LlamaGPT |
---|---|---|---|
7B | Nous Hermes Llama 2 7B (GGML q4_0) | 8GB | docker compose up -d |
13B | Nous Hermes Llama 2 13B (GGML q4_0) | 16GB | docker compose -f docker-compose-13b.yml up -d |
70B | Meta Llama 2 70B Chat (GGML q4_0) | 48GB | docker compose -f docker-compose-70b.yml up -d |
可以通过 http://localhost:3000 访问 LlamaGPT。
要停止 LlamaGPT,请运行:
上篇:
通义千问-14B - 140亿参数规模的模型 - 基于Transformer的大语言模型
下篇:
闻达(wenda):基于大模型的企业私有知识库构建平台