KTransformers 是一个开源的 Transformer 库,用于自然语言处理(NLP)任务。它是基于 PyTorch 框架开发的,提供了一个简单易用的 API,用于构建和训练 Transformer 模型。
Transformer 是一种自注意力机制(Self-Attention Mechanism)的神经网络模型,最初由 Google 提出,用于机器翻译任务。它的主要特点是可以并行化处理输入序列,避免了传统循环神经网络(RNN)中的序列依赖问题。
KTransformers 库提供了以下特点:
简单易用:KTransformers 提供了一个简单易用的 API,用户可以轻松地构建和训练 Transformer 模型。
高性能:KTransformers 基于 PyTorch 框架,利用 GPU 加速,能够高效地处理大规模数据。
灵活性:KTransformers 支持多种 Transformer 架构,包括原始 Transformer、BERT、RoBERTa 等。
预训练模型:KTransformers 提供了多种预训练模型,用户可以直接使用这些模型进行 fine-tuning。
KTransformers 可以用于以下 NLP 任务:
机器翻译:KTransformers 可以用于机器翻译任务,例如将英文翻译成中文。
文本分类:KTransformers 可以用于文本分类任务,例如将文本分类为正面或负面情感。
命名实体识别:KTransformers 可以用于命名实体识别任务,例如识别文本中的人名、地名等实体。
问答系统:KTransformers 可以用于问答系统,例如回答用户提出的问题。
总之,KTransformers 是一个强大的 Transformer 库,能够帮助用户快速构建和训练高性能的 NLP 模型。
- https://github.com/kvcache-ai/KTransformers
- https://kvcache-ai.github.io/ktransformers/en/install.html
mv /data/site/htmltoo.labs/KTransformers/ /data/site/htmltoo.ai/
cd /data/site/htmltoo.ai/KTransformers
git clone https://github.com/kvcache-ai/ktransformers.git
git submodule init
git submodule update
bash install.sh
cd /data/site/htmltoo.ai/KTransformers
```
apt-get install -y build-essential cmake ninja-build
conda create -n KTransformers python=3.11 -y
conda activate KTransformers
cd /data/site/htmltoo.ai/KTransformers
conda install -c conda-forge libstdcxx-ng
strings ~/anaconda3/envs/DeepSeek-V2-Lite-GGUF/lib/libstdc++.so.6 | grep GLIBCXX
```
cd /data/site/htmltoo.labs/KTransformers/DeepSeek-V2-Lite-GGUF
pip install --upgrade -r requirements.txt
pip install --upgrade -r requirements-add.txt
pip install -U flash-attn --no-build-isolation
-
apt-get install nodejs -y
cd ktransformers/website
npm config set registry https://registry.npmmirror.com
npm install @vue/cli
npm run build
cd ../../
pip install .
python -m ktransformers.local_chat --model_path ./models/DeepSeek-V2-Lite --gguf_path ./models/DeepSeek-V2-Lite-Chat-GGUF --port 7000 --web True
-
ktransformers --model_path ./models/Phi-3.5-Chinese --gguf_path ./models/DeepSeek-V2-Lite-Chat-GGUF --port 10002 --web True
-
ktransformers --type transformers --model_path ./models/Phi-3.5-Chinese --port 7000 --web True
## DeepSeek-V2-Lite-GGUF
- https://huggingface.co/mradermacher/DeepSeek-V2-Lite-GGUF
- https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite
- http://192.168.1.11:7000/web/index.html#/chat
##
python -m ktransformers.local_chat --model_path ./models/Phi-3.5-Chinese --gguf_path ./models/TinyLlama-1.1B-Chat-v1.0-GGUF --port 7000 --web True
ktransformers --type transformers --model_path ./models/DeepSeek-V2-Lite --port 7000 --web True
上篇:
chitu - 大语言模型推理框架
下篇:
LLaMA-Factory - 构建和训练语言模型
1 GenBI AI Agent 2 OpenAI Agents SDK:轻量级多智能体工作流框架 3 agno-deepknowledge - 基于Agno 的深度智能知识探索框架 4 Oliva - 高效的商品检索能力,支持 语音交互 5 ZO2:低显存环境下的 175B LLM 全参数微调解决方案 6 AIaW - 全功能、轻量级、可扩展的AI对话客户端 7 Mastra : 专为 TS 开发者设计的 AI 应用开发框架 8 GraphRAG:基于图像检索增强生成开源到爆火,解锁新RAG技术 9 GeoAI: 人工智能驱动的地理空间数据分析 10 text-generation-inference - 推理任务 11 DistillFlow 12 cognita - 低代码 RAG 框架