KTransformers - 推理
0 ihunter 2025/03

KTransformers 是一个开源的 Transformer 库,用于自然语言处理(NLP)任务。它是基于 PyTorch 框架开发的,提供了一个简单易用的 API,用于构建和训练 Transformer 模型。


Transformer 是一种自注意力机制(Self-Attention Mechanism)的神经网络模型,最初由 Google 提出,用于机器翻译任务。它的主要特点是可以并行化处理输入序列,避免了传统循环神经网络(RNN)中的序列依赖问题。


KTransformers 库提供了以下特点:


简单易用:KTransformers 提供了一个简单易用的 API,用户可以轻松地构建和训练 Transformer 模型。

高性能:KTransformers 基于 PyTorch 框架,利用 GPU 加速,能够高效地处理大规模数据。

灵活性:KTransformers 支持多种 Transformer 架构,包括原始 Transformer、BERT、RoBERTa 等。

预训练模型:KTransformers 提供了多种预训练模型,用户可以直接使用这些模型进行 fine-tuning。

KTransformers 可以用于以下 NLP 任务:


机器翻译:KTransformers 可以用于机器翻译任务,例如将英文翻译成中文。

文本分类:KTransformers 可以用于文本分类任务,例如将文本分类为正面或负面情感。

命名实体识别:KTransformers 可以用于命名实体识别任务,例如识别文本中的人名、地名等实体。

问答系统:KTransformers 可以用于问答系统,例如回答用户提出的问题。

总之,KTransformers 是一个强大的 Transformer 库,能够帮助用户快速构建和训练高性能的 NLP 模型。


- https://github.com/kvcache-ai/KTransformers

- https://kvcache-ai.github.io/ktransformers/en/install.html


mv   /data/site/htmltoo.labs/KTransformers/   /data/site/htmltoo.ai/


cd  /data/site/htmltoo.ai/KTransformers

git clone https://github.com/kvcache-ai/ktransformers.git


git submodule init

git submodule update

bash install.sh


cd  /data/site/htmltoo.ai/KTransformers


```

apt-get install -y build-essential cmake ninja-build

conda create -n KTransformers python=3.11  -y

conda activate KTransformers


cd  /data/site/htmltoo.ai/KTransformers

conda install -c conda-forge libstdcxx-ng

strings ~/anaconda3/envs/DeepSeek-V2-Lite-GGUF/lib/libstdc++.so.6 | grep GLIBCXX

```


cd  /data/site/htmltoo.labs/KTransformers/DeepSeek-V2-Lite-GGUF


pip install --upgrade -r  requirements.txt

pip install --upgrade -r  requirements-add.txt

pip install -U flash-attn --no-build-isolation

-

apt-get install nodejs -y

cd  ktransformers/website

npm config set registry https://registry.npmmirror.com

npm install @vue/cli

npm run build

cd ../../

pip install .


python -m ktransformers.local_chat  --model_path ./models/DeepSeek-V2-Lite --gguf_path ./models/DeepSeek-V2-Lite-Chat-GGUF   --port  7000 --web True

-

ktransformers --model_path ./models/Phi-3.5-Chinese  --gguf_path ./models/DeepSeek-V2-Lite-Chat-GGUF  --port 10002 --web True

-

ktransformers --type transformers --model_path ./models/Phi-3.5-Chinese --port 7000 --web True


## DeepSeek-V2-Lite-GGUF

- https://huggingface.co/mradermacher/DeepSeek-V2-Lite-GGUF

- https://huggingface.co/deepseek-ai/DeepSeek-V2-Lite


- http://192.168.1.11:7000/web/index.html#/chat


##

python -m ktransformers.local_chat  --model_path ./models/Phi-3.5-Chinese   --gguf_path ./models/TinyLlama-1.1B-Chat-v1.0-GGUF   --port  7000 --web True


ktransformers --type transformers --model_path  ./models/DeepSeek-V2-Lite --port 7000 --web True


收藏 有帮助 没帮助

上篇: chitu - 大语言模型推理框架
下篇: LLaMA-Factory - 构建和训练语言模型

相关主题
 IT博客索引
 AI软件索引
 猜你喜欢
热门
焦点
视点
头条