码途未来(htmltoo.com):LaWGPT：基于中文法律知识的大语言模型__博客

LaWGPT：基于中文法律知识的大语言模型

2024/03 作者：ihunter 0 次 0

快速开始

准备代码，创建环境

# 下载代码
git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT

# 创建环境
conda create -n lawgpt python=3.10 -y
conda activate lawgpt
pip install -r requirements.txt

启动 web ui（可选，易于调节参数）

首先，执行服务启动脚本：bash scripts/webui.sh
其次，访问 http://127.0.0.1:7860 ：

命令行推理（可选，支持批量测试）

首先，参考 resources/example_infer_data.json 文件内容构造测试样本集；
其次，执行推理脚本：bash scripts/infer.sh。其中 --infer_data_path 参数为测试样本集路径，如果为空或者路径出错，则以交互模式运行。

注意，以上步骤的默认模型为 LaWGPT-7B-alpha ，如果您想使用 LaWGPT-7B-beta1.0 模型：

由于 LLaMA 和 Chinese-LLaMA 均未开源模型权重。根据相应开源许可，本项目只能发布 LoRA 权重，无法发布完整的模型权重，请各位谅解。
本项目给出合并方式，请各位获取原版权重后自行重构模型。

项目结构

LaWGPT
├── assets    # 静态资源
├── resources # 项目资源
├── models    # 基座模型及 lora 权重
│   ├── base_models
│   └── lora_weights
├── outputs   # 指令微调的输出权重
├── data      # 实验数据
├── scripts   # 脚本目录
│   ├── finetune.sh # 指令微调脚本
│   └── webui.sh    # 启动服务脚本
├── templates # prompt 模板
├── tools     # 工具包
├── utils
├── train_clm.py  # 二次训练
├── finetune.py   # 指令微调
├── webui.py      # 启动服务
├── README.md
└── requirements.txt