Home
Softono
LLM-Kit

LLM-Kit

Open source Python
550
Stars
62
Forks
0
Issues
13
Watchers
6 months
Last Commit

About LLM-Kit

LLM-Kit is a comprehensive WebUI integration platform designed to streamline the entire workflow of large language models without requiring coding knowledge. It supports mainstream LLM APIs, including OpenAI, Azure, Baidu ERNIE, Zhipu, Alibaba Tongyi, iFlytek Spark, and Claude, as well as various open-source models like ChatGLM, Baichuan, Qwen, and Llama-based variants. The software enables users to manage knowledge bases, connect to databases, create custom role-playing agents, and generate images using Midjourney. Advanced features include full-parameter and LoRA model fine-tuning, dataset creation, and integration with Live2D for dynamic avatars. It also incorporates voice synthesis and singing voice conversion capabilities via VITS and SVC technologies. Compatible with Windows and Linux systems, it supports Python 3.8 to 3.10 and CUDA 11.7 or 11.8. The platform offers 4-bit and 8-bit quantization to optimize resource usage on standard hardware. Whether for inference, training, or deploying specialized app

Platforms

Web Self-hosted

Languages

Python

Links

苏秦(suqin) 语言大模型全工具链 WebUI 整合包

English | 中文

介绍

⛓️ 本项目目标是实现目前各大语言模型的全流程工具 WebUI 整合包。不用写代码即可拥有自己的定制模型与专属应用!

具体功能模块如下:


开发部署

初次使用建议查阅说明文档进行相关操作

软件需求

本项目已在 Python 3.8 - 3.10,CUDA 11.7/11.8 环境下完成测试。已在 Windows、Linux 系统中完成测试。

安装环境

1. 运行环境

# 拉取仓库
$ git clone https://github.com/wpydcr/LLM-Kit.git

# 进入目录
$ cd LLM-Kit

# 安装依赖
$ pip install -r requirements.txt

依赖也可以直接下载:Windows环境包Linux环境包

显卡驱动cuda自行安装

2. 执行脚本

  • win环境,双击打开 web-demo-CN.bat 脚本
  • Linux环境,双击打开 web-demo-CN.sh 脚本

3. 相关演示文件

  • 体验大模型连接数据库功能请先下载相关文件
  • 体验角色扮演功能请先下载相关文件
  • 表情包功能请先下载相关文件放入data/apply/emotion文件夹中

文件目录

  • env :集成包环境
  • utils :工具代码
  • modules :各模块代码
    • agent :agent相关代码
      • chatdb : 数据库接入相关代码
      • svc : svc相关代码
      • vits : vits相关代码
    • apply :应用demo代码
    • model :模型相关代码
  • data :数据文件
    • apply :应用demo相关文件
      • audio :生成的语音文件
      • emotion :表情包文件
      • play :人设提示词文件
    • documents :知识库数据文件
    • modeldata :模型训练数据文件
      • LLM :大模型训练数据文件
      • Embedding :嵌入模型训练数据文件
  • ui :ui界面代码
  • output :训练中的checkpoints
  • models :模型文件

发展路线图


贡献者

吴平宇 @USTC

发起人,负责整体项目架构和技术规划

廖文彬 @中科院计算技术研究所

负责gradio,图向量数据库,Mysql数据库,api接口集成等python开发

胡钜程 @伦敦大学学院UCL

负责图向量数据库, live2D,vits, svc,gradio等python开发

李璟辉

负责大模型训练与推理的后端代码开发


项目招募

详见说明文档


参考与学习

Github stars 基于ChatGLM的langchain应用

Github stars 骆驼中文大模型

Github stars ChatDB

Github stars Live2d模型

Github stars Chat-Haruhi-Suzumiya

Github stars 川虎Chat:为多种LLM提供Web图形界面


开源协议

本仓库的代码依照 AGPL-3.0 协议开源

一方面希望通过开源加强项目产品化程度;另一方面希望在社区中吸收更多的实践场景进而继续完善产品,也欢迎大家参与到项目中来。

AGPL-3.0 是 OSI 批准的许可证,符合自由和开源软件的所有标准,开源永远是我们的初心与核心,我们将始终不渝的坚持去做这件事,我们相信在社区的推动下,这件事我们一定会做的更好 。

或许很多开发者对此协议抱有一些疑问,开源社区目前也有很多采用 AGPL-3.0 协议的开源软件,例如 MongoDB、Grafana、Loki 等, 维基百科还专门有一份列表列出了哪些开源项目 采用了 AGPL-3.0 开源协议。

AGPL-3.0 协议有一个非常关键的点,即对修改上游开源项目代码后的二次分发版本必须也要开源,协议限制的是部分企业想 Folk 开源项目代码后进行闭源商业分发,跟上游开源项目的维护团队进行直接的商业竞争,如果仅仅只是企业内部自己使用而不进行任何层面修改,用户大可不必担心 AGPL-3.0 协议带来的限制, 这些条件旨在鼓励和希望修改软件的第三方也为项目和社区做出贡献。我们认为这是一种更公平的前进方式,我们相信这将有助于我们建立更强大的社区。

简单来讲:如果您修改了本项目源代码,那么您必须将这些修改贡献给社区, 绝不允许修改后和衍生的代码做为闭源的商业软件发布和销售。

我们也提供了商业授权,如果您需要将本产品进行二次开发、更改并进行任何附带商业化性质行为使用,请联系我们([email protected])进行商业授权,以遵守 AGPL-3.0 协议保证您的正常使用。

除此之外,我们也会酌情接受根据个人或企业需求的定制化开发。

目前在国内 GPL 协议具备合同特征,是一种民事法律行为 ,属于我国《合同法》调整的范围。 本项目团队保留诉讼权利。

本项目开源团队拥有对本开源协议的最终解释权。


引用

如果您在项目中使用了我们的模型、代码或者数据,请引用下面文章。

Please cite the repo if you use the data or code in this repo.

@misc{wupingyu2023,
  author={Pingyu Wu},
  title = {LLM Kit},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/wpydcr/LLM-Kit.git}},
}

Starchart

Star History Chart