码途未来(htmltoo.com):OpenAvatarChat - 实时交互数字人系统_AI智能体_码途未来(htmltoo.com)

OpenAvatarChat - 实时交互数字人系统

0 次

ihunter

2025/04

OpenAvatarChat 是一个模块化的实时交互数字人系统，通过整合语音识别（ASR）、多模态语言模型（LLM）和语音合成（TTS）技术，在本地PC上实现低延迟的数字人对话与音视频交互。消费级PC也能部署，i9-13900KF + RTX 4090平台下平均响应延迟仅2.2秒。

项目概述

目标：实现模块化的交互数字人对话系统，支持在单台PC上运行完整功能。
核心功能：音频处理：整合SenseVoice（ASR）、qwen-plus（LLM）、CosyVoice（TTS）。支持实时音视频传输（RTC）、语音活动检测（VAD）、多模态语言模型（MiniCPM-o）和轻量级数字人渲染。提供云端LLM API替代方案，降低本地配置需求。

代码：https://github.com/HumanAIGC-Engineering/OpenAvatarChat

标签：数字系统语音识别大模型多模态

收藏有帮助没帮助

本文链接地址： https://b.htmltoo.com/project-p101.html

上篇： Khoj - 个人人工智能应用程序
下篇： OmAgent - 为快速原型和生产构建多模态语言代理

相关主题

1 fonoster - 构建 AI 电话客服 2 FlyCut Caption 是一个基于 React 的智能视频字幕编辑组件 3 Agent Starter for React - 基于 LiveKit Age... 4 KAG - 知识库 5 Hexabot - AI 聊天机器人 / 智能代理构建 6 Stand-In - 身份保持型视频生成框架 7 sparka - 多模型 AI 聊天平台 8 OxyGent - 面向生产环境的多智能体系统开发框架 9 morphik - 开源多模态RAG 10 DevDocs - 免费开源文档处理平台 11 AI Agent？Google 出品的智能体 12 OmAgent - 为快速原型和生产构建多模态语言代理

IT博客索引

AI软件索引

猜你喜欢

AI软件

FastAPI-MCP - 将FastAPI应用轻松...

agenticSeek - AI智能体

Agno - 轻量级多模态智能体框架，打造极速 AI...

PlayNote - 全方位语音内容平台，涵盖播客、...

Refly - 开源的AI原生创作引擎

热门

焦点

视点

头条