- AI多模态故事生成系统:MM-StoryAgent,多模态、多智能体框架
一款AI多模态故事生成系统:MM-StoryAgent,多模态、多智能体框架
可以自动生成包含文字、图像以及多声道音频(旁白、音效、背景音乐)的故事视频,可用于儿童故事快速创作
故事生成采用多阶段写作流程,模拟专家和新手作家对话来优化故事质量,先生成故事大纲,再扩展为完整章节
框架中设计了多个智能体,把原始故事文本转换为模态特定的提示,通过“修订-审核”机制迭代优化提示,确保文本内容与不同模态的一致性,以及图像生成部分的角色一致性
上篇:
Pic2Cook - AI 智能食谱助手
下篇:
Lightpanda - AI 赋能浏览器
1 Suna - 通用 AI 智能体 2 Cooragent - AI 智能体 3 morphik - 开源多模态RAG 4 AI Agent?Google 出品的 智能体 5 OmAgent - 为快速原型和生产构建多模态语言代理 6 ReflyAI - 自由画布×多模态AI引擎 7 OpenAvatarChat - 实时交互数字人系统 8 OpenAI Agents SDK:轻量级多智能体工作流框架 9 Sidekick - AI 研究助手:强大的智能研究工具 10 OpenManus 开源版 11 Refly - 开源的AI原生创作引擎 12 WebWalker - 专注于模拟人类的网络浏览和搜索行为