- https://github.com/phidatahq/phidata
- https://docs.phidata.com/
- https://github.com/BrainBlend-AI/atomic-agents
## phidata
```
conda create -n phidata python=3.12 -y
conda activate phidata
cd /data/site/htmltoo.labs/phidata
./scripts/upgrade.sh all
pip install -r requirements.txt
pip install -r requirements-add.txt
pip install -U phidata 'fastapi[standard]' sqlalchemy pgvector pypdf "psycopg[binary]" newspaper4k lxml_html_clean
python app/Ollama.py
python app/playground.py
CONDA_INLINE_NO_COMMAND_FIT=1 GRADIO_SERVER_PORT=7000 GRADIO_SERVER_NAME=0.0.0.0 python app.py
```
-
/root/miniconda3/envs/phidata/lib/python3.12/site-packages/gradio/
- http://192.168.1.11:7000
1️⃣ 多模态架构升级:
· 图像、音频原生支持,告别繁琐的三方集成
· 底层优化向量重排序,提升跨模态检索准确度
· 支持自定义模态处理器,灵活应对业务需求
· 视频处理能力研发中,即将支持流式解析
2️⃣ 智能工作流革新:
· 确定性多代理工作流GA发布,任务分解更智能
· Agent间直接对话机制,减少50%通信开销
· 实时上下文注入,让RAG检索更精准
· Pre/Post Hook设计,支持人工确认和结果校验
3️⃣ 状态管理突破:
· session_state变量创新,解决全链路状态共享难题
· 智能缓存机制,降低30%重复计算
· 支持函数级别状态隔离,提升系统稳定性
· 状态回滚机制,异常处理更可靠
4️⃣ 企业级能力加持:
· 五层分块策略(语义/文档/递归/固定/智能)
· CohereReranker统一重排序,提升50%召回准确率
· Milvus向量库原生支持,轻松应对海量数据
· 完整监控指标,助力企业级部署
💡 最佳实践:
· 智能客服:多模态理解+工作流编排,提升60%响应效率
· 知识库构建:五层分块+向量重排,检索准确率提升40%
· 数据分析:状态共享+多代理协作,分析效率翻倍
##
PhiData相比Agno具有以下优势:
更成熟: PhiData是一个更为成熟的库,具有更长的开发历史和更大的用户社区。
更多文档: PhiData的文档相对较多,包括详细的用户指南、API文档和教程。
更广泛的功能: PhiData支持更多的数据分析和科学计算功能,包括机器学习和深度学习。
然而,Agno也具有自己的优势,例如:
更简单的接口: Agno的接口相对更简单、更易用,适合初学者。
更轻量级: Agno是一个更轻量级的库,占用系统资源较少。
最终,选择Agno还是PhiData取决于您的具体需求和偏好。如果您需要一个更成熟、功能更丰富的库,PhiData可能是一个更好的选择。如果您需要一个更简单、更轻量级的库,Agno可能是一个更好的选择。
##
Phidata 是一个框架,旨在创建多模态智能体,支持记忆、知识集成和任务推理,并通过优雅的用户界面与智能体进行交互。
核心功能
• 简单优雅:轻量化设计,快速上手。
• 多模态支持:整合文本、图像、音频、视频输入。
• 多智能体协作:智能体团队协作处理复杂任务。
• 强大灵活:支持定制化工具和复杂任务执行。
• 内置 Agent UI:直观界面,轻松与智能体互动。
• 内置监控与调试:跟踪任务进展、优化性能。
应用场景
1. 高效信息查询:通过整合网络搜索和 AI 模型,快速获取精确信息。
2. 金融数据分析:支持股票价格、分析师推荐、公司资讯等多维度财务数据查询和展示。
3. 知识构建与利用:从 PDF 等文档中提取关键内容,结合内置知识库提升任务效率。
4. 协同工作:多个智能体分工协作,完成需要跨领域整合的信息处理任务。
关键特性
• Agentic RAG(Agent 自主检索生成):减少冗余上下文输入,优化响应质量,提升任务效率。
• 结构化输出:通过定义输出格式(如 Pydantic 模型),确保结果条理清晰、易于理解和使用。
• 推理能力(实验性):支持分步问题解决、动态调整,帮助智能体完成复杂逻辑推理任务。
示例亮点
• 多模态智能体:支持图像、文本等多种形式输入。例如,分析图片内容并检索相关资讯。
• 智能体协作:构建“团队智能体”,如一个智能体负责网络信息检索,另一个处理财务数据,最终生成整合报告。
• 用户界面:内置交互式 UI,方便用户与智能体实时对话并查看任务结果。
用户体验优化
• 无需云端存储:所有数据本地化存储,保障用户隐私。
• 实时监控与调试:通过内置工具跟踪任务进度,解决运行问题
上篇:
PlayNote - 全方位语音内容平台,涵盖播客、旁白和故事
下篇:
Agno - 轻量级多模态智能体框架,打造极速 AI 代理
1 OpenAI Agents SDK:轻量级多智能体工作流框架 2 Oliva - 高效的商品检索能力,支持 语音交互 3 GraphRAG:基于图像检索增强生成开源到爆火,解锁新RAG技术 4 GeoAI: 人工智能驱动的地理空间数据分析 5 DistillFlow 6 Gemma3-OCR - 本地运行的计算机视觉应用 7 Refly - 开源的AI原生创作引擎 8 Second Me - AI 分身平台 9 Agent TARS:智能多模态 AI 代理,助力高效自动化 10 Gurubase - 开源 RAG 问答助手 11 Clara - 隐私至上的本地 AI 助手与智能代理构建器 12 PySpur - 零代码构建AI工作流