• 码途未来(htmltoo.com)
    • 关于网站 最近24小时 最近一周内 最近30天内 版权声明 联系我们
    • 深度学习
    • 大语言模型
    • AI智能体
    • 云计算
    • 大数据
    • 维护工具
    • 企业应用
    • AI智能
    • 技术开发
    • 运营推广
    • 创业经验
    • 电商
    • Linux
    • 架构集群
    • 大数据
    • 人工智能
    • 程序文档
    • 开源软件
    • 经验笔记
    • 硬件网络
    • 领导管理
    • 运营推广
    • 团队人力
    • 财务会计
    • 创业商业
    • 盈利模式
    • 心理学
    • 电商学堂
  • 专业常识
    • 项目规划
    • 项目管理
    • 公务员
    • 心理学
    • 科学英政
  • 生活工作
    • 生活
    • 工作
    • 有用
    • 阅读
  • 智慧幽默
    • 人生智慧
    • 成功励志
    • 情感恋爱
    • 搞笑爆笑
  • 导航
    • 推荐阅读 热门排行 有图阅读 热门图文 博客头条 今日视点 焦点资讯 AI软件头条

    • 手机版 电子周刊 单页导航 字母标签
  • 免费注册
  • 直接登录
导航
推荐阅读 热门排行 有图阅读 热门图文 博客头条 今日视点 焦点资讯 AI软件头条
AI软件
深度学习 大语言模型 AI智能体 云计算 大数据 维护工具 企业应用
搜索
会员中心
免费注册
直接登录
关于我们
关于网站 最近24小时 最近一周内 最近30天内 版权声明 联系我们
  • 首页
  • 搜索: 推理
    推理
    时间排序 点击排序 评论排序 评分排序 支持量排序
    • agno-deepknowledge - 基于Agno 的深度智能知识探索框架
      DeepKnowledge:基于Agno 的深度智能知识探索框架概述:基于 @AgnoAgi 框架的深度智能问答系统,通过 GPT-4o 模型对文档知识库进行多轮迭代搜索和推理,能将复杂问题拆解并给出详实的答案和引用来源核心功能- 一个深度智能问答系统,能够通过迭代搜索知识库来回答复杂问题- 它会将复杂问题分解成多个子问题,然后逐步探索和综合答案- 特别之处在于它会进行多轮搜索,不断深入直到找到完 / 2025-03-26 23:09:33 / 查看 1429 次
      TAG: 智能 知识 探索 框架 推理 0 评论 发表评论
    • text-generation-inference - 推理任务
      TGI(Text Generation Inference)是一个由HuggingFace开发的开源框架,专注于高效处理大型语言模型(LLM)的推理任务。它支持GPT、LLaMA和Falcon等多种模型,以其高吞吐量和低延迟的特点著称,并优化了KV缓存,使得长文本推理更加流畅。TGI的应用场景广泛,包括:1. 聊天机器人和AI助手:显著降低响应时间,提升互动体验。2. 文本生成:支持流式输出,适用 / 2025-03-26 01:40:35 / 查看 489 次
      TAG: 推理 模型 场景 助手 部署 0 评论 发表评论
    • dynamo - 一个数据中心规模的分布式推理服务框架
      ## dynamo一个数据中心规模的分布式推理服务框架NVIDIA Dynamo是一个高吞吐量、低延迟的推理框架,旨在为多节点分布式环境中的生成式人工智能和推理模型提供服务。Dynamo被设计为与推理引擎无关(支持TRT-LLM、vLLM、SGLang或其他语言),并捕获LLM特定的功能,例如:分解预填充和解码推理–最大化GPU吞吐量,并促进吞吐量和延迟之间的平衡。动态GPU调度–根据波动的需求优 / 2025-03-21 19:44:44 / 查看 201 次
      TAG: 数据 推理 服务 人工智能 计算 0 评论 发表评论
    • KTransformers - 推理
      KTransformers 是一个开源的 Transformer 库,用于自然语言处理(NLP)任务。它是基于 PyTorch 框架开发的,提供了一个简单易用的 API,用于构建和训练 Transformer 模型。Transformer 是一种自注意力机制(Self-Attention Mechanism)的神经网络模型,最初由 Google 提出,用于机器翻译任务。它的主要特点是可以并行化处理 / 2025-03-21 19:36:02 / 查看 401 次
      TAG: 大模型 推理 微调 人工智能 框架 0 评论 发表评论
    • chitu - 大语言模型推理框架
      - https://github.com/thu-pacman/chitugit clone --recursive https://github.com/thu-pacman/chitu && cd chitupip install -r requirements-build.txtpip install -U torchTORCH_CUDA_ARCH_LIST=8.6 CHITU_SETUP_ / 2025-03-21 19:34:32 / 查看 1 次
      TAG: 大模型 推理 框架 人工智能 性能 0 评论 发表评论
    • Vectrix Graphs 是一个强大的图形化框架
      ##Vectrix Graphs 是一个强大的图形化框架,为AI应用开发提供流式处理、本地推理和API集成功能,支持实时交互和高效工作流。核心功能1. 多种推理方式 • 本地推理:使用开源LLMs进行本地处理。 • API推理:集成Claude 3.5和OpenAI模型,实现高级AI能力。 • 流式响应:支持动态实时交互,提供流畅的用户体验。2. 基于图的架构 • 可视化表示:通过Mermaid生 / 2025-03-21 18:50:42 / 查看 223 次
      TAG: 框架 工作流 推理 可视化 模块化 0 评论 发表评论
    • OmAgent - 简洁高效的开源框架
      - https://github.com/om-ai-lab/OmAgent- https://om-agent.com/##OmAgent 是一个简洁高效的开源框架,专为快速构建和部署多模态语言代理而设计。通过高度抽象和灵活架构,开发者可以轻松处理文本、图像、视频、音频等多模态数据,适用于科研与实际应用。核心特点 1. 简化开发:封装复杂的工程细节,提供简单直观的界面,支持快速原型设计。 2. / 2025-03-21 18:07:55 / 查看 466 次
      TAG: 多模态 原型设计 推理算法 智能助手 开源框架 0 评论 发表评论
      • 1
      • «
      • 1
      • »
      • last
    • 支付宝 ,打赏哦
    • 微信 ,打赏哦

    扫码支持

    扫码支持

    知识的整理归类,离不开每一个热心网友的辛勤努力与默默付出!
    打赏,不在于金钱的多与少,而在于,您那份对Ta付出的肯定与认可!

13850000249 闽ICP备2020019667号-1 闽公网安备35020502000906号