Local-NotebookLM:开源 + 本地版 NotebookLM
核心功能
1. 智能文档处理
- 自动提取PDF文本,清理格式错误和冗余内容
- 支持处理含数学公式的学术论文
- 智能分块处理大文件(最大支持10万字)
2. 多模式内容生成
- 支持15种输出格式(播客/访谈/辩论/讲座等)
- 8种内容风格(专业/学术/轻松/搞笑等)
- 4种内容长度(短篇10分钟到长篇100+分钟)
3. 灵活模型支持
- 支持6种 LLM 服务(OpenAI/Groq/本地模型等)
- 可配置 TTS 语音角色(主持人与嘉宾双角色对话)
- 本地优先设计,保护隐私的同时降低使用成本
4. 全渠道使用方式
- 命令行一键生成
- Python API 集成
- 网页版服务(基于 FastAPI)
技术亮点
1. 四步处理流程
- Step1 :PDF 解析(PyPDF2 提取 + 智能清洗)
- Step2 :脚本生成(动态提示词 + 分块处理技术)
- Step3 :语音优化(添加自然停顿/语气词)
- Step4 :音频合成(多角色语音 + 片段拼接)
2. 智能提示工程
- 内置角色设定(如"博学的老师 vs 好奇的新手")
- 支持用户自定义内容焦点(偏好指令优先处理)
- 自动生成对话中的即兴发挥内容(类比/反问/幽默元素)
3. 工程化设计
- 中间结果缓存(可断点续生成)
- 自动清理临时文件
- 完善的错误处理与日志系统
- https://github.com/Goekdeniz-Guelmez/Local-NotebookLM
上篇:
Gemma3-OCR - 本地运行的计算机视觉应用
下篇:
Sidekick - AI 研究助手:强大的智能研究工具
相关主题
1 morphik - 开源多模态RAG 2 DevDocs - 免费开源文档处理平台 3 AI Agent?Google 出品的 智能体 4 OmAgent - 为快速原型和生产构建多模态语言代理 5 AiryLark - 开源的文档处理工具 6 OpenAvatarChat - 实时交互数字人系统 7 Khoj - 个人人工智能应用程序 8 mcp.so - 最大的 MCP 服务器集合 9 Krillin AI 是一款全能型音视频本地化与增强解决方案 10 AgenticSeek - 不联网也能写代码、搜文件 11 OpenAI Agents SDK:轻量级多智能体工作流框架 12 TTSFM:兼容 OpenAI TTS 的文本转语音 API 服务器
热门
焦点
视点
头条