Scraperr 是一款 自托管的网页爬取工具,让你无需编写任何代码即可从网站提取结构化数据。
项目采用模块化设计,支持任务队列、自动化媒体下载与多格式数据导出,适合技术团队与个人数据分析者使用。
🚀 核心特性
• XPath 精准提取:支持灵活的网页元素定位方式
• 队列管理:可批量提交与调度多个爬取任务
• 全域抓取:自动遍历同一域名下的所有页面
• 自定义请求头:可添加 JSON 头部信息以提升兼容性
• 媒体下载:支持自动抓取图片、视频等多媒体内容
• 可视化结果展示:以结构化表格形式查看提取数据
• 多格式导出:结果可输出为 Markdown 或 CSV 文件
• 任务通知:完成后自动通过多种渠道发送提醒
上篇:
Open Agent Builder 是一个由 Firecrawl 驱动的可视化工作流构建器
下篇:
没有了
1 presentation AI:输入一句话, AI 自动为你生成美观的 PPT 2 Scraperr 是一款 自托管的网页爬取工具 3 Pipet:为黑客而生的多功能数据抓取工具 4 Kottster:即开即用的 Node.js 后台管理面板 5 Fireplexity — 极速 AI 搜索引擎 6 Vizro - 数据可视化,低代码 Python 工具包 7 VoltAgent - 脚本人工智能代理框架 8 Ghost CMS - 极致内容体验的全能引擎 9 Maxun:开源无代码网页数据采集平台,让网站秒变 API 和表格! 10 Suna - 通用 AI 智能体 11 FastAPI-MCP - 将FastAPI应用轻松转型为MCP服务器 12 morphik - 开源多模态RAG