码途未来(htmltoo.com):Scraperr 是一款自托管的网页爬取工具_AI智能体_码途未来(htmltoo.com)

Scraperr 是一款自托管的网页爬取工具

0 次

ihunter

2025/10

Scraperr 是一款自托管的网页爬取工具，让你无需编写任何代码即可从网站提取结构化数据。

项目采用模块化设计，支持任务队列、自动化媒体下载与多格式数据导出，适合技术团队与个人数据分析者使用。

🚀 核心特性

• XPath 精准提取：支持灵活的网页元素定位方式

• 队列管理：可批量提交与调度多个爬取任务

• 全域抓取：自动遍历同一域名下的所有页面

• 自定义请求头：可添加 JSON 头部信息以提升兼容性

• 媒体下载：支持自动抓取图片、视频等多媒体内容

• 可视化结果展示：以结构化表格形式查看提取数据

• 多格式导出：结果可输出为 Markdown 或 CSV 文件

• 任务通知：完成后自动通过多种渠道发送提醒

官方文档: https://scraperr-docs.pages.dev/

代码：https://github.com/jaypyles/Scraperr

标签：网页爬取工具媒体数据

收藏有帮助没帮助

本文链接地址： https://b.htmltoo.com/project-p131.html

上篇： Open Agent Builder 是一个由 Firecrawl 驱动的可视化工作流构建器
下篇： 没有了

相关主题

1 presentation AI：输入一句话， AI 自动为你生成美观的 PPT 2 Scraperr 是一款自托管的网页爬取工具 3 Pipet：为黑客而生的多功能数据抓取工具 4 Kottster：即开即用的 Node.js 后台管理面板 5 Fireplexity — 极速 AI 搜索引擎 6 Vizro - 数据可视化，低代码 Python 工具包 7 VoltAgent - 脚本人工智能代理框架 8 Ghost CMS - 极致内容体验的全能引擎 9 Maxun：开源无代码网页数据采集平台，让网站秒变 API 和表格！ 10 Suna - 通用 AI 智能体 11 FastAPI-MCP - 将FastAPI应用轻松转型为MCP服务器 12 morphik - 开源多模态RAG

IT博客索引

AI软件索引

猜你喜欢

AI软件

Hexabot - AI 聊天机器人 / 智能代理构...

presentation AI：输入一句话， AI ...

Vizro - 数据可视化，低代码 Python ...

AG2:面向人工智能代理的开源AgentOS

phidata - 全面升级多模态与工作流能力

热门

焦点

视点

头条