本页内容
当你明确教会 Cursor 如何使用你的工具时,它会变得有用得多。一个 .cursorrules 文件会告诉 Cursor 在哪种任务下挑选哪个 CrawlForge 工具、如何优化 credit 用量,以及 scraping 时该遵循哪些模式。
本指南为你提供面向生产可用的 CrawlForge Cursor 规则,并附上每条规则背后的考量,方便你把它们调整到自己的工作流中。
目录
- 什么是 Cursor 规则?
- 前置条件
- 步骤 1:把 CrawlForge 配置为 MCP server
- 步骤 2:创建你的 .cursorrules 文件
- 步骤 3:网页研究规则
- 步骤 4:数据提取规则
- 步骤 5:credits 优化规则
- 步骤 6:进阶工作流规则
- 完整的 .cursorrules 模板
- credits 成本参考
- 下一步
什么是 Cursor 规则?
Cursor 规则是项目级的指令,用来告诉 Cursor AI 助手该如何行事。它们位于项目根目录下的 .cursorrules 文件中(或作为单独文件放在 .cursor/rules/ 里)。Cursor 处理任何请求时,会把这些规则作为系统级上下文读取。
没有规则时,Cursor 仍会使用 CrawlForge 工具,但会做出次优选择——比如在 fetch_url(1 credit)就足够的情况下使用 deep_research(10 credits)。规则通过把你的工具选择逻辑直接编码进去来解决这一点。
前置条件
- 已安装 Cursor(v0.45+)
- 已安装 CrawlForge MCP server:
npm install -g crawlforge-mcp-server - 一个 CrawlForge API key(免费套餐:1,000 credits)
步骤 1:把 CrawlForge 配置为 MCP server
把 CrawlForge 加入你的 Cursor MCP 设置。打开 Cursor Settings > MCP Servers 并添加:
重启 Cursor。你应当能在可用的 MCP tools 列表中看到 CrawlForge,且全部 20 个工具均可访问。
步骤 2:创建你的 .cursorrules 文件
在你的项目根目录创建 .cursorrules:
现在我们来逐一充实每一类规则。
步骤 3:网页研究规则
这些规则教会 Cursor 何时进行网页搜索、何时直接获取一个已知 URL:
步骤 4:数据提取规则
根据用户所需选择正确提取工具的规则:
步骤 5:credits 优化规则
这些规则可避免 Cursor 不必要地消耗 credits:
步骤 6:进阶工作流规则
面向复杂的多步骤 scraping 流程的规则:
完整的 .cursorrules 模板
下面是完整的、可直接复制粘贴的模板,它整合了上面所有规则:
credits 成本参考
| Credits | 工具 | 典型用例 |
|---|---|---|
| 1 | fetch_url, extract_text, extract_links, extract_metadata | 快速获取页面、发现链接 |
| 2 | scrape_structured, extract_content, map_site, process_document, localization | 提取特定数据、映射站点、处理文档 |
| 3 | track_changes, analyze_content | 跟踪变化、分析内容 |
| 4 | summarize_content, crawl_deep | 摘要、多页爬取 |
| 5 | search_web, batch_scrape, scrape_with_actions, stealth_mode | 网页搜索、批量操作、浏览器自动化 |
| 10 | deep_research | 详尽的多源分析 |
下一步
- CrawlForge 快速上手 -- 60 秒安装 CrawlForge
- 构建一个研究助手 -- 用 Claude 完成的完整项目教程
- 20 个工具参考 -- 完整的工具文档
- GitHub 上的 awesome-cursorrules -- 社区维护的 Cursor 规则合集
开始更聪明地 scraping。 免费注册即可获得 1,000 个 credits,安装 CrawlForge,把这些规则放进你的 .cursorrules 文件。你的 Cursor AI 每次都会选对工具。