首页 Playground 应用场景集成价格文档博客

首页
术语表
Token

AI / MCP

Token

定义

token 是语言模型处理的基本文本单位。文本在被模型处理前会被切分为 token（每个 token 大约 4 个字符或 0.75 个单词）。token 数量决定了成本和上下文限制。

与 CrawlForge 的关联

在将 CrawlForge 与 AI 智能体配合使用时，理解 token 很重要，因为抓取到的内容会占用上下文窗口空间。一个很长的网页可能产生数千个 token，有可能填满智能体的上下文并增加 API 成本。

CrawlForge 的 extract_text 和 summarize_content 等工具有助于管理 token 用量。extract_text 只返回不含样板内容的正文，而 summarize_content 会将长页面浓缩为简明摘要，从而减少发送给 LLM 的 token 占用。

相关 CrawlForge 工具

summarize_content

相关术语

上下文窗口

上下文窗口是语言模型在单次请求中能够处理的最大文本量（以 token 计）。它同时包含输入提示词和生成的输出。

大语言模型 (LLM)

大语言模型是一种在海量文本数据上训练的神经网络，能够理解并生成人类语言。LLM 为 AI 助手、代码生成器和自主智能体提供动力。

提示词工程

提示词工程是设计和优化给语言模型的指令以获得预期输出的实践。它涉及编写系统提示词、少样本示例和结构化查询。

微调

微调是在特定数据集上对预训练语言模型进行进一步训练，以使其行为针对特定任务或领域专门化的过程。它将通用模型适配到有针对性的使用场景。

立即领取 1,000 个免费 credits 开始抓取

立即开始使用 CrawlForge，无需信用卡。

领取 1,000 个免费 credits 开始抓取

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。27 个专业 MCP 工具，专为构建智能系统的现代开发者而设计。

产品

功能
Playground
价格
应用场景
集成
替代方案
更新日志

资源

快速上手
API 参考
模板
指南
博客
术语表
常见问题
网站地图

开发者

MCP 协议
Claude Desktop
Cursor IDE
LangChain
LlamaIndex

公司

关于我们
联系我们
隐私政策
服务条款
可接受使用政策
Cookie

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。