CrawlForge
首页应用场景集成价格文档博客
  1. 首页
  2. /
  3. 术语表
  4. /
  5. Token

Token

AI / MCP

定义

token 是语言模型处理的基本文本单位。文本在被模型处理前会被切分为 token(每个 token 大约 4 个字符或 0.75 个单词)。token 数量决定了成本和上下文限制。

与 CrawlForge 的关联

在将 CrawlForge 与 AI 智能体配合使用时,理解 token 很重要,因为抓取到的内容会占用上下文窗口空间。一个很长的网页可能产生数千个 token,有可能填满智能体的上下文并增加 API 成本。

CrawlForge 的 extract_text 和 summarize_content 等工具有助于管理 token 用量。extract_text 只返回不含样板内容的正文,而 summarize_content 会将长页面浓缩为简明摘要,从而减少发送给 LLM 的 token 占用。

相关 CrawlForge 工具

extract_text
1 credits
summarize_content
3 credits

相关术语

上下文窗口

上下文窗口是语言模型在单次请求中能够处理的最大文本量(以 token 计)。它同时包含输入提示词和生成的输出。

大语言模型 (LLM)

大语言模型是一种在海量文本数据上训练的神经网络,能够理解并生成人类语言。LLM 为 AI 助手、代码生成器和自主智能体提供动力。

提示词工程

提示词工程是设计和优化给语言模型的指令以获得预期输出的实践。它涉及编写系统提示词、少样本示例和结构化查询。

微调

微调是在特定数据集上对预训练语言模型进行进一步训练,以使其行为针对特定任务或领域专门化的过程。它将通用模型适配到有针对性的使用场景。

立即领取 1,000 个免费 credits 开始抓取

立即开始使用 CrawlForge,无需信用卡。

领取 1,000 个免费 credits 开始抓取

页脚

CrawlForge

面向 AI Agent 的企业级网页抓取。23 个专业 MCP 工具,专为构建智能系统的现代开发者而设计。

产品

  • 功能
  • 价格
  • 应用场景
  • 集成
  • 替代方案
  • 更新日志

资源

  • 快速上手
  • API 参考
  • 模板
  • 指南
  • 博客
  • 术语表
  • 常见问题
  • 网站地图

开发者

  • MCP 协议
  • Claude Desktop
  • Cursor IDE
  • LangChain
  • LlamaIndex

公司

  • 关于我们
  • 联系我们
  • 隐私政策
  • 服务条款

保持更新

获取新工具和新功能的最新动态。

基于 Next.js 和 MCP 协议构建

© 2025-2026 CrawlForge。保留所有权利。