结构化输出
AI / MCP定义
结构化输出是指以 JSON 等可预测、机器可读格式(而非自由文本)返回的数据。它使 AI 智能体和数据流水线能够进行可靠的下游处理。
与 CrawlForge 的关联
AI 智能体需要结构化数据来做决策。非结构化文本需要额外解析,且容易被误读。结构化输出确保每个数据字段都处于已知的位置和格式,从而实现可靠的自动化处理。
CrawlForge 的 scrape_structured 和 extract_structured 等工具会以符合你指定 schema 的干净 JSON 格式返回数据。这意味着你的智能体和流水线可以直接消费输出,无需后处理或正则提取。
相关 CrawlForge 工具
相关术语
JSON
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人类阅读、便于机器解析。它是 API 响应和结构化数据交换的标准格式。
Schema 标记
Schema 标记是一套(来自 schema.org 的)标签词汇,你将其添加到 HTML 中,以改善搜索引擎读取和呈现你页面的方式。它定义了 Product、Article、Organization 等类型及其属性。
结构化数据
结构化数据是以预定义格式组织的信息,便于机器解析和理解。在网络上,它通常指嵌入在 HTML 页面中的 schema.org 标记。
函数调用
函数调用是语言模型在对话过程中调用外部函数或 API 的能力。模型决定何时调用函数、生成相应的参数,并处理返回的结果。