JSON
数据定义
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人类阅读、便于机器解析。它是 API 响应和结构化数据交换的标准格式。
与 CrawlForge 的关联
JSON 是网页数据的通用语言。API 响应、配置文件和结构化数据几乎无一例外地以 JSON 编码。在抓取时,目标通常是将杂乱的 HTML 转换为下游系统可以处理的干净 JSON。
CrawlForge 工具默认以 JSON 格式返回数据。scrape_structured 和 extract_structured 等工具允许你为输出定义 JSON schema,确保提取的数据与你预期的结构完全一致。
相关 CrawlForge 工具
相关术语
JSON-LD
JSON-LD(JSON for Linking Data)是一种使用 JSON 格式编码结构化数据的方法。它是在网页中嵌入 schema.org 标记以供搜索引擎理解的首选格式。
REST API
REST API(Representational State Transfer,表征状态转移)是一种使用标准 HTTP 方法对资源执行操作的 Web 服务架构。它是 Web 服务最常见的 API 风格。
结构化输出
结构化输出是指以 JSON 等可预测、机器可读格式(而非自由文本)返回的数据。它使 AI 智能体和数据流水线能够进行可靠的下游处理。
结构化数据
结构化数据是以预定义格式组织的信息,便于机器解析和理解。在网络上,它通常指嵌入在 HTML 页面中的 schema.org 标记。