Expand description
v2 书源配置类型(纯 serde,镜像 book-source.schema.json)。
规则是显式结构化对象,无任何紧凑字符串 DSL。Rule 既是配置、也是供求值器
遍历的语法树(见 design D1/D6)。
Structs§
- Book
Rules - 一本书的字段抽取规则(均可省略)。
- Book
Source - v2 书源。
- Category
- 浏览分类。
- Clean
Step - 单步后处理。
- Content
Rules - 正文规则(可选分页)。
- Expect
- 样例期望不变量。
- Explore
Op - 浏览操作。
- Http
- HTTP 配置块。
- Leaf
Rule - 叶子规则:在当前上下文做一次抽取。
- Rate
Limit - 速率限制。
- Request
- 单个请求。
- Retry
- 重试策略。
- Sample
- 黄金样例。
- Search
Op - 搜索操作。
- TocRules
- 目录规则(章节 + 分卷 + 可选分页)。
Enums§
- Charset
- 字符集。
- Extract
- 取值方式(枚举字符串 或
{ "attr": "..." })。 - Extract
Op - 文本/HTML 取值算子。
- Fetch
Mode - 取页模式:是否动用浏览器解反爬挑战。
真正是否开浏览器还需 app/用户级授权(两级取交集,见 OpenSpec change
browser-fetcherD12)。 - Method
- HTTP 方法。
- Rule
- 一条规则:叶子,或组合子。组合子按其唯一键判别(见 design D1)。
- UrlOr
Rule - URL 字段:可为字符串模板,或一条规则。
- Via
- 抽取后端(决定
select的语义)。
Constants§
- SCHEMA_
ID - 期望的 schema 标识。