Expand description
v2 书源配置类型(纯 serde,镜像 book-source.schema.json)。
规则是显式结构化对象,无任何紧凑字符串 DSL。Rule 既是配置、也是供求值器
遍历的语法树(见 design D1/D6)。
Structs§
- Book
Rules - 一本书的字段抽取规则(均可省略)。
- Book
Source - v2 书源。
- Category
- 浏览分类。
- Cipher
Step - 加解密算子。默认值贴合「解密正文」主场景:
op=decrypt、inputEnc=base64、outputEnc=utf8。 - Clean
Step - 单步后处理。步内多算子按固定顺序执行:
regex/replace → trim → prepend → append → decode → encode → hash → cipher → cn。 - Content
Rules - 正文规则(可选分页)。
- Expect
- 样例期望不变量。
- Explore
Op - 浏览操作。
- Hash
Step - 哈希算子(可选 HMAC)。
- Http
- HTTP 配置块。
- Leaf
Rule - 叶子规则:在当前上下文做一次抽取。
- Rate
Limit - 速率限制。
- Request
- 单个请求。
- Retry
- 重试策略。
- Sample
- 黄金样例。
- Search
Op - 搜索操作。
- TocRules
- 目录规则(章节 + 分卷 + 可选分页)。
Enums§
- ByteEnc
- crypto 的 key/iv/输入/输出字节编码。
- Charset
- 字符集。
- Cipher
Algo - 对称加密算法。
- Cipher
Mode - 加密模式。
- Cipher
Op - 加解密方向。
- CnConvert
- 繁简转换方向。
- Codec
- 编解码方式(
decode/encode算子,以及 crypto 的字节↔串编码)。 - Extract
- 取值方式(枚举字符串 或
{ "attr": "..." })。 - Extract
Op - 文本/HTML 取值算子。
- Fetch
Mode - 取页模式:是否动用浏览器解反爬挑战。
真正是否开浏览器还需 app/用户级授权(两级取交集,见 OpenSpec change
browser-fetcherD12)。 - Hash
Algo - 哈希算法。
- HashOut
- 哈希/HMAC 输出编码。
- Method
- HTTP 方法。
- Padding
- 填充方式(gcm 忽略)。
- Rule
- 一条规则:叶子,或组合子。组合子按其唯一键判别(见 design D1)。
- UrlOr
Rule - URL 字段:可为字符串模板,或一条规则。
- Via
- 抽取后端(决定
select的语义)。
Constants§
- SCHEMA_
ID - 期望的 schema 标识。