Skip to main content

Module source

Module source 

Source
Expand description

v2 书源配置类型(纯 serde,镜像 book-source.schema.json)。

规则是显式结构化对象,无任何紧凑字符串 DSL。Rule 既是配置、也是供求值器 遍历的语法树(见 design D1/D6)。

Structs§

BookRules
一本书的字段抽取规则(均可省略)。
BookSource
v2 书源。
Category
浏览分类。
CleanStep
单步后处理。
ContentRules
正文规则(可选分页)。
Expect
样例期望不变量。
ExploreOp
浏览操作。
Http
HTTP 配置块。
LeafRule
叶子规则:在当前上下文做一次抽取。
RateLimit
速率限制。
Request
单个请求。
Retry
重试策略。
Sample
黄金样例。
SearchOp
搜索操作。
TocRules
目录规则(章节 + 分卷 + 可选分页)。

Enums§

Charset
字符集。
Extract
取值方式(枚举字符串 或 { "attr": "..." })。
ExtractOp
文本/HTML 取值算子。
FetchMode
取页模式:是否动用浏览器解反爬挑战。 真正是否开浏览器还需 app/用户级授权(两级取交集,见 OpenSpec change browser-fetcher D12)。
Method
HTTP 方法。
Rule
一条规则:叶子,或组合子。组合子按其唯一键判别(见 design D1)。
UrlOrRule
URL 字段:可为字符串模板,或一条规则。
Via
抽取后端(决定 select 的语义)。

Constants§

SCHEMA_ID
期望的 schema 标识。