Expand description
抽取后端(Strategy)。按 Via 静态分派到 css(dom_query)/ json(jsonpath)/ regex /
raw 实现;新增 xpath 只需加一个分支(开闭原则,见 design D8)。
HTML 的 select 为 self-or-descendant 语义:把上下文当文档解析,选择器既匹配
后代、也匹配根元素自身(dom_query 解析片段后根入树),这与旧引擎一致,使
select:"a" + attr:href 能取「列表项自身的 href」、select:"h2" 能判「该项是不是卷」。
Functions§
- extract
- 从上下文抽取一个值(值规则)。
- select_
all - 选中所有匹配,返回各自的「子上下文」内容串(列表规则)。