Function extract_readable_content

pub fn extract_readable_content(document: &Html) -> String

Expand description

智能提取网页正文区域的 HTML

按优先级尝试 article / main / 常见内容 class，匹配不到则回退到 <body>，最后回退到整个文档。

extract_readable_content