Skip to main content

extract_readable_content

Function extract_readable_content 

Source
pub fn extract_readable_content(document: &Html) -> String
Expand description

智能提取网页正文区域的 HTML

按优先级尝试 article / main / 常见内容 class, 匹配不到则回退到 <body>,最后回退到整个文档。