pub fn extract_readable_content(document: &Html) -> String
智能提取网页正文区域的 HTML
按优先级尝试 article / main / 常见内容 class, 匹配不到则回退到 <body>,最后回退到整个文档。
<body>