GerapyAutoExtractor icon indicating copy to clipboard operation
GerapyAutoExtractor copied to clipboard

https://www.econ.sdu.edu.cn/zxzx/tzgg.htm 类似这种带分类链接的能智能提取吗

Open ieliwb opened this issue 4 years ago • 1 comments

https://www.econ.sdu.edu.cn/zxzx/tzgg.htm 这种网站,由于有2个链接,导致结果为空,大佬可以更新下吗

ieliwb avatar Apr 03 '21 09:04 ieliwb

可以加一个自定义规则吗,有些网站提取不到,可以用规则,类似:

result = extractor.extract(html, noise_node_list=['//div[@class="comment-list"]'])

谢谢

ieliwb avatar Apr 07 '21 03:04 ieliwb