602383883
602383883
temp_dir = url.split('?')[0].split('/')[-1][:-5] 有些时候复制过来的链接没有后缀 .html 可能有点不通用。 page_data['readerInfo']['docId'] 这个是文档id page_data['viewBiz']['docInfo']['showStoreId'] 这个是cover 我用这2种下载ttf都没报错,但是合并pdf时缺f1c1c7c10740be1e640e9a810010002.ttf 只有下面这3个,第二页还是没有 f1c1c7c10740be1e640e9a810010001.ttf f1c1c7c10740be1e640e9a810020001.ttf f1c1c7c10740be1e640e9a810030001.ttf
我打开网页看了一下,page_data['readerInfo']['htmlUrls'] 没了,但是requests还是能获取到 https://yyfyyf.lanzouj.com/inVLy08lq8xc https://yyfyyf.lanzouj.com/iTq3N08lq8ze
> > 我打开网页看了一下,page_data['readerInfo']['htmlUrls'] 没了,但是requests还是能获取到 https://yyfyyf.lanzouj.com/inVLy08lq8xc https://yyfyyf.lanzouj.com/iTq3N08lq8ze > > 意思是网页上有,但是没有保存下来吗 是代码请求到了第一页,第二页地址打不开,但是浏览器打开网页源码整个包含json和ttf链接的那个htmlurls都找不到了