Jiepai
Jiepai copied to clipboard
Jiepai Pictures of Toutiao
在现在的ajax里面找不到数据的ajax
requests.exceptions.TooManyRedirects: Exceeded 30 redirects. request重定位不能超过30次,禁止重定位又不能正确获取地址。求问怎么解决啊?
网址本身点进去图片链接好像就不太全 问题解决了吗??遇到了同样的问题 就是其实把并没有把一个词条下所有的图片的爬取下来,我找了一晚上几乎都是的,图片并不全呀,有些博文根据image-list来的,可是这个标签下并没有包括所有图片。点进去一个词条,network里找图片的链接找不到,好像被编码了,新手求教,或许可以稍微指点下~ _Originally posted by @czl-2019 in https://github.com/Python3WebSpider/Jiepai/issues/25#issuecomment-590915333_
请求图组时会报 requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))
朋友们,2020/04/21更新 请求中参数多了个签名。 _signature: vkKyGgAgEBDtEQaM4xfsZr5D8wAAODqdlYWrANQdJNc.Uz5t0EU5hdUp3.HrkUug5ZQkR9AnOSrM1nPytclfX2j7aJLwCrSSigCIQsVZ83c7j7cK3QyaMHyY9ICsGkWbmJT 还未研究出来方案,看到靠谱的可能解决办法,先放上来,供以探讨 https://blog.csdn.net/rico_zhou/article/details/83619564
我看前边的issue大家用的都是image_list,我也注意到他了,但是image_list只是搜索页显示的几张图片,并不是文章中的全部图片。和书中所指image_detail是完全不一样的东西。但是image_detail里消失了。 求教:除了重新get各个文章url,还有没有其他办法获取全部图片?
```python import requests from urllib.parse import urlencode from requests import codes import os from hashlib import md5 from multiprocessing.pool import Pool import re def get_page(offset): headers = { 'cookie': 'tt_webid=6667396596445660679;...
OSError: [WinError 123] 文件名、目录名或卷标语法不正确。 : 'img\\\男士街拍 三百八十五期 | 梁靖康的街拍look' """ The above exception was the direct cause of the following exception
```` import os from hashlib import md5 from multiprocessing.pool import Pool import requests from urllib.parse import urlencode GROUP_STRAT = 1 GROUP_END = 10 URL = 'https://www.toutiao.com/api/search/content/?' def get_page(offset): headers =...
加了headers, 加了timestamp, 但是跑的时候偶尔出现OSError: [Errno 22] The filename, directory name, or volume label syntax is incorrect,我把这个名字直接自己创业却又是可以的,大神们帮忙看看 import requests import os from urllib.parse import urlencode from hashlib import md5 from multiprocessing.pool import...