Jiepai issues

重定位次数过多问题

requests.exceptions.TooManyRedirects: Exceeded 30 redirects. request重定位不能超过30次，禁止重定位又不能正确获取地址。求问怎么解决啊？

就是其实把并没有把一个词条下所有的图片的爬取下来，我找了一晚上几乎都是的，图片并不全呀，有些博文根据image-list来的，可是这个标签下并没有包括所有图片。点进去一个词条，network里找图片的链接找不到，好像被编码了，新手求教，或许可以稍微指点下~

网址本身点进去图片链接好像就不太全问题解决了吗？？遇到了同样的问题就是其实把并没有把一个词条下所有的图片的爬取下来，我找了一晚上几乎都是的，图片并不全呀，有些博文根据image-list来的，可是这个标签下并没有包括所有图片。点进去一个词条，network里找图片的链接找不到，好像被编码了，新手求教，或许可以稍微指点下~ _Originally posted by @czl-2019 in https://github.com/Python3WebSpider/Jiepai/issues/25#issuecomment-590915333_

shihongtong

requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

请求图组时会报 requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

jifengpig

请求中参数多了个signature

朋友们，2020/04/21更新请求中参数多了个签名。 _signature: vkKyGgAgEBDtEQaM4xfsZr5D8wAAODqdlYWrANQdJNc.Uz5t0EU5hdUp3.HrkUug5ZQkR9AnOSrM1nPytclfX2j7aJLwCrSSigCIQsVZ83c7j7cK3QyaMHyY9ICsGkWbmJT 还未研究出来方案，看到靠谱的可能解决办法，先放上来，供以探讨 https://blog.csdn.net/rico_zhou/article/details/83619564

cycypop

2020.1.27 image_detail没了，该如何借助ajax获取文章中所有图片

我看前边的issue大家用的都是image_list，我也注意到他了，但是image_list只是搜索页显示的几张图片，并不是文章中的全部图片。和书中所指image_detail是完全不一样的东西。但是image_detail里消失了。求教：除了重新get各个文章url，还有没有其他办法获取全部图片？

LiuZhH1366

解决了返回data为空、爬取大图、以title命名文件的bug

31

```python import requests from urllib.parse import urlencode from requests import codes import os from hashlib import md5 from multiprocessing.pool import Pool import re def get_page(offset): headers = { 'cookie': 'tt_webid=6667396596445660679;...

Anodsaber

OSError: [WinError 123] 文件名、目录名或卷标语法不正确。

4

OSError: [WinError 123] 文件名、目录名或卷标语法不正确。 : 'img\\\男士街拍三百八十五期 | 梁靖康的街拍look' """ The above exception was the direct cause of the following exception

Lovesakura

2019/11/4，可爬取示例

```` import os from hashlib import md5 from multiprocessing.pool import Pool import requests from urllib.parse import urlencode GROUP_STRAT = 1 GROUP_END = 10 URL = 'https://www.toutiao.com/api/search/content/?' def get_page(offset): headers =...

liyunlongaaa

小白看书时候发现parameter里多了timestamp，代码小改动了下

1

加了headers, 加了timestamp，但是跑的时候偶尔出现OSError: [Errno 22] The filename, directory name, or volume label syntax is incorrect，我把这个名字直接自己创业却又是可以的，大神们帮忙看看 import requests import os from urllib.parse import urlencode from hashlib import md5 from multiprocessing.pool import...

liaxiang

Jiepai
Jiepai copied to clipboard

Metadata

今日头条的数据ajax无法找到

重定位次数过多问题

requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

请求中参数多了个signature

2020.1.27 image_detail没了，该如何借助ajax获取文章中所有图片

解决了返回data为空、爬取大图、以title命名文件的bug

OSError: [WinError 123] 文件名、目录名或卷标语法不正确。

2019/11/4，可爬取示例

小白看书时候发现parameter里多了timestamp，代码小改动了下

← Metadata

Owner

Metadata

Jiepai Jiepai copied to clipboard

Metadata

← Metadata

Owner

Metadata

Jiepai
Jiepai copied to clipboard