hect0x7

Results 28 comments of hect0x7

我试了下,这个问题的原因似乎是禁漫的数据有误。禁漫返回的章节数据中的本子id不正确,导致请求章节所在本子找不到。 你提到的这两个本子,好像前端时间禁漫调整了他们的本子id,可能是禁漫章节数据没更新。 可以尝试如下任一解决方案: 1. 用网页端,option配置如下 ```yml client: impl: html ``` 2. 用插件,option配置如下 ```yml plugins: after_init: - plugin: find_update # 只下载新章插件 kwargs: 564268: 561909 564184: 563962 ``` 然后使用命令(无需追加id): ```sh jmcomic ```

## 2023-08-30,该reply的代码已过时不建议使用,请使用下一个reply的代码 我提供一个我的版本 ```python from jmcomic import * # 侦测更新清单 # key: album_id # value: photo_id dic = { 'xxx': 'yyy' } class MyJmDownloader(JmDownloader): def download_by_photo_detail(self, photo: JmPhotoDetail, client: JmcomicClient):...

我上面贴的第一版代码有些不严谨,我发现一些比较老的本子的前一些章节不一定是递增id的,使用你的find_update来挑选章节会更适用,如下 ```python from jmcomic import * # 侦测更新清单 # key: album_id # value: photo_id dic = { '145504': '290266' } # 使用配置文件来创建option option = create_option('your option.yml') class FindUpdateDownloader(JmDownloader): def filter_iter_objs(self,...

关于这个功能,新版本jmcomic支持了filter,可以更好的实现这一功能,我专门写了一个代码示例,感兴趣可以看下 https://github.com/hect0x7/JMComic-Crawler-Python/blob/master/usage/usage_feature_filter.py

Github Actions过往问题反馈: https://github.com/hect0x7/JMComic-Crawler-Python/issues/2

> ![image](https://user-images.githubusercontent.com/139644591/260713423-24d76013-4fe2-44c7-814d-bee3b3739e3d.png) ![image](https://user-images.githubusercontent.com/139644591/260713463-1a6307bd-071f-407d-aacd-621dec1dc9ab.png) 请问下载路径rule这样写哪边问题? 试了下,好像没有依照路径存放 我试了下,好像没问题呀?你确定你下载时候用的option是你自定义的option吗? 我看你的输出,好像用的是默认option的`Bd_Ptitle`. ![image](https://github.com/hect0x7/JMComic-Crawler-Python/assets/93357912/bf04148a-d495-4831-a6ce-bbce7574eed0) ![image](https://github.com/hect0x7/JMComic-Crawler-Python/assets/93357912/e8650016-0011-483f-ba87-a98a8021097c)

> 最近用github好像下不了了 现在可以了,重新fork一下

> 最近好像用不了了 可以用,但你需要重新fork一下我的仓库,你的仓库有点老了,因为option不兼容没法用,重新fork一下就好啦

> /album/482594/宮元一佐-はーとまーくもっと多め 这个问题有两个原因: 1. 禁漫本子的作者不准确 2. 你用的是search_tag而不是search_author 第一个问题显而易见,看看禁漫的网页就知道了 ![image](https://github.com/hect0x7/JMComic-Crawler-Python/assets/93357912/2e1707d2-f510-40bc-a27a-799a78cedd1f) ![image](https://github.com/hect0x7/JMComic-Crawler-Python/assets/93357912/564de71e-0e51-4cb7-a797-32e314ab4d64) ![image](https://github.com/hect0x7/JMComic-Crawler-Python/assets/93357912/f92cb535-7d77-4f47-8f7d-66cf76332e46) 这些本都是search_tag搜出来的,但是《作者:》标签都不是【宮元一佐】。能搜出来是因为《標籤:》有【宮元一佐】。 但是下载的时候,Aauthor就是取《作者:》标签的值,于是就出问题了。 第二个问题,如果你用search_author,可以保证《作者:》标签是【宮元一佐】,但是可能会漏一些本子

> 另外我看了下 client里面关于搜索的部分,教程中是使用的main_tag=3的tag搜索,我试着改成了站内搜索,因为使用tag搜索的话,很多时候结果会存在漏的,虽然给出的html链接已经变成了【html】[https://18comic.vip/search/photos?main_tag=0&search_query=宮元一佐&page=1&o=mr&t=a,但是结果还是和之前使用tag搜索一样,只有20来个结果](https://18comic.vip/search/photos?main_tag=0&search_query=%E5%AE%AE%E5%85%83%E4%B8%80%E4%BD%90&page=1&o=mr&t=a%EF%BC%8C%E4%BD%86%E6%98%AF%E7%BB%93%E6%9E%9C%E8%BF%98%E6%98%AF%E5%92%8C%E4%B9%8B%E5%89%8D%E4%BD%BF%E7%94%A8tag%E6%90%9C%E7%B4%A2%E4%B8%80%E6%A0%B7%EF%BC%8C%E5%8F%AA%E6%9C%8920%E6%9D%A5%E4%B8%AA%E7%BB%93%E6%9E%9C) 我自己乱改的示例: > > ```python > from jmcomic import * > > option = create_option('option.yml') > client = option.new_jm_client() > > site = '宮元一佐' > # 站内搜索main_tag=0。 >...