FishHawk
FishHawk
> 我是觉得小说信息跟标签应该解耦,标签单独存一张表进行管理 我觉得有点过早优化了,但如果你不嫌麻烦的话也行吧。
文库小说我还没有想好。考虑到之后要做在线阅读,是不是该进一步解析文章内容,提取目录和章节,然后从文本重新生成epub小说呢? 竖版转横版倒是刻意为之了,绝大多数亚马逊买书上传的用户,都想要看横版的书。
问题1修了,暂时把格式化关了,等jsoup那边看看怎么说。 https://github.com/jhy/jsoup/issues/2141
> 在下载时发现问题似乎并没有被解决,原因不明。可以按照IronKinoko的方法手动解决,不确定是否在所有书籍上都会发生。同时部分版本的iBooks修复了识别问题,但仍然有会触发此问题的最新os版本设备。 有可能是服务器缓存的旧文件。试试随便点下翻译,再下载,触发下重新生成文件。
是有这个计划的。不如反过来思考,直接解析网站生成的epub,就好了。 首先第一步可以先从增强网络小说页面的,导入到工作区按钮开始。
网络小说的epub是网站生成的,格式很简单。epub本身是个zip,改下后缀名解压看看就知道了。 json更好开发,但门槛太高了。
> 因为感觉 epub 还是会缺少很多重要的信息,而很多多余的排版信息不应该是属于 json 的一部分。 epub不会缺失信息。多余的排版信息占的空间极小,而且epub还自带一次zip压缩。 > 话说有在考虑做在网站上读翻好的 epub 功能么?还是说如果要在阅读器里显示 epub 里的图片一下子服务器成本就上去了? 有。图片是个麻烦事,但可以渐进式地实现。先实现本地epub阅读,再实现文库无图片阅读。
> 这段话是用什么东西翻译的 可以解析文件名,不如说下载格式是自己可以控制的。 > 单词表是什么 这对本地小说来说是个问题,也可以把术语表塞进epub。
> 嗯……主要是因为我想下载就是全部下载。所有存在缓存里的东西全部统一下载到一个文件里。 > > 虽然应该很少有人有需求想要用好几种不同的东西翻译同一个本地文件……但是我想能做到,下载下来一个小说以后,在另一个电脑里上传进去以后是完全一样的。 这是网站可以控制的,加个按钮下载全翻译并列的小说就好了。 > 但是现在数据库里面就只会保留一份最新的翻译吧 他说的是百度/有道等四种翻译,不是sakura的多版本。