1303680.jpg

accelerate12138

GF  2021-01-19 17:28
(accelerate12138)

win10下本子打标签的一些想法——批量自动打标签

我个人收藏时本子是按照作者来分类存放在不同文件夹里的,但是如果再加上标签管理,就必然能更快地找到自己想冲的那一本或一类
但是搜遍国内国外,能打标签的软件本来就少,对接e站批量打标签的更是几乎没有(其实是有一个的,但是作者不知什么缘由自己把链接撤掉了,空有描述没有下载链接
原网址:https://www.ptt.cc/bbs/AC_In/M.1569436760.A.261.html(上不去请挂梯子)
因此想仿照这个“绅士方舟”的灵感整一个自动打标签的python脚本(别问,问就是只会python),把我几千本本子打上eh的标签,便于查找
问题在于,个人水平太渣做不做得出来不知道,啥时候做出来更不知道
有没有大佬愿意和我一起做的……


分割线——————————————————————————————————————


如果你对这个project感兴趣,可以看下我的思路,欢迎大家指正
此帖售价 0 SP币,已有 110 人购买
若发现会员采用欺骗的方法获取财富,请立刻举报,我们会对会员处以2-N倍的罚金,严重者封掉ID!

779638.jpg

Lady Maria

B1F  2021-01-19 17:42
(把母系光辉洒满母+,光荣归于母上大人)
支持支持!!好东西

none.gif

潜渊

感谢大佬分享

1290547.png

4a732973

马克

924098.jpg

barista

不懂編程.仰望大佬

6fee8ef50ef3289c.jpg

羡鱼

支持大佬

none.gif

9f0852aa

为啥不用calibre呢?

1303680.jpg

accelerate12138

B7F  2021-01-19 19:11
(accelerate12138)

回 6楼(9f0852aa) 的帖子

我记得calibre是把东西放到自己的文件夹里然后改成cbz后缀吧
因为我的本子已经放到硬盘里了,不想再修改或者挪窝之类的 集中数据库可能更适合我  

而且这个重点在于自动,calibre应该不能做到自动抓取元数据和标签吧

none.gif

9f0852aa

回 7楼(accelerate12138) 的帖子

zip包的是会改成cbz的。好像rar不会改。不过它这个会统一修改文件名成英文的,便于它自己数据库的。

元数据和标签是可以抓取的,有插件doujinshi_metadata_plugins。表站和里站都能抓,不过它这个插件是python2的,要用的话要用python3改一下。

1303680.jpg

accelerate12138

B9F  2021-01-19 20:04
(accelerate12138)

回 8楼(9f0852aa) 的帖子

这个插件似乎是三年前的,issue里已经有人反映在新版calibre里没法用了   
https://github.com/yingziwu/doujinshi_metadata_plugins/issues/8
而且作者似乎也不维护了……你是怎么做到用这个抓标签的

不过可以借鉴一下

none.gif

9f0852aa

回 9楼(accelerate12138) 的帖子

其实就是新版calibre语法从python2换到python3了,就改一点就能用了。
https://onedrive.live.com/?authkey=%21AJY2y8BQzW2Cxus&cid=2C8B5FD569A8621B&id=2C8B5FD569A8621B%213568&parId=root&o=OneUp
这个貌似可以用,我试了一下。

1303680.jpg

accelerate12138

B11F  2021-01-19 21:19
(accelerate12138)

回 10楼(9f0852aa) 的帖子

确实可以 也算达到我的预期了
就是英文tag看起来还是有点不爽 。。而且总是新建一个文件夹放cbz文件,还把我的文件名字都改了并且产生一堆碎文件也是一个槽点
我先试着做一下我预想的这个。。。实在不行的话就用calibre凑活了
——————————————————————————————————
感谢这位老哥安利

465394.jpg

黑色阿萨基姆

回 11楼(accelerate12138) 的帖子

大佬,上面那个.py文件怎么加进插件啊?

none.gif

9f0852aa

回 11楼(accelerate12138) 的帖子

文件名改英文主要是为了多平台通用,你可以参考这个https://github.com/snomiao/calibre-utf8-path自己编译一个新版本,或者就停留在旧的版本,然后用它的文件替换。

碎文件可以用EmbedComicMetadata烧录进压缩包里,但是吧,没啥大用(反正我不用)

英文tag软件自带的标签映射器可以修改,不过也是很麻烦,我自己本身不需要标签的功能   ,可以参考https://opensourcelibs.com/lib/ehsyringe这个,工作量巨大,哈哈

none.gif

9f0852aa

Re:回 11楼(accelerate12138) 的帖子

引用
引用第13楼9f0852aa于2021-01-20 03:32发表的 回 11楼(accelerate12138) 的帖子 :
文件名改英文主要是为了多平台通用,你可以参考这个https://github.com/snomiao/calibre-utf8-path自己编译一个新版本,或者就停留在旧的版本,然后用它的文件替换。

碎文件可以用EmbedComicMetadata烧录进压缩包里,但是吧,没啥大用(反正我不用)

英文tag软件自带的标签映射器可以修改,不过也是很麻烦,我自己本身不需要标签的功能   ,可以参考https://opensourcelibs.com/lib/ehsyringe这个,工作量巨大,哈哈


tag还有种方法,你可以在上面那个爬数据的插件里,搞个英文转中文的map,一步到胃

1303680.jpg

accelerate12138

B15F  2021-01-20 10:35
(accelerate12138)

回 12楼(黑色阿萨基姆) 的帖子

直接把那个__init__.py压缩成压缩包,然后按照这里面插件安装方法导入就好了
https://blog.bgme.me/posts/use-calibre-to-manage-your-doujinshi-2/

calibre对于插件有个要求,就是压缩包里要有这个名字的文件__init__.py,所以才会这么奇怪 如果看别的插件你会发现是压缩包里有很多相互依赖的py文件的

1303680.jpg

accelerate12138

B16F  2021-01-20 11:05
(accelerate12138)

回 13楼(9f0852aa) 的帖子

好家伙,这个自行编译calibre确实厉害。。回头我再仔细研究下 ,开源软件真香

碎文件主要是因为我是用的机械盘存本子,几千本本子产生的几kb碎文件担心会影响我硬盘的性能   

标签这个确实是我没仔细思考,想想其实也很容易实现的

感谢老哥的帮助 不过不能让老哥白帮忙,求物区开了一帖,小小sp,不成敬意
https://bbs.white-plus.net/read.php?tid=1073167

a15.gif

Fox114

回 16楼(accelerate12138) 的帖子

https://www.bilibili.com/video/BV12v411W7Pw
这个视频也是介绍Calibre的

465394.jpg

黑色阿萨基姆

回 15楼(accelerate12138) 的帖子

可以用了,谢啦

不过他每次都会产生同样大小的cbz,这有什么方法避免吗?感觉很占空间

1303680.jpg

accelerate12138

B19F  2021-01-20 13:01
(accelerate12138)

回 17楼(Fox114) 的帖子

感谢,收藏了    不过目前暂时没有web端的需求


(帖子逐渐歪成了calibre教学帖)

1303680.jpg

accelerate12138

B20F  2021-01-20 13:05
(accelerate12138)

回 18楼(黑色阿萨基姆) 的帖子

没有办法    这也是calibre的槽点和我虽然早就听说calibre但始终没有深入搞的理由之一。。。你可以选择calibre生成cbz之后把自己的源文件删掉减少一部分空间占用     

(不过也好理解 这玩意的原意是用来管理电子书的。。电子书再大能大到哪去,集中在一起管理数据库反而方便……像图片管理的eagle也是这个思路。。

none.gif

自由xcx


二十一日晴


none.gif

1fbec4e1

支持支持!!好东西

1303680.jpg

accelerate12138

B24F  2021-01-23 23:05
(accelerate12138)
三天里每天抽点时间断断续续写了几个小时,已经写完了,我自己先本地测试一下
也没想象中的那么难
当然。。。其实也是有挺大缺陷的。。。因为个人能力有限 很多地方还是不太会处理

3.gif

LostMQ

其实不如直接开数据库用sql筛选来的好一些,只不过唯一的问题是win系统的软链接实在是不特别好用。。。

1303680.jpg

accelerate12138

B26F  2021-01-24 16:05
(accelerate12138)

回 25楼(LostMQ) 的帖子

软链接还是我当初研究onedrive同步的时候搞过一点
同样觉得不大行 后来再也没敢用过

话说大佬可以谈谈思路吗 sql和软链接怎么结合在一起给本子贴tag分类啊

888581.png

ExAllocatePool

这个玩意有个学名叫刮削器

你可以了解下NAS 软件管理电影的思路

1303680.jpg

accelerate12138

B28F  2021-01-25 12:07
(accelerate12138)

回 27楼(ea01fbf5) 的帖子

感谢 因为我没有NAS。。对这方面了解确实不多
看来需要多了解下了

——————————————
而且我现在甚至怀疑自己在重复造轮子既然刮削器这么有名。。那在我之前应该会有大佬做e站的刮削器吧