none.gif

8eafa882

GF  2018-06-09 07:28
(Bravo!)

[修图去字相关] 请问对自动化去字有没兴趣?

前排:对汉化工作等接近无知。

沉迷深度炼丹中,想找点有趣的项目做。打算尝试下用深度学习的方法实现漫画自动去字。自动修图应该也是可以的。
不过还没实现 。 类似waifu2x的放大功能。目前抄  了别人的算法,已经可以实现降噪,高清放大,去相片手抖等基本功能

反正有GPU还在免费阶段,不用浪费了

汉化组内貌似这流程都是大神们手工操作,或许我的幻想能帮得上忙。

如果可能的话,能分享下目前大概的修图去字流程,有什么是要注意的?

联动隔壁求物
https://www.south-plus.net/read.php?tid-406853.html

157031.jpg

otakus

B1F  2018-06-09 07:33
(油猴脚本【https://greasyfork.org/zh-CN/scripts/404896-ex标签汉化】)
这是不可能的。特别是有的文字是跟漫画的背景融合在一起。现在AI技术还没这么叼。


如果能做到这一点,PS基本就不需要人工了。(这里不单指去字,包括所有PS软件上的工作都不需要人类。)



单纯的白框里面的字还有可能。

465852.jpg

Zoo_考拉

回 1楼(otakus) 的帖子

万一楼主是个旷世奇才,做成了呢

ai逐渐取代人智的话,是不是可以实现共产主义了

none.gif

8eafa882

B3F  2018-06-09 08:04
(Bravo!)

回 1楼(otakus) 的帖子

对,就只是白框。不过去之前看到有高人将带字的图片自动消字,所以才对这方向感兴趣。

6751.gif

少女与猫

B4F  2018-06-09 08:08
(黑长直妹子+黑长直装备=毁灭世界)
你做個樣品出來再說呀

none.gif

8eafa882

B5F  2018-06-09 08:16
(Bravo!)

回 4楼(少女与猫) 的帖子

努力收集数据中,而且模型训练也需要时间。
关键是我对汉化接近无知,汉化工作也只在某乎站看过。所以过来问下。

比如楼上讲的 “文字是跟漫画的背景融合在一起” 的情况是完全没想过。

4.gif

3rd

B6F  2018-06-09 08:52
(回顾回帖历史,我这画风不对啊?)
训练模型要花很多时间,多喂点数据

none.gif

渎神战士

很难
你想想abbyy做了那么多年,到现在也只能识别正式字体的东西
本子上妖孽的外形,算了

774647.png

黑色妖孽

B8F  2018-06-09 08:59
(既不氪金,也不氪命)
我嵌字流程大概就是,先白框去字,图源去完字之后LabelPlus导入译文,然后嵌好白框里的,背景字按情况描边覆盖修图这样吧
如果背景字修图不完美的话,那楼主这个东西可能对大组没什么用,毕竟大组要求很高的,开发出来受用人群大概会是会日语想汉化自己想看的本但又不太会嵌字的翻译吧
如果能弄出来挺看好

774647.png

黑色妖孽

B9F  2018-06-09 09:02
(既不氪金,也不氪命)
即使是白框嵌字,字体要与原文字体相同,能做到这个也挺强的了 这样我这字盲就有救了

a5.gif

渣K

B10F  2018-06-09 09:08
(绅士是一体的)
你先把白框去字做出來就已經很厲害了。識別什麼算是是白框並且精確地把裡面的字去掉已經不簡單了。嵌字先不說。mark一下持續關注。
我等嵌字期待lz早日做出成果

828720.jpg

Ritmuller

B11F  2018-06-09 09:22
(肥宅本色)
我想说的是其实只要把白框里的字去掉也能省很大一部分时间了,嵌字的苦说不清

9.png

八嘎⑨

B12F  2018-06-09 09:41
(红尘俗世)
似乎有用,但又似乎意义不是很大……

807389.jpg

世界黑了

多年PS經驗告訴你...不實際..
除非你那是戰略級別的ocr識別內核..

8.gif

Rivers77

B14F  2018-06-09 09:47
(诸君……我喜欢肛肛乐。)
告诉你一件事,已经有人造了这个轮子了
https://moeka.me/mangaEditor/
目前只能去白色对话框背景上面的字,所以应该是比较简单的背景识别
lz要做这个算法的话,难点应该在与识别和填充背景这方面。

72694.png

千易夏河崎

白框還是很簡單的
個人經驗 一本26頁 手動也就個15分鐘

比較麻煩是背景型的吧

244339.jpg

灏灝龙

B16F  2018-06-09 10:55
(喵呜~~)
可以,找到一个和我有共同目标的人
最开始是用photoshop的"动作"功能,实现了白色框框内的字体自动处理
然后对彩漫,框内稍微有点背景的话也能在不破坏背景的条件下去掉大部分字,这些动作的的入口条件是拿魔棒在封闭对话框处点一下,就像这样:

然后现在需要解决的问题有二,一是应该使用什么方法处理融入背景的文字,二是能不能用某种方法,自动找出各种文字区域。目前正在攻略这些问题中   当然是用深度学习

883418.png

0907025e

数据太难弄了

none.gif

8eafa882

B18F  2018-06-09 11:31
(Bravo!)
感谢楼上各位大神,我先向白框方向前进。钳字貌似远远超出我的想象能力了  

识别白框应该不难,因为已经有人面边框的自动标签算法,不过我还不会

@世界黑了
其实不一定要ORC.比如有2张图,不同之处只有被抹掉的字,那么算法就可以学习去字(大概)

数据是自己写轮子在ex爬,不是每个都能下载,如果大神们能提供修好图和原图的文档就最好了

883418.png

0907025e

gpu怎么弄的

883418.png

0907025e

我给你一个数据生成的思路 训练的pair 不要从原图去文字 而是没字的图加文字和底框

374321.png

白色牙膏

借帖子问问,深度学习怎么入门? 这是真炼丹啊

none.gif

8eafa882

B22F  2018-06-09 13:19
(Bravo!)
@0907025e
感谢建议。 Google colaboratory 有k-80免费短时间用,小数据下模型成功的话就搬到VM上租GPU, p-100 是0.8左右一小时,美金 ,选最长24小时停机一次的 Preemptible

@白色牙膏
https://www.coursera.org/specializations/deep-learning
亲身体验,绝对不坑
然后选个标准库学, PyTorch/Tensorflow/Keras 等
个人强推PyTorch, 易学

374321.png

白色牙膏

回 22楼(8eafa882) 的帖子

谢谢大佬

72694.png

千易夏河崎

整樓一堆術語
感覺我還是手動比較"單蠢".....

none.gif

8eafa882

B25F  2018-06-17 08:24
(Bravo!)
下面2张图是仅在测试用







@ 少女与猫 你要的样板


ex 被暂停   , 欢迎个汉化组提供原图和只去字版本。
剩下就是修复去字后的图片