8eafa882

GF 2018-06-09 07:28

（Bravo!）

只看GF | | 小中大

[修图去字相关] 请问对自动化去字有没兴趣？

前排：对汉化工作等接近无知。

沉迷深度炼丹中，想找点有趣的项目做。打算尝试下用深度学习的方法实现漫画自动去字。自动修图应该也是可以的。
不过还没实现

。类似waifu2x的放大功能。目前抄

了别人的算法，已经可以实现降噪，高清放大，去相片手抖等基本功能

。

~~反正有GPU还在免费阶段，不用浪费了~~

汉化组内貌似这流程都是大神们手工操作，或许我的幻想能帮得上忙。

如果可能的话，能分享下目前大概的修图去字流程，有什么是要注意的？

联动隔壁求物
https://www.south-plus.net/read.php?tid-406853.html

顶端

otakus

B1F 2018-06-09 07:33

（油猴脚本【https://greasyfork.org/zh-CN/scripts/404896-ex标签汉化】）

只看该作者 | | 小中大

这是不可能的。特别是有的文字是跟漫画的背景融合在一起。现在AI技术还没这么叼。

如果能做到这一点，PS基本就不需要人工了。（这里不单指去字，包括所有PS软件上的工作都不需要人类。）

单纯的白框里面的字还有可能。

顶端

Zoo_考拉

B2F 2018-06-09 07:50

只看该作者 | | 小中大

回 1楼(otakus) 的帖子

万一楼主是个旷世奇才，做成了呢

ai逐渐取代人智的话，是不是可以实现共产主义了

顶端

8eafa882

B3F 2018-06-09 08:04

（Bravo!）

只看该作者 | | 小中大

回 1楼(otakus) 的帖子

对，就只是白框。不过去之前看到有高人将带字的图片自动消字，所以才对这方向感兴趣。

顶端

少女与猫

B4F 2018-06-09 08:08

（黑长直妹子+黑长直装备=毁灭世界）

只看该作者 | | 小中大

你做個樣品出來再說呀

顶端

8eafa882

B5F 2018-06-09 08:16

（Bravo!）

只看该作者 | | 小中大

回 4楼(少女与猫) 的帖子

努力收集数据中，而且模型训练也需要时间。

关键是我对汉化接近无知，汉化工作也只在某乎站看过。所以过来问下。

比如楼上讲的 “文字是跟漫画的背景融合在一起” 的情况是完全没想过。

顶端

3rd

B6F 2018-06-09 08:52

（回顾回帖历史，我这画风不对啊?）

只看该作者 | | 小中大

训练模型要花很多时间，多喂点数据

顶端

渎神战士

B7F 2018-06-09 08:52

只看该作者 | | 小中大

很难
你想想abbyy做了那么多年，到现在也只能识别正式字体的东西
本子上妖孽的外形，算了

顶端

黑色妖孽

B8F 2018-06-09 08:59

（既不氪金，也不氪命）

只看该作者 | | 小中大

我嵌字流程大概就是，先白框去字，图源去完字之后LabelPlus导入译文，然后嵌好白框里的，背景字按情况描边覆盖修图这样吧

如果背景字修图不完美的话，那楼主这个东西可能对大组没什么用，毕竟大组要求很高的，开发出来受用人群大概会是会日语想汉化自己想看的本但又不太会嵌字的翻译吧

如果能弄出来挺看好

顶端

黑色妖孽

B9F 2018-06-09 09:02

（既不氪金，也不氪命）

只看该作者 | | 小中大

即使是白框嵌字，字体要与原文字体相同，能做到这个也挺强的了

这样我这字盲就有救了

顶端

渣K

B10F 2018-06-09 09:08

（绅士是一体的）

只看该作者 | | 小中大

你先把白框去字做出來就已經很厲害了。識別什麼算是是白框並且精確地把裡面的字去掉已經不簡單了。嵌字先不說。mark一下持續關注。
我等嵌字期待lz早日做出成果

顶端

Ritmuller

B11F 2018-06-09 09:22

（肥宅本色）

只看该作者 | | 小中大

我想说的是其实只要把白框里的字去掉也能省很大一部分时间了，嵌字的苦说不清

顶端

八嘎⑨

B12F 2018-06-09 09:41

（红尘俗世）

只看该作者 | | 小中大

似乎有用，但又似乎意义不是很大……

顶端

世界黑了

B13F 2018-06-09 09:45

只看该作者 | | 小中大

多年PS經驗告訴你...不實際..
除非你那是戰略級別的ocr識別內核..

顶端

Rivers77

B14F 2018-06-09 09:47

（诸君……我喜欢肛肛乐。）

只看该作者 | | 小中大

告诉你一件事，已经有人造了这个轮子了
https://moeka.me/mangaEditor/
目前只能去白色对话框背景上面的字，所以应该是比较简单的背景识别
lz要做这个算法的话，难点应该在与识别和填充背景这方面。

顶端

千易夏河崎

B15F 2018-06-09 10:48

只看该作者 | | 小中大

白框還是很簡單的
個人經驗一本26頁手動也就個15分鐘

比較麻煩是背景型的吧

顶端

灏灝龙

B16F 2018-06-09 10:55

（喵呜~~）

只看该作者 | | 小中大

可以，找到一个和我有共同目标的人
最开始是用photoshop的"动作"功能，实现了白色框框内的字体自动处理
然后对彩漫，框内稍微有点背景的话也能在不破坏背景的条件下去掉大部分字，这些动作的的入口条件是拿魔棒在封闭对话框处点一下，就像这样：

然后现在需要解决的问题有二，一是应该使用什么方法处理融入背景的文字，二是能不能用某种方法，自动找出各种文字区域。目前正在攻略这些问题中

~~当然是用深度学习~~

顶端

0907025e

B17F 2018-06-09 11:29

只看该作者 | | 小中大

数据太难弄了

顶端

8eafa882

B18F 2018-06-09 11:31

（Bravo!）

只看该作者 | | 小中大

感谢楼上各位大神，我先向白框方向前进。钳字貌似远远超出我的想象能力了

识别白框应该不难，因为已经有人面边框的自动标签算法，不过我还不会

@世界黑了
其实不一定要ORC.比如有2张图，不同之处只有被抹掉的字，那么算法就可以学习去字（大概)

数据是自己写轮子在ex爬，不是每个都能下载，如果大神们能提供修好图和原图的文档就最好了

顶端

0907025e

B19F 2018-06-09 11:37

只看该作者 | | 小中大

gpu怎么弄的

顶端

0907025e

B20F 2018-06-09 12:11

只看该作者 | | 小中大

我给你一个数据生成的思路训练的pair 不要从原图去文字而是没字的图加文字和底框

顶端

白色牙膏

B21F 2018-06-09 12:27

只看该作者 | | 小中大

借帖子问问，深度学习怎么入门？

这是真炼丹啊

顶端

8eafa882

B22F 2018-06-09 13:19

（Bravo!）

只看该作者 | | 小中大

@0907025e
感谢建议。 Google colaboratory 有k-80免费短时间用，小数据下模型成功的话就搬到VM上租GPU， p-100 是0.8左右一小时，美金

，选最长24小时停机一次的 Preemptible

@白色牙膏
https://www.coursera.org/specializations/deep-learning
亲身体验，绝对不坑
然后选个标准库学， PyTorch/Tensorflow/Keras 等
个人强推PyTorch，易学

顶端

白色牙膏

B23F 2018-06-09 14:50

只看该作者 | | 小中大

回 22楼(8eafa882) 的帖子

谢谢大佬

顶端

千易夏河崎

B24F 2018-06-09 16:21

只看该作者 | | 小中大

整樓一堆術語
感覺我還是手動比較"單蠢".....

顶端

8eafa882

B25F 2018-06-17 08:24

（Bravo!）

只看该作者 | | 小中大

下面2张图是仅在测试用

@ 少女与猫你要的样板

ex 被暂停

，欢迎个汉化组提供原图和只去字版本。
剩下就是修复去字后的图片

顶端

漫区特设

蜜柑计划

综合交流

人民囧府

[修图去字相关] 请问对自动化去字有没兴趣？

回 1楼(otakus) 的帖子

回 1楼(otakus) 的帖子

回 4楼(少女与猫) 的帖子

回 22楼(8eafa882) 的帖子