漫画翻译、嵌字 AI,东京大学论文被 AAAI’21 收录
內容概要:一項關于漫畫文字自動翻譯的研究,引發了熱議,由兩位東京大學博士組成的 Mantra 團隊發布了一篇論文,目前已被 AAAI 2021 收錄,該 Mantra 項目旨在為日本漫畫提供自動化的機器翻譯工具。
原創:HyperAI超神經
關鍵詞:機器翻譯?情感識別?漫畫 AI
最近,由東京大學 Mantra 團隊、雅虎(日本)等機構聯合發布的《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》(論文地址https://arxiv.org/abs/2012.14271)論文,引發了學界和二次元界的關注。
如圖所示:左一為日文原版,自動化輸出英文版(右二)和中文版(右一)
Mantra 團隊成功地實現了將漫畫的中的對話、氣氛詞、標簽等文字自動識別,并做到了區分角色、聯系上下文,最后將翻譯文字準確替換、嵌入氣泡區域。
有了這個翻譯神器,估計翻譯組、追漫的小伙伴們都該偷著樂了。
發論文、公開數據集、商業化一條龍
在科研方面,目前該篇論文已經被 AAAI 2021 接收,研究團隊還開源了一個包含五部不同風格(幻想、愛情、戰斗、懸疑、生活)的漫畫,所組成的翻譯評估數據集。
OpenMantra?漫畫翻譯評估數據集
論文地址:https://arxiv.org/abs/2012.14271
數據格式:帶注釋的 JSON 文件和原始圖像
數據內容:1593 個句子、848 個場景、214 頁漫畫
數據大小:36.8 MB
更新時間:2020 年 12 月 7 日
下載地址:https://hyper.ai/datasets/14137
在產品化方面,Mantra 計劃上線封裝好的自動翻譯引擎,不僅面向出版社提供漫畫的自動化翻譯與發行服務,也會發布面向個人用戶的服務。
下面是我們從 Mantra 官方推特上選取的日漫《周邊男子》的部分翻譯成果,這部多格、輕耽美風格的漫畫,以生活常用的數碼設備擬人化為背景,充滿歡樂與基情:
?
?
?
?
?
《周邊男子》日文原版及自動化機器翻譯的中英文版本
識別、翻譯、嵌字,一步也不能少
具體的實現步驟,Mantra 研究團隊在論文《Towards Fully Automated Manga Translation 實現漫畫全自動翻譯》中進行了詳細的解釋。
?第一步 定位文字?
在實現漫畫自動化翻譯的第一步,就是提取文字區域。
但由于漫畫的特殊性,來自不同角色的對話、效果擬聲詞、文字標注等等,都會展現在一幅漫畫圖片里,漫畫師會用氣泡、不同的字體、夸張的字體來展現不同效果的文字。
漫畫中的手繪、異形文字的識別成為了難點
研究團隊發現,由于漫畫中的這些各種字體和手繪樣式,即使使用最先進的OCR 系統(例如 Google Cloud Vision API),在漫畫文本上的表現很不理想。
因此,團隊開發了針對漫畫優化的文本識別模塊,通過檢測文本行和識別每個文本行的字符來實現對異形文字的識別。
?第二步 內容識別?
在漫畫中,最常見的文字就是角色之間的對話,對話文字氣泡還會被切割成多塊。
這就要求自動化機器翻譯需要準確區分角色,還得聯系上下文注意主語的銜接、避免重復,這都對機器翻譯提出了更高的要求。
點擊放大查看場景分類、文本順序和情感識別流程
在這一步中,要通過上下文感知、情感識別等方式來實現,在上下文感知中,Mantra 團隊用了文本分組、文本閱讀順序、提取視覺語義三種方式,實現了多模態的上下文感知。
?第三步 自動嵌字?
Mantra 這一自動化引擎,不僅能夠區分角色、聯系上下文準確翻譯以外,還很好地解決了漫畫翻譯中的耗時最久、人力成本最高的環節——嵌字。
在嵌字這一環節中,首先要擦除嵌字區域,再進行嵌字,由于日文、中文、英文字符的形態、拼寫、組合、連讀方式都不一樣,所以這一環節的難度也尤其大。
在這一步中,需要進行:頁面匹配→檢測文本框→文字氣泡的像素統計→拆分連接的氣泡→語言間的對齊→文字識別→上下文提取。
?實驗:?數據集與模型測試?
在論文中的實驗部分,Mantra 團隊提到目前并沒有包含多種語言的漫畫數據集,所以他們創建了 OpenMantra(已開源) 和 PubManga?數據集,其中OpenMantra?用于評估機器翻譯,包含 1593 個句子、848 個場景畫面和 214 頁漫畫,Mantra 團隊已經請專業翻譯人員將數據集翻譯成英文和中文。
OpenMantra 漫畫翻譯評估數據集
(同上文)
論文地址:https://arxiv.org/abs/2012.14271
數據格式:帶注釋的 JSON 文件和原始圖像
數據內容:1593 個句子、848 個場景、214 頁漫畫
數據大小:36.8 MB
更新時間:2020 年 12 月 7 日
下載地址:https://hyper.ai/datasets/14137
PubManga?數據集用于評估構建的語料庫,該數據集包含注釋:1)文本和框架的邊框;2)日語和英語的文本(字符序列);3)框架和文本的閱讀順序。
為了訓練模型,團隊準備了 842097 對日文、英文版的漫畫頁面,共 3979205 對日語-英語的句子。具體的方法可以閱讀論文,最終的模型效果評估由人工完成,Mantra 團隊邀請了五位專業的日文-英文翻譯人員,以專業的翻譯評估程序給句子打分。
項目背后:有趣的靈魂一起學習
目前該篇論文已經被 AAAI 2021 收錄,產品化的工作也在穩步推進中,從 Mantra 團隊的推特中,我們看到已經有不少漫畫成功使用了 Mantra 進行自動化機器翻譯。
這樣的寶藏項目,是由兩位東京大學的博士生完成的,CEO石和祥之介?(Shonosuke Ishiwatari),CTO?日南涼太(Ryota Hinami) 同在東京大學博士畢業,在 2020 年創立了 Mantra 團隊。
?
Mantra CEO?石和祥之介(左)和?CTO?日南涼太(右)
CEO 石和祥之介,是東京大學信息科學系本科 2010 級入學,博士畢業于 2019 年。他主要專注于自然語言處理領域的研究和開發,包括機器翻譯和字典生成,也是本篇論文的第二作者。
值得一提的是,石和祥之介的研究經驗豐富,不僅曾經在 CMU 交流訪學,還曾于 2016-17 年在位于北京的微軟亞洲研究院實習半年,當時他在MSRA 首席研究員劉樹杰團隊從事 NLC (Natural Language Computing)? 自然語言計算的研究。
CTO?日南涼太石和祥之介同年入學,專注于圖像識別領域。在 2016-17 年同期和石和祥之介,一同在微軟亞洲研究院實習。
這樣的一對技能互補的小伙伴,完成了 Mantra 的大部分工作,是不是從發量到成果都很讓人羨慕呢?
如果想了解更多關于 Mantra 的信息,大家可以訪問論文(https://arxiv.org/abs/2012.14271)、項目官網(https://mantra.co.jp/)或下載數據集(https://hyper.ai/datasets/14137),進行進一步研究。
總結
以上是生活随笔為你收集整理的漫画翻译、嵌字 AI,东京大学论文被 AAAI’21 收录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于GAMS的电力系统优化分析
- 下一篇: 收发一体超声波测距离传感器模块_超声模块