外文文献翻译(OCR+Deepl+Mathpix)|CSDN创作打卡
記錄下我最近因為畢業(yè)設計需要翻譯外文文獻,然后加快翻譯速度的辦法。
首先最先想到的肯定是翻譯軟件,比如有道,谷歌翻譯什么的,最好的辦法還是能直接扔個pdf進去齊齊整整出來!!!!
然而是我想多了,扔進去出來后是這樣的。。。
- 公式部分處理不好
- 有的地方大片空白
- 排版不美觀
這怕是要被打回去重做了,而且翻譯完了也不知道在說啥,這里我決定還是自己重新一段段,或者一片片的翻譯,我采用的方案如下:
- 使用ocr識別段落內容并初步整理(這里我用的天若ocr)
- 使用Deepl進行翻譯
- 使用Mathpix進行公式部分的識別處理
軟件大概這樣(可以參考下面的鏈接進行下載,其實選擇這幾個軟件是因為我電腦平時就有,只是平時都單獨用)
天若OCR文字識別 (tianruo.net)
DeepL翻譯:全世界最準確的翻譯
數學公式識別神器—Mathpix Snip - 知乎 (zhihu.com)
首先看下目標文章:
可以看到有很多公式,然后是圖標,然后還是兩欄的那種,我選擇的是從左到右從上到下進行翻譯
1、使用ocr進行識別
但是要知道deepl直接輸入文本就可以,為啥不用deepl呢,因為我發(fā)現用deepl的話復制的話是一行一行的,比如我們用鼠標選擇一段話復制進去,就發(fā)現他是一句一句的,如下圖所示
?這里我復制了完整的一段,但是粘貼進去成了一行一行,這樣會影響翻譯的準確率,也對我們分段造成了一定的干擾,而如果使用ocr,同樣的識別一段,其實除了部分英文的連接詞,基本沒有斷開,這樣在直接復制到deepl里面,就是我們想要的結果了。
可以看出這就直接是很完整的一段畫了?
?2、使用deepl進行翻譯
復制進入翻譯框即可,這個跟網絡有點關系,網好的時候很流暢,基本沒什么問題
? 3、使用mathpix進行公式識別
打開使用他的截屏工具對公式進行框選,就可以識別到公式了?
這里可以使用復制到word,就復制word適用的文本?
?
?去word里面粘貼,效果如下,是一個可編輯的狀態(tài)
當然也可以選擇其他格式進行粘貼
比如我這里用axmath進行編輯公式,也就可以進行復制修改了
大概就是這么幾個工具了,用起來我翻譯這篇文章大概花了1個多小時的樣子,word文本出來22頁。
這里補充下:感謝各位大佬提的建議,這里發(fā)現就是mathpix每個月只能識別50次的公式,所以如果想要增加識別的數目那就還是要開會員啊,這可咋辦啊,咱的兜里可沒這么多錢!
不慌,又發(fā)現了另一個識別神器,也比較好用啊,網址如下所示:
在線LaTeX公式編輯器-編輯器 (latexlive.com)
進入之后我們這里選擇圖片識別
之后我們將公式截屏然后粘貼進去即可
?
可以看到這里輸出的是LaTeX的語法,這樣我們是不能直接復制到word里面的,這就需要我們在word里面進行一點修改,具體的可以參考一些網上的教程還是比較多的,這里我就不贅述了,我還是用我的公式編輯器,直接復制進去就行了:
總結
以上是生活随笔為你收集整理的外文文献翻译(OCR+Deepl+Mathpix)|CSDN创作打卡的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 北京2008年第29届奥运会吉祥物五个福
- 下一篇: css常见属性记录(未完待续)