看美剧英文字幕学英语的利器——“深蓝英文字幕助手”简介
我從初中開(kāi)始基本上就是一個(gè)英語(yǔ)很爛的人,數(shù)理化再好有什么用,工作了,結(jié)果發(fā)現(xiàn)數(shù)理化都沒(méi)啥用,最有用的還是當(dāng)年學(xué)的最爛的英語(yǔ)。于是在2011年年底開(kāi)始了學(xué)習(xí)英語(yǔ)的課程,在學(xué)習(xí)的過(guò)程中,外教經(jīng)常會(huì)放英劇美劇給我們看,看了以后回答問(wèn)題,講解,挺有意思的。印象最深刻的就是Neil給我的Doctor Who還有另外一個(gè)外教放的Friends。后來(lái)在課程快結(jié)束的時(shí)候,萌發(fā)了一個(gè)想法,能不能只看英文字幕來(lái)看美劇(當(dāng)然還有英劇),這樣沒(méi)有中文字幕的話才能在看美劇的過(guò)程中聯(lián)系閱讀與聽(tīng)力。但是美劇中很多詞匯不懂,一旦句子中出現(xiàn)了兩個(gè)不懂的詞匯,那么這句話基本上就不懂是啥意思了。那么我能不能根據(jù)我的實(shí)際詞匯量,對(duì)字幕就行修改,如果是認(rèn)識(shí)的單詞,那么就不管,如果是不認(rèn)識(shí)的單詞,那么就給出其中文意思,這樣能夠便于理解整個(gè)句子,而且在潛移默化中慢慢的提高詞匯量。
一年多前萌發(fā)的這個(gè)想法,于是按照這個(gè)思路寫了一個(gè)字幕注釋的小程序,可惜只寫了一大半,然后由于工作的原因,就停了,最近突然想起這個(gè)東西,于是想能夠把這個(gè)程序完成。(最近射手網(wǎng)和人人字幕組的關(guān)閉,讓我覺(jué)得這個(gè)軟件的必要)
整個(gè)程序的設(shè)計(jì)思路是這樣的:
1.第一次運(yùn)行這個(gè)程序時(shí),需要設(shè)置詞匯量,根據(jù)柯林斯詞典提供的詞頻分級(jí)表,按詞頻分成5到0級(jí)詞匯,0級(jí)最難最少用,5級(jí)最常用。用戶根據(jù)對(duì)自己的估計(jì)進(jìn)行選擇,如果英語(yǔ)爛,那么就選擇只認(rèn)識(shí)5級(jí)詞匯。如果英語(yǔ)不錯(cuò),過(guò)了四六級(jí)那么可以選擇4級(jí)或者3級(jí),如果是英語(yǔ)專8水平啥的,可以選擇更高級(jí)的詞匯。選中后就會(huì)把這些等級(jí)的詞匯記錄到已認(rèn)識(shí)的詞匯表中(如果有些詞不認(rèn)識(shí),可以通過(guò)用戶詞匯管理功能進(jìn)行調(diào)整).
2.提供生詞本導(dǎo)入功能,如果用戶是開(kāi)心詞場(chǎng),有道詞典之類的軟件的用戶,那么可以將這些軟件的記錄導(dǎo)入到這個(gè)程序中,便于完善用戶自己的認(rèn)識(shí)和不認(rèn)識(shí)的詞匯列表。
3.用戶下載帶有英文字幕的srt或者ass格式的字幕文件,這個(gè)字幕文件可以是全英文的,也可以是中文英文都包含的,程序會(huì)將中文字幕全部移除,只保留英文字幕部分。
4.對(duì)英文字幕中的每個(gè)句子進(jìn)行轉(zhuǎn)換和分解,分解成詞匯,然后用分解出的詞匯和用戶詞匯表進(jìn)行比對(duì),如果發(fā)現(xiàn)是用戶認(rèn)識(shí)的單詞,那么就忽略,如果是用戶不認(rèn)識(shí)的單詞,那么就查詢字典(默認(rèn)采用的是維科英漢詞典10W詞匯,基本滿足日常詞匯需要),得到該單詞的中文解釋,如果詞典中查不到這個(gè)詞,那么就忽略,查的到就顯示出來(lái)。
5.用戶根據(jù)顯示出來(lái)的所有詞,再選擇哪些是認(rèn)識(shí)的,如果認(rèn)識(shí)就可以標(biāo)記為認(rèn)識(shí),以后也不會(huì)被注釋。如果是不認(rèn)識(shí)的,那么可能這個(gè)詞存在多種注釋,用戶可以選擇哪種注釋在這個(gè)句子中更合理。
6.根據(jù)用戶選擇,把英文字幕進(jìn)行替代,不認(rèn)識(shí)的詞匯會(huì)在旁邊加上簡(jiǎn)短的中文注釋。如果用戶覺(jué)得整句話都很難,想把整句話都翻譯了,那么可以調(diào)用網(wǎng)上的翻譯服務(wù)(有道,百度,微軟,谷歌),對(duì)整句話進(jìn)行翻譯。
7.用戶可以進(jìn)一步在界面上手工調(diào)整注釋后的字幕,然后只需要保存這個(gè)替換后的英文字幕,然后用播放軟件導(dǎo)入這個(gè)新字幕即可。
在編寫這個(gè)程序的時(shí)候,遇到了很多關(guān)于英語(yǔ)上的問(wèn)題,挺有意思的,下面列舉一下:
1.如何得到一個(gè)單詞的原型。
英語(yǔ)單詞有很多種變形,比如復(fù)數(shù)+s/es,過(guò)去式+ed,現(xiàn)在進(jìn)行時(shí)+ing,比較級(jí)+er等,我們一般不會(huì)說(shuō)認(rèn)識(shí)單詞do,卻不認(rèn)識(shí)單詞doing,程序必須找到doing的原型do,然后再到用戶詞匯表中去查用戶是否認(rèn)識(shí)do這個(gè)詞。這個(gè)我之前的處理辦法很復(fù)雜,現(xiàn)在的處理辦法很高效,很實(shí)用。
2.如何知道一個(gè)詞是人名/地名。
在美劇中必然會(huì)大量的出現(xiàn)人名地名啥的,如果人名本身沒(méi)有其他意義那還好說(shuō)系統(tǒng)會(huì)忽略,但是如果人名有其他意義就會(huì)對(duì)整個(gè)句子的意思造成影響。比如He is Bush.這么一個(gè)句子,如果把Bush作為單詞,那么就會(huì)翻譯成“他是灌木叢”,這也太搞了,這里程序應(yīng)該意識(shí)到Bush是人名,對(duì)于人名就不需要翻譯。怎么知道一個(gè)單詞是人名呢?我目前的做法簡(jiǎn)單粗暴直接,維護(hù)了一個(gè)常見(jiàn)的人名列表,如果首字母大寫的,那么就查詢這個(gè)人名列表,存在則說(shuō)明是人名,不存在就當(dāng)普通詞匯處理。地名目前沒(méi)有維護(hù),沒(méi)有處理,畢竟地名出現(xiàn)的頻率沒(méi)有人名高。
3.對(duì)于一詞多性多義,怎么判斷取哪個(gè)意義。
有些單詞既可以做動(dòng)詞用,也可以做名詞用,當(dāng)名詞時(shí)和動(dòng)詞時(shí)的意思完全不一樣,這是一個(gè)問(wèn)題。比如book,可以做n.那么就是書的意思,也可以做v.那么就是預(yù)定的意思。這兩個(gè)意思毫無(wú)關(guān)聯(lián),那么怎么確定一個(gè)句子中的book到底是哪個(gè)http://blog.sina.com.cn/s/blog_48b0011f0102v6zc.html意思呢?
一個(gè)是看是否變形,如果是booking或者booked,那么這是動(dòng)詞的變形,所以必然取動(dòng)詞的解釋:預(yù)定。
二是看前后單詞的詞性,如果book的前面是adj.那么這里的book就是名詞。
三分析整個(gè)句子,看book是做謂語(yǔ)還是主語(yǔ)/賓語(yǔ),如果是謂語(yǔ)那就是動(dòng)詞,主語(yǔ)賓語(yǔ)就是名詞。
4.對(duì)于一詞多義,而且詞性還相同,那怎么取。
這個(gè)有難度,我程序沒(méi)辦法解決,把每個(gè)意義都列出來(lái),讓用戶根據(jù)上下文,自己選擇。比如I like this date.這里Date可以是日期的意思,可以是約會(huì)的意思,也可以是棗子的意思,從語(yǔ)法上講都是對(duì)的,只有根據(jù)上下文,讓用戶自己選擇。
5.原型和變形是兩個(gè)單詞,那么怎么決定采用原型還是變形。
比如comforting是令人欣慰的意思,adj.,但是如果查原型comfort,只有n.和v.所以不能將comforting轉(zhuǎn)換成原型再查下其意思,在作為形容詞的時(shí)候,必須保持這個(gè)形式。還是只有從詞性入手,如果是形容詞,那么后面應(yīng)該跟名詞,如果是動(dòng)詞ing形式,那么應(yīng)該是現(xiàn)在進(jìn)行時(shí)的語(yǔ)法形式。
總結(jié)
以上是生活随笔為你收集整理的看美剧英文字幕学英语的利器——“深蓝英文字幕助手”简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 某数字安全卫士的软件管家提取版
- 下一篇: CleanMyMac4.12.5最新版M