2019.07.31 科大讯飞语音生成+识别+朗读+文字识别
科大訊飛語(yǔ)音生成+識(shí)別+朗讀+文字識(shí)別
現(xiàn)在我看小說(shuō)用的是之前在知乎被安利的科大訊飛出品的“聽(tīng)書(shū)神器”,各大應(yīng)用商店都有下載。
內(nèi)嵌百度搜索,按瀏覽器正常搜索書(shū)名進(jìn)入網(wǎng)頁(yè)后,點(diǎn)擊右上角閱讀器即可進(jìn)入小說(shuō)類(lèi)APP常見(jiàn)的閱讀模式,功能與小說(shuō)類(lèi)APP閱讀功能相同,例如背景色號(hào)等,而且在閱讀時(shí)為了防止下次閱讀時(shí)丟失閱讀進(jìn)度可以點(diǎn)擊右上角隨時(shí)加入書(shū)架,這樣就相當(dāng)于在源網(wǎng)頁(yè)建立了書(shū)簽,下次在書(shū)架打開(kāi)時(shí)會(huì)回到停下的地方。
到這里其實(shí)原理和一些小說(shuō)源轉(zhuǎn)換APP類(lèi)似,但ta好歹是訊飛出品么,所謂“聽(tīng)書(shū)神器”最吸引人最好玩的當(dāng)然還是內(nèi)嵌的語(yǔ)音播放功能,而且支持訓(xùn)練自己的專(zhuān)屬聲音~(yú)~
正文:
今天老大出差了,閑著沒(méi)事做,就在碼云和GitHub找開(kāi)源的小程序?qū)W習(xí),突然有個(gè)語(yǔ)音識(shí)別類(lèi)的小程序映入眼簾,我就想到了上面說(shuō)的“聽(tīng)書(shū)神器”,我就想做一個(gè)小程序版的“聽(tīng)書(shū)神器”。不過(guò)他是用的JAVA,我的服務(wù)器沒(méi)有配好,就想找個(gè)用C#寫(xiě)的,找了很多也沒(méi)有。
查看訊飛文檔發(fā)現(xiàn)訊飛對(duì)C#并沒(méi)有demo,只有Java,Python以及C/C++版本的,討論區(qū)和csdn也很少用C#的,自己下了語(yǔ)音識(shí)別的JAVA版本,可以正常使用,但是我不會(huì)轉(zhuǎn)換C#。
我在訊飛討論區(qū)找到了一個(gè)18年的文字識(shí)別C#demo可以成功識(shí)別,而語(yǔ)音識(shí)別的因?yàn)橛嶏w接口由v1更新為了v2所以很多demo已經(jīng)失效了。
最后找了CSDN上一個(gè)人家集成好的,內(nèi)嵌了包括:由文字生成語(yǔ)音,由語(yǔ)音生成文字,錄音轉(zhuǎn)化為文字,三大功能以及語(yǔ)音播放,需要50積分我直接用tb下載的,(tb買(mǎi)CSDN下載要會(huì)選,若是像50積分這種就買(mǎi)那種不限積分按次數(shù)收費(fèi)的,若是5積分以?xún)?nèi)的就選按積分收費(fèi)的比較劃算,買(mǎi)那種買(mǎi)的人多的,最好是直接發(fā)下載鏈接或是直接發(fā)附件的)一開(kāi)始我以為錄音不好用,后來(lái)回酒店以后測(cè)試才發(fā)現(xiàn)錄音時(shí)最好是人聲且音量要足夠高發(fā)音要足夠清晰。
我明天的工作:
1.繼續(xù)學(xué)習(xí)源碼,
2.將他的.NET framework Client Profile重構(gòu)成新的.NET framework 4.6.1項(xiàng)目,
3.把功能集成到我的小程序里
總結(jié)
以上是生活随笔為你收集整理的2019.07.31 科大讯飞语音生成+识别+朗读+文字识别的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: vc显示html文档,VC++ 显示内存
- 下一篇: 爬取抽屉新热榜