阿里达摩院发布古籍数字化平台 AI识别古籍准确率97.5%
生活随笔
收集整理的這篇文章主要介紹了
阿里达摩院发布古籍数字化平台 AI识别古籍准确率97.5%
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
5月18日,“漢典重光”海外古籍數字化回歸發布會在中國科技館舉行。“漢典重光”項目由阿里巴巴公益基金會、四川大學、美國加州大學伯克利分校、中國國家圖書館、浙江圖書館合作開展,旨在尋覓流散海外的中國古籍并將其數字化、公共化。
據介紹,借助阿里達摩院的技術,首批20萬頁古籍已完成數字化,并沉淀為覆蓋3萬多字的古籍字典,公眾可通過漢典重光平臺翻閱、檢索古籍。據悉,達摩院AI對20萬頁古籍的識別準確率達到97.5%。
據悉,伯克利提供古籍的掃描圖片和編目數據,達摩院將其全部文字化。此外,達摩院技術團隊還與四川大學專家聯手研發了一套全新的古籍識別系統。利用單字檢測、無監督單字聚類、小樣本學習、主動學習等機器學習方法,構造了一套邊識別古籍、邊訓練模型的系統。
文瀾閣版《宋百家詩存》(卷七)
阿里巴巴達摩院院長張建鋒表示,守護中華傳世典籍,是科技工作者和文化工作者共同的使命。阿里計劃將這套技術工具連同古籍數字化平臺一并捐贈,交由權威公共機構長期運營。
總結
以上是生活随笔為你收集整理的阿里达摩院发布古籍数字化平台 AI识别古籍准确率97.5%的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 联想再获自动驾驶相关专利:有乘客启动保护
- 下一篇: 爱奇艺一季度总营收80亿元,订阅会员规模