星火V3.0亮相,超越GPT-3.5,七大能力全面升级
24日至29日,第六屆世界聲博會暨2023科大訊飛全球1024開發者節在安徽合肥舉辦。本屆活動繼續以“解放生產力,釋放想象力”為主題,舉辦主論壇、AI開發者大賽、科博展、17場行業論壇、16場城市峰會等系列活動,還有來自278個城市的超3.4萬支開發者團隊角逐2023屆AI開發者大賽十佳團隊。
在今天的開幕式主論壇上,科大訊飛正式發布“訊飛星火”認知大模型V3.0,七大維度能力全面提升,大模型代碼能力迭代升級。據科大訊飛董事長劉慶峰介紹,星火V3.0已經超越了去年底的GPT-3.5。
對此次的超越,劉慶峰解釋稱,根據《通用認知智能大模型評測體系》構建測試集,在10月16日至20日的測試中,星火V3.0的中文能力客觀測評超越GPT-3.5;而根據OpenAI在官網發布的英文任務測試集,在同樣時間段進行的測試中,星火V3.0的英文能力對標GPT-3.5的48項任務結果相當,二者得分分別為星火V3.0的85.1%和GPT-3.5的84.3%。
而根據今天現場的演示,星火V3.0相比八月時的表現,在文本生成、邏輯推理、代碼能力等七個方面的能力都有3%到9%不等的提升。不過劉慶峰同時也表示,和GPT-4相比,科大訊飛“還有一個學習的過程”。
值得注意的是,劉慶峰現場展示的一份由國務院發展研究中心國研經濟研究院的橫評報告顯示,目前星火V3.0的綜合能力已經在國內屬于領先,在教育、醫療、法律等行業的表現格外突出。不過劉慶峰也表示,國產大模型必須正視和GPT-4的差距?!皣a大模型在復雜知識推理、小樣本快速學習、超長文本處理、跨模態統一理解上和GPT-4相比還有差距?!?/p>
星火V3.0經過升級后,擁有了啟發式對話、AI人設等新功能,AI助手的個性化程度更上一層樓,星火V3.0的背后是科大訊飛自主創新的算力底座。與星火V3.0同步亮相的,還有科大訊飛聯合華為合作的新成果,基于昇騰生態的“飛星一號”大模型算力平臺。
“大模型正在走進我們每個人的生活?!?/strong>劉慶峰表示,在今年亞運會上,工作人員借助訊飛星火與中國移動開發的5G新通話助手,剛掛完電話待辦事項就已自動生成;在星火iFlyCode的幫助下,原本需要三個月的平臺遷移開發工作一個月就能完成;訊飛星火還與國家自然博物館合作,讓300萬年前的黃河象“復活”,還能與人對話。
而在關鍵性的落地應用方面,科大訊飛聯合不同的行業龍頭共同發布12個行業大模型,包含金融、汽車、運營、工業、住建、物業、法律等眾多行業,加速產業升級。在如此蓬勃發展,欣欣向榮的生態背后,同樣離不開自主創新的算力底座,訊飛和華為“聯合特戰隊”已經在半年內實現星火大模型訓練和推理效率均翻番。
此外,科大訊飛還發布了AI心理伙伴產品,可用于陪伴孩子成長;科技文獻大模型,為科研工作者提供助力;還有星火醫療大模型,以及在此加持下的“訊飛曉醫”APP及小程序。據介紹,星火醫療大模型已通過信通院和國家衛健委組織的標準規范評測。劉慶峰表示,星火醫療大模型在醫療海量知識問答、醫療復雜語言理解、醫療專業文本生成、醫療診斷治療推薦的問題解答率等方面甚至比GPT-4更高效。
“訊飛星火正日益成為解放生產力工具,大模型時代的大幕才剛剛揭開,讓我們一起共創、共享、共進化。”劉慶峰表示,當前訊飛星火已有1200萬用戶,為千萬用戶持續創造剛需場景價值。唯有實事求是的科學精神,才能真正實現超越。對標GPT-4的更大參數規模的星火大模型正式啟動訓練,2024年上半年將實現對標GPT-4。
總結
以上是生活随笔為你收集整理的星火V3.0亮相,超越GPT-3.5,七大能力全面升级的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 滴滴注册了就8年报废吗
- 下一篇: 评估比特币ETF市场规模:推出后第三年将