夸克技术负责人蒋冠军:夸克大模型已将问答内容幻觉率降低至5%
11月23日消息,昨日夸克大模型公布了其面向搜索、生產力工具和資產管理助手的大模型技術布局。據介紹,夸克大模型接連登頂C-Eval和CMMLU兩大評測榜單,多項性能優于GPT-4。在醫療健康領域,夸克大模型已經可以將問答內容的幻覺率降低至5%。
夸克技術負責人蔣冠軍表示,夸克大模型是面向搜索、生產力工具和資產管理助手的應用型大模型。在搜索應用中,將通過圖文多模理解、專業知識生成、交互方式創新進一步拓寬應用場景,提升用戶體驗。
夸克大模型的優勢源自于智能技術實力與搜索業務基礎,蔣冠軍認為,夸克大模型有四大優勢:第一、最全面的通用知識數據和行業知識數據,以及知識理解和評估體系;第二、得益于搜索技術體系的積累,擁有千億級參數平臺的模型訓練能力;第三、擁有長期智能化產品經驗的智能技術產運團隊。第四、擁有全行業的知識增強技術體系及能力。
蔣冠軍向網易科技等媒體表示,夸克數據非常全面,幾乎覆蓋了所有中文范疇的知識,并且覆蓋千行百業。“搜索引擎本身就是海量的網頁數據,我們的數據庫里有千億級網頁。這意味著需要有一個非常好的離線系統或工程系統,去處理大規模的網頁數據,去做對齊、去重、分析等工作。這個能力本身跟大模型所需要的能力非常匹配,因為大模型就是要大算力,傳統搜索引擎就具備大算力。”
他提到,夸克去做大模型,在團隊人才儲備上也具備優勢。“我們在通用搜索里,有網頁搜索、圖片搜索、視頻搜索、文檔搜索等等,支持這些搜索功能的技術體系和技術同學,就是大模型需要用到的多模技術能力和人才體系。所以說技術團隊在這方面的積淀,相對來說是比較深厚的。”
面向未來,要解決大模型的應用問題,關鍵要解決知識正確性問題。據悉,基于搜索產品和智能技術積累,夸克大模型在知識增強上的優勢可以大幅提升知識正確性。同時,在醫療健康領域,夸克已經可以將問答內容的幻覺率降低至5%。夸克大模型也將是持續推動夸克App產品體驗創新和邁向新一代搜索的技術底座。
日前,阿里巴巴智能信息事業群發布全棧自研、千億級參數的夸克大模型,將應用于通用搜索、醫療健康、教育學習、職場辦公等眾多場景。夸克大模型的整體水平超越GPT-3.5,在多語言翻譯、寫代碼、安全合規、內容創作等方面處在國內行業頭部水平。
另外,在最新的百億參數測試集中,夸克同樣在法律、醫療、問答等多個領域中排名第一,夸克大模型在不同參數量級的對比中均表現優秀。
在大模型技術落地層面,夸克大模型的能力體現在四個方面,可以幫助用戶提升工作、學習效率。知識能力,擁有廣泛的知識覆蓋、信息搜集和多語言支持等,支持外接專業知識增強,提升跨領域的知識和語言理解能力;對話能力,具備較強的上下文理解、語境推理、關鍵信息保持和記憶能力,更好地適應不斷變化的語境,理解用戶的意圖和需求,確保對話回復準確、合理、連貫;創作能力,能夠根據主題或關鍵詞,生成連貫、有邏輯、有深度的文本內容,支持續寫、潤色、仿寫、批改等多種不同寫作需求;安全能力,具備較好的世界觀、價值觀,對于明顯的虛假信息,均能做到準確識別、正確回答或者給出合理指引。
據悉,夸克大模型將全面升級夸克在搜、用、存上的智能化體驗,幫助用戶進一步提升效率。同時,基于多年累積的搜索優勢,夸克將借助AI驅動推進搜索革新,加速邁向下一代搜索。(一橙)
總結
以上是生活随笔為你收集整理的夸克技术负责人蒋冠军:夸克大模型已将问答内容幻觉率降低至5%的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: leetcode738. 单调递增的数字
- 下一篇: leetcode714.买卖股票的