基于预生成 QA 对的 RAG 知识库解决方案
核心價(jià)值
- QA 預(yù)生成技術(shù)
采用創(chuàng)新的問(wèn)答對(duì)生成方法,相比傳統(tǒng)文本切片技術(shù),能夠更精準(zhǔn)的構(gòu)建知識(shí)庫(kù),顯著提升檢索與問(wèn)答效果。
- 企業(yè)級(jí)場(chǎng)景驗(yàn)證
已在真實(shí)業(yè)務(wù)場(chǎng)景中落地應(yīng)用,實(shí)現(xiàn)從傳統(tǒng)搜索到智能搜索的無(wú)縫升級(jí),用戶接受度與滿意度明顯提升。
- 開(kāi)源實(shí)踐支持
提供完整技術(shù)教程,并開(kāi)放源代碼,助力開(kāi)發(fā)者快速搭建易于落地的高質(zhì)量企業(yè)級(jí) AI 知識(shí)庫(kù)系統(tǒng)。
概述
GC-QA-RAG 是一款面向葡萄城產(chǎn)品生態(tài)(包括 活字格、WYN、SpreadJS 和 GCExcel 等)的檢索增強(qiáng)生成(RAG)系統(tǒng)。該系統(tǒng)通過(guò)智能文檔處理、高效知識(shí)檢索、精準(zhǔn)問(wèn)答等功能,有效提升了知識(shí)管理效率和用戶支持體驗(yàn)。
本系統(tǒng)創(chuàng)新性地采用了 QA 預(yù)生成技術(shù),克服了傳統(tǒng)文本切片方法在知識(shí)庫(kù)構(gòu)建中的若干局限性。經(jīng)過(guò)實(shí)踐驗(yàn)證,該技術(shù)方案能夠顯著提升檢索效果,可為 RAG 領(lǐng)域的技術(shù)實(shí)踐提供新的思路。
葡萄城秉持“賦能開(kāi)發(fā)者”的理念,現(xiàn)將 GC-QA-RAG 項(xiàng)目完整開(kāi)源:
Gitee地址:https://gitee.com/grape-city-ai/gc-qa-rag
Github地址:https://github.com/GrapeCity-AI/gc-qa-rag
對(duì)于初學(xué)者,我們提供了詳細(xì)的入門(mén)指南,幫助您快速掌握 QA-RAG 系統(tǒng)的構(gòu)建方法
對(duì)于面臨傳統(tǒng)架構(gòu)挑戰(zhàn)的開(kāi)發(fā)者,我們的架構(gòu)設(shè)計(jì)文檔可為您提供參考,助力現(xiàn)有知識(shí)庫(kù)的優(yōu)化升級(jí)
本項(xiàng)目也分享了葡萄城在 RAG 知識(shí)庫(kù)產(chǎn)品設(shè)計(jì)方面的實(shí)踐經(jīng)驗(yàn),希望能為相關(guān)領(lǐng)域的產(chǎn)品和技術(shù)探索提供有益參考。
葡萄城 AI 搜索地址:https://ai-assist.grapecity.com.cn/
項(xiàng)目背景
作為企業(yè)級(jí)解決方案提供商,葡萄城積累了大量的產(chǎn)品用戶。在日常使用中,用戶需要快速獲取準(zhǔn)確的產(chǎn)品信息,但現(xiàn)有幫助文檔和技術(shù)社區(qū)存在以下挑戰(zhàn):
內(nèi)容分散在多個(gè)平臺(tái)(約 4000 篇文檔、2000 個(gè)教程帖和 50000 個(gè)主題帖)
傳統(tǒng)關(guān)鍵詞搜索效果有限,難以滿足精準(zhǔn)查詢需求
基于 AI 大模型技術(shù),我們開(kāi)發(fā)了 GC-QA-RAG 系統(tǒng),旨在:
提供更智能、高效的產(chǎn)品問(wèn)題解答服務(wù)
優(yōu)化技術(shù)支持流程,提升服務(wù)效率
查看項(xiàng)目背景了解更多。
產(chǎn)品設(shè)計(jì)
GC-QA-RAG 采用"傳統(tǒng)搜索界面+智能問(wèn)答"的混合設(shè)計(jì)模式,旨在結(jié)合搜索引擎的高效性與 AI 的智能化能力。經(jīng)過(guò)對(duì)對(duì)話式 AI 助手的深入評(píng)估,我們發(fā)現(xiàn)傳統(tǒng)搜索界面更符合用戶對(duì)信息獲取效率的核心需求,同時(shí)通過(guò)智能回答區(qū)域提供 AI 增強(qiáng)的交互體驗(yàn)。
查看產(chǎn)品設(shè)計(jì)了解更多。
核心功能
- 雙頁(yè)面結(jié)構(gòu):簡(jiǎn)潔的 Home 頁(yè)聚焦搜索入口,Search 頁(yè)呈現(xiàn)智能回答與分類(lèi)搜索結(jié)果
- 智能問(wèn)答系統(tǒng):支持打字機(jī)效果的逐字輸出,提供追問(wèn)功能實(shí)現(xiàn)有限的多輪對(duì)話
- 優(yōu)化搜索結(jié)果:
-- 四類(lèi)選項(xiàng)卡分類(lèi)展示(全部/幫助文檔/求助中心/專(zhuān)題教程)
-- 預(yù)生成詳細(xì)答案支持"展開(kāi)更多"查看
-- 無(wú)分頁(yè)設(shè)計(jì)提升瀏覽效率 - 交互增強(qiáng):
-- 回答質(zhì)量反饋(有用/沒(méi)用)
-- 一鍵復(fù)制文本/圖像
-- 實(shí)時(shí)顯示各類(lèi)結(jié)果數(shù)量
用戶體驗(yàn)
產(chǎn)品通過(guò)清晰的界面層級(jí)和智能化的交互設(shè)計(jì),在保持搜索效率的同時(shí)提供 AI 增強(qiáng)功能。默認(rèn)的單次搜索模式確保響應(yīng)速度,追問(wèn)功能滿足深度探索需求,而可視化的上下文管理幫助用戶保持操作認(rèn)知。這種平衡設(shè)計(jì)使用戶既能快速獲取核心信息,又可按需展開(kāi)更深入的智能交互。
技術(shù)架構(gòu)
GC-QA-RAG 采用三層架構(gòu)設(shè)計(jì),確保系統(tǒng)清晰高效且可擴(kuò)展:
構(gòu)建層 - ETL
文檔解析:支持多種類(lèi)型文檔(產(chǎn)品說(shuō)明文檔,論壇帖子等)
QA 生成:基于文檔內(nèi)容自動(dòng)生成問(wèn)答對(duì)
向量化:將文本轉(zhuǎn)換為高維向量,支持語(yǔ)義檢索
索引構(gòu)建:建立高效的檢索索引與有效負(fù)載
檢索層 - Retrieval
問(wèn)題改寫(xiě):優(yōu)化用戶查詢,提高檢索準(zhǔn)確率
混合檢索:結(jié)合關(guān)鍵詞和語(yǔ)義檢索
RRF 排序:基于相關(guān)性排序算法優(yōu)化結(jié)果
結(jié)果融合:整合多源檢索結(jié)果
生成層 - Generation
問(wèn)答模式:對(duì)接文本大模型,直接回答用戶問(wèn)題
思考模式:對(duì)接推理大模型,先思考再回答
多輪對(duì)話:支持上下文相關(guān)的連續(xù)對(duì)話
答案優(yōu)化:確保回答的準(zhǔn)確性和可讀性
查看技術(shù)架構(gòu)了解更多。
技術(shù)挑戰(zhàn)
在構(gòu)建企業(yè)級(jí) RAG 知識(shí)庫(kù)系統(tǒng)的實(shí)踐中,我們面臨著知識(shí)表征方面的基礎(chǔ)性挑戰(zhàn)。這些挑戰(zhàn)主要源于知識(shí)本身固有的時(shí)空特性,這在當(dāng)前 AI 技術(shù)發(fā)展階段呈現(xiàn)出顯著的解決難度。
空間語(yǔ)義歧義問(wèn)題
問(wèn)題描述:
產(chǎn)品不同模塊中存在功能命名沖突現(xiàn)象。以活字格低代碼平臺(tái)為例,其文檔中會(huì)出現(xiàn)以下情況:
- 頁(yè)面模塊的"數(shù)據(jù)透視表"功能
- 報(bào)表模塊的"數(shù)據(jù)透視表"功能
- 表格報(bào)表模塊的"數(shù)據(jù)透視表"功能
- Excel 的"數(shù)據(jù)透視表"功能(大模型內(nèi)部知識(shí))
影響:
這種命名沖突不僅給技術(shù)支持人員帶來(lái)困擾,對(duì) AI 系統(tǒng)的語(yǔ)義理解也構(gòu)成了顯著挑戰(zhàn)。
時(shí)序版本管理問(wèn)題
問(wèn)題描述:
同一功能在不同版本中存在特性差異,典型表現(xiàn)為:
知識(shí)庫(kù)中收錄了某個(gè)功能的多個(gè)版本文檔
用戶可能仍在使用舊版本,僅需了解特定版本的功能特性
影響:
這種版本差異使得準(zhǔn)確匹配用戶實(shí)際環(huán)境中的功能特性變得復(fù)雜,增加了知識(shí)檢索的難度。
落地效果
GC-QA-RAG 系統(tǒng)在實(shí)際業(yè)務(wù)場(chǎng)景中取得了令人鼓舞的應(yīng)用成效,主要體現(xiàn)在以下幾個(gè)方面:
- 用戶接受度與粘性
系統(tǒng)上線后,用戶訪問(wèn)量呈現(xiàn)穩(wěn)步增長(zhǎng)并逐漸趨于穩(wěn)定,表明產(chǎn)品已經(jīng)形成了穩(wěn)定的用戶群體和使用習(xí)慣。用戶留存數(shù)據(jù)反映出較高的使用粘性,許多用戶已將系統(tǒng)作為日常求疑解答的工具。
- 持續(xù)的產(chǎn)品優(yōu)化
我們建立了完善的用戶反饋機(jī)制,定期收集來(lái)自終端用戶和技術(shù)支持團(tuán)隊(duì)的使用體驗(yàn)和改進(jìn)建議。這些寶貴的實(shí)踐反饋為系統(tǒng)迭代提供了明確方向,推動(dòng)產(chǎn)品功能持續(xù)完善。
- 用戶群體認(rèn)可度
系統(tǒng)獲得了用戶群體的高度評(píng)價(jià),其背后的技術(shù)創(chuàng)新思路也引起了專(zhuān)業(yè)開(kāi)發(fā)者用戶的廣泛關(guān)注。技術(shù)原理和實(shí)現(xiàn)方案成為客戶咨詢探討的熱點(diǎn),多個(gè)客戶與團(tuán)隊(duì)表示希望借鑒相關(guān)經(jīng)驗(yàn)。
- 業(yè)務(wù)價(jià)值體現(xiàn)
從實(shí)際使用效果來(lái)看,系統(tǒng)顯著提升了技術(shù)支持效率和用戶自助服務(wù)能力。知識(shí)獲取革新帶來(lái)可感知的流程優(yōu)化,用戶正向評(píng)價(jià)充分印證其成效。
這些成果不僅驗(yàn)證了產(chǎn)品和技術(shù)路線的可行性,也為后續(xù)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。同時(shí),我們相信 QA 預(yù)生成方案對(duì)文檔型知識(shí)庫(kù)具有普遍的參考價(jià)值。我們將繼續(xù)秉持開(kāi)放的態(tài)度,與用戶社區(qū)和專(zhuān)業(yè)開(kāi)發(fā)者攜手合作,共同推動(dòng)技術(shù)的不斷進(jìn)步。
查看落地效果了解更多。
總結(jié)
以上是生活随笔為你收集整理的基于预生成 QA 对的 RAG 知识库解决方案的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: codeup之特殊乘法
- 下一篇: Python 3.14 t-string