時(shí)間:25-04-06 17:07
大模型搜索優(yōu)化(RAG優(yōu)化)可通過(guò)以下策略提升檢索與生成效果,結(jié)合技術(shù)框架與實(shí)際案例總結(jié)如下:
一、檢索階段優(yōu)化
索引與嵌入優(yōu)化
動(dòng)態(tài)嵌入:使用如OpenAI的embeddings-ada-02等動(dòng)態(tài)嵌入模型,根據(jù)上下文調(diào)整詞義,提升語(yǔ)義匹配能力。
混合搜索:結(jié)合向量搜索與關(guān)鍵字搜索,例如通過(guò)互惠排序融合(Reciprocal Rank Fusion)合并結(jié)果,兼顧語(yǔ)義匹配與精確匹配。
索引輕量化:將傳統(tǒng)索引轉(zhuǎn)換為輕量級(jí)索引,降低存儲(chǔ)與檢索開(kāi)銷,如京東電商搜索的實(shí)踐。
查詢優(yōu)化
查詢擴(kuò)展:通過(guò)內(nèi)部擴(kuò)展(如偽文檔生成)或外部擴(kuò)展(如網(wǎng)絡(luò)數(shù)據(jù)引入)豐富查詢內(nèi)容。
查詢重寫:利用大語(yǔ)言模型(LLM)自動(dòng)改寫模糊查詢,例如將“電動(dòng)汽車優(yōu)缺點(diǎn)”改寫為“電動(dòng)汽車與內(nèi)燃機(jī)汽車優(yōu)缺點(diǎn)對(duì)比”。
多問(wèn)題查詢:基于原始問(wèn)題生成多個(gè)子問(wèn)題,分別檢索后合并結(jié)果,提升覆蓋面。
二、生成階段優(yōu)化
生成質(zhì)量提升
偏好優(yōu)化(DPO):通過(guò)偏好樣本校準(zhǔn)模型,使生成結(jié)果更符合用戶點(diǎn)擊偏好。
約束搜索(Constraint Beam Search):在推理階段實(shí)施約束,避免生成無(wú)效或不符合規(guī)范的片段。
知識(shí)融合:挖掘LLM蘊(yùn)含的世界知識(shí),增強(qiáng)推薦智能化與個(gè)性化,如京東通過(guò)大型語(yǔ)言模型助力冷啟動(dòng)與長(zhǎng)尾產(chǎn)品推廣。
結(jié)果重排序
大語(yǔ)言模型重排序:使用如GPT等模型對(duì)檢索結(jié)果進(jìn)行語(yǔ)義相關(guān)性評(píng)分,重新排序后返回最相關(guān)文檔。
交叉編碼器重排序:通過(guò)RoBERTa等模型計(jì)算查詢與文檔的相似度,提升排序準(zhǔn)確性。
三、架構(gòu)與流程優(yōu)化
模塊化RAG
引入查詢搜索引擎、融合多個(gè)回答等模塊,將檢索與微調(diào)、強(qiáng)化學(xué)習(xí)等技術(shù)融合,提升系統(tǒng)靈活性。
設(shè)計(jì)多種RAG模式,例如通過(guò)DSP框架將問(wèn)題分解為子問(wèn)題,依次解決后整合結(jié)果。
任務(wù)重定義
將復(fù)雜任務(wù)拆解為子任務(wù),例如京東提出的“Query2MultiSpan”策略,將標(biāo)題按品牌、功能等屬性模塊化,降低模型負(fù)擔(dān)。
通過(guò)Span拆解與排序,將標(biāo)題生成任務(wù)分解為生成多個(gè)短序列的子任務(wù),提升生成準(zhǔn)確性。
四、實(shí)際案例與效果
京東電商搜索優(yōu)化
挑戰(zhàn):商品庫(kù)規(guī)模龐大,傳統(tǒng)雙塔架構(gòu)在精確語(yǔ)義匹配和長(zhǎng)尾數(shù)據(jù)場(chǎng)景表現(xiàn)不佳。
解決方案:引入生成式檢索,結(jié)合Query2MultiSpan任務(wù)與偏好優(yōu)化(DPO),顯著提升商品標(biāo)題生成的準(zhǔn)確性和效率。
效果:在高頻與長(zhǎng)尾查詢間取得平衡,提升用戶搜索體驗(yàn)。
港大與華為的樹(shù)搜索優(yōu)化
方法:結(jié)合Beam Search、過(guò)程獎(jiǎng)勵(lì)模型(PRM)和成對(duì)偏好算法,提出BPP-Search算法。
效果:在StructuredOR等數(shù)據(jù)集上顯著優(yōu)于現(xiàn)有方法,提高解題速度并減少求解步驟。
五、評(píng)估與反饋
性能評(píng)估
使用準(zhǔn)確率、召回率、MRR等指標(biāo)衡量?jī)?yōu)化效果,例如通過(guò)A/B測(cè)試驗(yàn)證混合搜索、查詢翻譯和重排序方法的效果。
持續(xù)迭代優(yōu)化每一步推薦過(guò)程,集成GPT等先進(jìn)語(yǔ)言模型,深化特征抽取。
反饋機(jī)制
通過(guò)rerank、后退提示、self-rag等方法,基于原始結(jié)果進(jìn)行優(yōu)化,最大化準(zhǔn)確率。
例如,使用LLM生成假設(shè)答案(HyDE),將其與問(wèn)題一起進(jìn)行檢索,提升檢索相關(guān)性。
技術(shù)支持:企信網(wǎng) Copyright @ 2011-2023 東莞企信網(wǎng)絡(luò)公司 -東莞網(wǎng)站建設(shè)公司 版權(quán)所有 企信網(wǎng)絡(luò)主營(yíng)東莞網(wǎng)站建設(shè),企業(yè)網(wǎng)站模板,網(wǎng)頁(yè)設(shè)計(jì)與制作 粵ICP備2021042450號(hào) 電話:13326882788