警惕 AI 知識(shí)庫炫技:看著美,用著累
-
2025-06-10
牛透社
AI 能改變傳統(tǒng)知識(shí)管理的困境嗎?
在「DeepTalk」的第二個(gè)系列話題欄目「AI 的爭(zhēng)議」對(duì)話中,崔牛會(huì)創(chuàng)始人 & CEO 崔強(qiáng)與藍(lán)凌副總裁劉向華,圍繞 “AI≈知識(shí)庫?為什么叫好不叫座?” 這一主題進(jìn)行了深入討論。
劉向華認(rèn)為,當(dāng)下中國的企業(yè)知識(shí)管理將因 AI 技術(shù)的發(fā)展而重新回?zé)帷T?AI 時(shí)代,構(gòu)建 “AI 友好型” 知識(shí)庫將有助于企業(yè)實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)價(jià)值的最大化。
但也不要為了追求 AI 技術(shù)去搞技術(shù),什么技術(shù)好用就用什么,不應(yīng)執(zhí)著于用大模型解決一切問題。

以下是經(jīng)牛透社編輯整理的對(duì)話內(nèi)容:(有刪減)
幻想與現(xiàn)實(shí)
崔強(qiáng):今晚我們討論的話題是 “AI≈知識(shí)庫?為什么叫好不叫座?”。第一個(gè)話題是 AI 知識(shí)庫的幻想與現(xiàn)實(shí)。為什么大家覺得 AI 知識(shí)庫應(yīng)該是殺手級(jí)的應(yīng)用呢?
劉向華:我覺得還是要把 AI 的概念縮小一下,這波 AI 的主題是大模型,大模型是適合用來處理文本型數(shù)據(jù)的,以前我們稱非結(jié)構(gòu)化數(shù)據(jù),比如文檔、音視頻等。
大模型最適合處理的數(shù)據(jù)類型正好在傳統(tǒng)知識(shí)庫領(lǐng)域,所以知識(shí)庫就變成第一個(gè)熱門場(chǎng)景了。ChatGPT 出來時(shí),我們已經(jīng)非常清醒地知道國內(nèi)的企業(yè)知識(shí)管理也將重新回?zé)帷?/strong>
崔強(qiáng):大模型來了之后,現(xiàn)在的企業(yè)知識(shí)庫應(yīng)用是一個(gè)什么狀態(tài)?
劉向華:藍(lán)凌主要還是面向大中型企業(yè),中小企業(yè)的知識(shí)庫我們涉獵得不是特別多(這方面的市場(chǎng)空間也相對(duì)小一點(diǎn))。
從大中型企業(yè)知識(shí)庫的建設(shè)角度來說,這波 AI 來了以后,絕大部分企業(yè)都會(huì)與大模型結(jié)合,主要場(chǎng)景有智能搜索、智能問答等。問答場(chǎng)景比搜索場(chǎng)景更加具體或碎片化,比如關(guān)于制度、客服、工單的問答等。
崔強(qiáng):現(xiàn)在我們可以看到一些 AI 知識(shí)庫的案例,真正落地的效果怎么樣?企業(yè)級(jí)知識(shí)庫和個(gè)人知識(shí)庫之間,除了權(quán)限之外還有什么明顯的差異?
劉向華:個(gè)人知識(shí)庫跟企業(yè)級(jí)知識(shí)庫差別非常大。首先企業(yè)級(jí)知識(shí)庫存在權(quán)限管理的問題,但更大、更深的區(qū)別在于知識(shí)體系的設(shè)計(jì),這個(gè)其實(shí)是個(gè)知識(shí)體系治理的問題。
一個(gè)公司的知識(shí)庫應(yīng)該分多少類?這些知識(shí)庫有哪些是可以共用的?最重要的知識(shí)是哪些?每一類知識(shí)庫的索引標(biāo)簽是什么……
而且從老板和 CIO 的全局視角看,不可能任由每個(gè)員工公有云、私有云到處搭自己的知識(shí)庫,因?yàn)槌酥R(shí)重復(fù)、標(biāo)準(zhǔn)知識(shí)的版本管理之外,還可能有一些涉密知識(shí)等。
另外,企業(yè)知識(shí)庫還面臨內(nèi)容一致性的問題,在企業(yè)中,不同版本的制度、SOP 等文檔可能既需要同時(shí)留存,還要讓 AI 能夠識(shí)別最新的版本避免誤導(dǎo),這些問題在個(gè)人知識(shí)庫里幾乎是不考慮的。
崔強(qiáng):如果站在企業(yè)級(jí)知識(shí)庫的角度,怎么看飛書剛推出的知識(shí)問答,能打幾分?
劉向華:還是偏向于個(gè)人或者小團(tuán)隊(duì)級(jí)別,缺少很多東西。企業(yè)級(jí)知識(shí)庫作為 ToB 產(chǎn)品,除了用戶態(tài)的易用性之外,還要保障管理態(tài)(符合組織管理要求),以及生長(zhǎng)態(tài)(可開發(fā)可擴(kuò)展)。
整體上看它的用戶態(tài)是 OK,但管理態(tài)和生長(zhǎng)態(tài)較弱,希望它能夠再成長(zhǎng)。做 ToB 需要很多 Know-how。
崔強(qiáng):大模型來了之后,藍(lán)凌的知識(shí)庫產(chǎn)品有了哪些變化?
劉向華:我們?cè)谧鲆粋€(gè)對(duì) AI 更友好的知識(shí)庫。AI 沒出來之前,我們大部分知識(shí)庫系統(tǒng)都是給人用,可能注重的是剛才說的用戶態(tài)、管理態(tài)、生長(zhǎng)態(tài),歸根到底是給人用。
有了 AI 以后,要考慮知識(shí)庫如何給 AI 用。
我們?cè)趯?shí)施 AI 項(xiàng)目時(shí)要考慮數(shù)據(jù)質(zhì)量(如何獲得更高質(zhì)量的知識(shí)),讓 AI 更好地理解,同時(shí)降低大模型幻覺,保證嚴(yán)謹(jǐn)性。此外,還要考慮很多技術(shù)和工具,比如知識(shí)體系梳理,知識(shí)圖譜建模、自動(dòng)入圖、多庫多文檔的切片策略等。
崔強(qiáng):傳統(tǒng)知識(shí)管理最大的問題是什么?是用戶不愿意用,還是用不起來?AI 來了會(huì)改變這一點(diǎn)嗎?
劉向華:肯定會(huì)。傳統(tǒng)知識(shí)管理,項(xiàng)目的成功實(shí)施都需要做管理和運(yùn)營(yíng)的配套,主要是因?yàn)?strong>傳統(tǒng)知識(shí)管理系統(tǒng)的易用性并不是那么好。
最近五年來,許多 ToB 軟件開始學(xué)習(xí) ToC 軟件的用戶交互,在易用性上提高了很多,但仍會(huì)出現(xiàn)員工不愿共享知識(shí)的問題。
如何讓員工主動(dòng)自愿貢獻(xiàn)知識(shí),公司要有制度或激勵(lì)措施,比如一些積分設(shè)計(jì)或流程約束等。
比如藍(lán)凌每實(shí)施一個(gè)項(xiàng)目,都會(huì)要求項(xiàng)目經(jīng)理寫復(fù)盤報(bào)告,要做 “知識(shí)收割”。但 “知識(shí)收割” 是要花時(shí)間和整理的,如果沒有公司的制度要求和配套管理就很難做,這也意味著系統(tǒng)推廣門檻的提升。
此外,還有文化。很多知識(shí)管理做得比較好的公司,它們的企業(yè)文化也是相對(duì)比較活躍的,員工愿意主動(dòng)貢獻(xiàn)和分享知識(shí)。
有了 AI 之后,可以幫員工提高效率,寫匯報(bào)材料更簡(jiǎn)單,這也會(huì)激發(fā)員工有更多動(dòng)機(jī)參與知識(shí)庫建設(shè)。
大模型幻覺
崔強(qiáng):你怎么看待大模型和知識(shí)嚴(yán)謹(jǐn)性的沖突?
劉向華:我把 AI 在企業(yè)內(nèi)的應(yīng)用拆分成兩類:一類是與文字理解和生成相關(guān)的,這一類追求 100% 準(zhǔn)確度是很難的,接近 OK 就可以了,所謂文無第一嘛;第二類是與現(xiàn)在的智能體強(qiáng)相關(guān)的。
智能體背后是大模型賦能的工作流,沒有大模型之前,它是基于規(guī)則流轉(zhuǎn),而規(guī)則是符號(hào)或者確定性的東西,所以,流程自動(dòng)化可以追求 100% 的準(zhǔn)確。加了大模型以后有可能做 100% 的準(zhǔn)確,這要看規(guī)則和大模型能力的互相滲透了。
目前很多智能體開發(fā)平臺(tái)、編排平臺(tái),仍在走自動(dòng)化的方向,追求 100% 的準(zhǔn)確,是因?yàn)槠髽I(yè)級(jí)應(yīng)用如果做不到足夠嚴(yán)謹(jǐn),就可能出事故。
崔強(qiáng):如何看待大模型 “投毒” 的問題?在企業(yè)級(jí)知識(shí)庫中,如何判斷 AI 的輸出是可靠的?
劉向華:大模型和人類都是有幻覺的。首先,不能完全杜絕大模型幻覺,要清晰每個(gè)技術(shù)的邊界。其次,才是追求如何減少幻覺。此外,還要注意數(shù)據(jù)(知識(shí))質(zhì)量,這包含了剛才所說的內(nèi)容一致性、知識(shí)體系搭建等問題。
原則上,如果你要找的東西就在一篇文檔內(nèi),而且知識(shí)庫里只有一篇文章,大概率不會(huì)有太大幻覺。要找的東西越少,或者給它的語料越小,大模型的回答就越準(zhǔn)確。如果企業(yè)的知識(shí)庫中有幾十萬、上百萬文檔,在治理上就要下很大功夫。
所以,第一是數(shù)據(jù)治理問題;第二是大部分企業(yè)級(jí)知識(shí)庫都采用 RAG 去匹配大模型,因?yàn)闊o法把企業(yè)的知識(shí)庫通過預(yù)訓(xùn)練的方式給到大模型,RAG 的本質(zhì)是做切片和向量化,向量化策略也可以影響到模型輸出的幻覺。
如果只做向量檢索,當(dāng)涉及多個(gè)文檔時(shí)就會(huì)造成上下文丟失,藍(lán)凌的解決方案是混合檢索,把知識(shí)圖譜、數(shù)據(jù)庫檢索等多種檢索手段合在一起,以此來減少幻覺生成。
所以,克服大模型幻覺的方法,一是要把知識(shí)治理做得更好。二是通過一些輔助算法,不能單靠大模型或者 RAG 算法。
崔強(qiáng):專家體系的價(jià)值還有多少?AI 未來能不能變成專家,自主地輸出知識(shí),能否信任它?
劉向華:最終一定會(huì),但無法預(yù)測(cè)需要多長(zhǎng)時(shí)間。目前專家仍是不可或缺的,特別是在知識(shí)經(jīng)驗(yàn)萃取角度。
隨著 AI 越來越聰明,它在不斷消化專家的思維模式時(shí),可能在文件處理、文檔理解等某些方面替代或超越專家,但專家在某個(gè)領(lǐng)域的業(yè)務(wù) Know-how 仍是無法被 AI 替代的。
此外,在很多大企業(yè),尤其是一些知識(shí)密集型企業(yè),要考慮知識(shí)體系的頂層設(shè)計(jì)和規(guī)劃,這方面還不可能全部依賴 AI,還要靠專家。
崔強(qiáng):對(duì)結(jié)果準(zhǔn)確度要求不是那么高的領(lǐng)域,比如營(yíng)銷、客服等場(chǎng)景,AI 可能發(fā)展得比較快。在知識(shí)庫領(lǐng)域,哪些場(chǎng)景是可以模糊的,哪些場(chǎng)景是必須要求精準(zhǔn)的?
劉向華:偏 Copilot(輔助類)的,比如輔助生成、輔助搜索、輔助問答等,不需要 100% 準(zhǔn)確,或者不需要太精準(zhǔn),文無第一;偏自動(dòng)化執(zhí)行的,是必須精準(zhǔn)的,武無第二。
大模型帶來兩類主要能力,一類是語言理解能力,一類是思考或執(zhí)行能力(分配工作的能力)。語言理解和生成這部分能力是免不了有幻覺的,不應(yīng)苛求絕對(duì)精確。工作流程自動(dòng)化,執(zhí)行類的能力是可以要求比較精準(zhǔn)的,主要方法是植入規(guī)則,或者知識(shí)圖譜等。
所以,輔助類的能力可以不苛求準(zhǔn)確,但自動(dòng)化的部分一定要嚴(yán)謹(jǐn)、準(zhǔn)確。
崔強(qiáng):現(xiàn)在看原來一部分 RPA 廠商就轉(zhuǎn)得比較快,轉(zhuǎn)到了數(shù)字員工,RPA+Agent 可能會(huì)更靠譜一些。你怎么判斷這兩者的結(jié)合?
劉向華:實(shí)際上,傳統(tǒng) RPA 廠商是被 AI 變革或者被顛覆的那一波。
以前的 RPA 技術(shù),更多是通過編程方式去模擬手工電腦上的操作。現(xiàn)在凡是模擬人的視覺和點(diǎn)擊操作的這部分能力,恰恰是大模型所擅長(zhǎng)的。
所以 RPA 廠商是一定要自我革命的,不是拿大模型去補(bǔ)充它,而是要盡快換代。
AI 知識(shí)庫的新變化
崔強(qiáng):原來做系統(tǒng)是給人用,現(xiàn)在做系統(tǒng)是給 AI 用,也就是要讓 AI 能看得懂。在 AI 時(shí)代,知識(shí)庫產(chǎn)品的形態(tài)會(huì)發(fā)生什么變化嗎?
劉向華:大模型時(shí)代的組織級(jí)知識(shí)庫,或者知識(shí)體系,有兩個(gè)比較大的變化:一是用戶的使用態(tài)或者交互方式的變化,即不一定到知識(shí)庫檢索或查詢,可能是通過問答或個(gè)人助理的方式完成交互。
從組織態(tài)上,會(huì)存在體系梳理和整體質(zhì)量?jī)?yōu)化的變化。這里我拆了兩塊東西,第一塊要有知識(shí)庫體系規(guī)劃的設(shè)計(jì),可以借助大模型輔助做更好的體系設(shè)計(jì);第二塊要解決知識(shí)碎片化的問題。一旦知識(shí)庫做好以后,我們可以把知識(shí)庫當(dāng)作一種服務(wù)嵌入每個(gè)作業(yè)場(chǎng)景。
從使用態(tài)來講,以前的知識(shí)庫是只給人用,現(xiàn)在的知識(shí)庫是給算法用。算法根據(jù)用戶當(dāng)前所在的場(chǎng)景和用戶意圖能夠主動(dòng)推送相關(guān)知識(shí),這是 AI 知識(shí)庫的一個(gè)發(fā)展方向。
知識(shí)庫還要提供 API 給 AI 用。不只是存儲(chǔ),還要輸出服務(wù)。
崔強(qiáng):Agent 有點(diǎn)像當(dāng)年的 SaaS。剛開始大家都是在單點(diǎn)突破形成一個(gè)小閉環(huán)。未來這些單點(diǎn)是不是又要整合在一起變成一個(gè)相對(duì) “All in one” 的東西?
劉向華:這波 AI 跟以往 PC 互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)相比至少要高出一個(gè)量級(jí),它是工業(yè)革命級(jí)別的,這是不同的地方。
相同的地方是當(dāng) AI 或者移動(dòng)端出來時(shí),所有的產(chǎn)品形態(tài)或者商業(yè)模式都是不清晰的,所以就百花齊放、百家爭(zhēng)鳴了。
越是單點(diǎn)場(chǎng)景,場(chǎng)景越細(xì)碎,AI 的結(jié)果就越精準(zhǔn)。所以,現(xiàn)階段一定是碎片化的場(chǎng)景,用碎片化的技術(shù),再加上一些碎片化的數(shù)據(jù)(知識(shí)點(diǎn)、知識(shí)庫)支撐,形成產(chǎn)品場(chǎng)景的閉環(huán)。
這一點(diǎn)很像 2014 年前后我們做 SaaS ,當(dāng)時(shí)主流大都是單點(diǎn) SaaS 追求小而美,當(dāng)技術(shù)發(fā)展到相對(duì)成熟的時(shí)間段,大家又開始考慮整體效率的問題,解決局部最優(yōu)但全局無法最優(yōu)的問題。
此外,很多企業(yè)都在追求超級(jí)入口,所以我認(rèn)為,三五年后,大一統(tǒng)仍將是一個(gè)趨勢(shì)。
崔強(qiáng):企業(yè)級(jí)會(huì)有入口嗎?企業(yè)級(jí)入口大概是什么樣子?原來說協(xié)同是入口,在 AI 時(shí)代這點(diǎn)會(huì)變化嗎?
劉向華:從乙方來看,大部分廠商都想追求入口;從甲方看,企業(yè)也希望有一個(gè)統(tǒng)一入口。
AI 時(shí)代這兩塊的入口可能是一致的,每個(gè)人只要有一個(gè)隨身超級(jí)助理,既負(fù)責(zé)記錄用戶行為,又負(fù)責(zé)傳遞公司知識(shí),但現(xiàn)在還沒有到成熟的程度,也許要等三五年之后。
崔強(qiáng):現(xiàn)在 Agent 產(chǎn)品和原有的產(chǎn)品,在使用體驗(yàn)和交互邏輯上幾乎完全不同。你們?cè)趯?shí)踐中的感受是怎么樣的,用戶的使用習(xí)慣會(huì)產(chǎn)生哪些改變?
劉向華:現(xiàn)在很多企業(yè)用戶還不是特別習(xí)慣用語言對(duì)話的交互方式。我們碰到的大部分客戶還是習(xí)慣 GUI(圖形用戶界面)的交互方式,但也不排斥多一個(gè) AI 助手的幫助。
崔強(qiáng):是一個(gè)加分項(xiàng)?
劉向華:是的。我們不能忘記語言交互的呈現(xiàn)豐富度是遠(yuǎn)遠(yuǎn)弱于圖形交互的。所以,不要為了追求技術(shù)去搞技術(shù)。
崔強(qiáng):通用大模型的投入很高。在一些小的領(lǐng)域里邊,可能需要一些專業(yè)化的小模型。如何看待這兩者的關(guān)系,在實(shí)際應(yīng)用中兩者如何配合或者互補(bǔ)?
劉向華:我們現(xiàn)在的判斷是互補(bǔ)關(guān)系。以藍(lán)凌的藍(lán)博士 AI 中臺(tái)為例,我們集成了若干個(gè)通用大模型,因?yàn)椴煌耐ㄓ么竽P退瞄L(zhǎng)的領(lǐng)域也不同。此外,還會(huì)有許多小模型(更準(zhǔn)確的稱呼是小型工具,如 OCR 識(shí)別等),它們可以做一部分自動(dòng)識(shí)別、自動(dòng)化操作等偏智能的工作。
未來它們一定是大模型的補(bǔ)充,幫助大模型完成一個(gè)自動(dòng)化的作業(yè)流程。什么東西好用就用什么,不應(yīng)該試圖用大模型來解決一切問題。
崔強(qiáng):企業(yè)有那么多知識(shí),有沒有機(jī)會(huì)形成企業(yè)的私有知識(shí)大模型?
劉向華:目前,由于預(yù)訓(xùn)練成本很高,可能只有少數(shù)企業(yè)具備這樣的可能性。從科學(xué)角度說,如果一個(gè)大模型內(nèi)放了全世界的知識(shí),再把一個(gè)企業(yè)內(nèi)的知識(shí) “摻和” 進(jìn)去,就像一滴水放進(jìn)大海,是沒有什么意義的,不可能指望一滴水能改變大海的咸度。
所以用企業(yè)知識(shí)去訓(xùn)練大模型,可能本身就是一個(gè)偽命題,沒有搞清楚大模型的原理,更可行的方式是去做通用大模型的輔助小模型,或者小的數(shù)據(jù)集、知識(shí)集,幫助大模型來降低幻覺。
崔強(qiáng):多模態(tài)、情景感知、角色扮演等新特征在知識(shí)管理中會(huì)出現(xiàn)嗎?
劉向華:這是個(gè)好問題,一定會(huì)出現(xiàn)。AI 如果最終能產(chǎn)生 10 倍價(jià)值,一定是干了某些替代人的事情。
如果 AI 能替代人做事情,那一定具備了情景感知的能力,只要感知得到,自動(dòng)化就很容易做,新的環(huán)境感知設(shè)備或者技術(shù)一定能夠催生很多大模型應(yīng)用。
角色扮演是純虛擬的形式,其實(shí)更容易做。
崔強(qiáng):未來 3~5 年,整個(gè)知識(shí)管理或者 AI 知識(shí)庫會(huì)發(fā)展到一個(gè)什么階段?
劉向華:我個(gè)人是偏樂觀的,它會(huì)變成企業(yè)數(shù)字化的一個(gè)必需品。以前,如果沒有知識(shí)庫,企業(yè)有網(wǎng)盤也可以,但現(xiàn)在不行了,必須對(duì) AI 友好。
大部分企業(yè)的數(shù)據(jù)資產(chǎn),只有 20% 左右是存在數(shù)據(jù)庫里的,剩下 80% 是以會(huì)議紀(jì)要、設(shè)計(jì)稿等以文件形式存放的,它們都是極好的 AI 養(yǎng)料。
對(duì)于大部分企業(yè)來說,我認(rèn)為建設(shè)一個(gè)對(duì) AI 友好的知識(shí)庫,是一個(gè)十分劃得來而且必需的事情,有利于最大化地挖掘企業(yè)數(shù)據(jù)資產(chǎn),AI 知識(shí)庫的未來是比較樂觀的。
-
本文作者:牛透社
本文來源:牛透社
-
分享到: