原標(biāo)題:大模型從工具走向伙伴
從“養(yǎng)蝦”到“殺蝦”,一款名叫“龍蝦”的開源AI智能體OpenClaw近期持續(xù)成為社交平臺熱門話題。近年來,大模型驅(qū)動的智能體已成為人工智能開發(fā)機(jī)構(gòu)爭相布局的戰(zhàn)略高地。從最初的“能對話”,到如今“可動手操作”,不斷迭代的大模型將走向何方?
提升推理能力是關(guān)鍵
在相繼推出旗艦?zāi)P虶LM—4.5、GLM—4.6后,去年12月,北京智譜華章科技股份有限公司上線并推出新一代視覺推理模型GLM—4.6V,核心目標(biāo)之一是提升推理能力。
“讓AI像人類一樣綜合感知、理解與決策,多模態(tài)推理能力的突破很關(guān)鍵,這也是大模型向通用人工智能演進(jìn)的必由之路?!敝亲V聯(lián)合創(chuàng)始人、董事長劉德兵說。
無論是通用大模型還是行業(yè)大模型,推理能力是打造未來競爭力的關(guān)鍵指標(biāo),一定程度上決定了其應(yīng)用廣度和深度。
北京航空航天大學(xué)人工智能研究院副研究員胡堃解釋說,推理能力可理解為模型不僅知道“是什么”,還能判斷“為什么”和“如何做”,并在復(fù)雜邏輯或跨領(lǐng)域條件下給出合理答案。“如果將大模型作為助手,傳統(tǒng)大模型近似知識庫型助手,回答用戶提出的事實(shí)性問題;推理能力強(qiáng)的大模型更像策略型顧問,不僅能回答常規(guī)的經(jīng)驗(yàn)問題,還能分析利弊、推演后果并綜合多種因素給出具體建議”。
對科學(xué)基礎(chǔ)大模型來說,推理能力尤為重要。一方面,在數(shù)學(xué)、物理等領(lǐng)域,推理能力是解決定理證明和理論發(fā)現(xiàn)的關(guān)鍵基礎(chǔ);另一方面,面向各學(xué)科領(lǐng)域的復(fù)雜科研任務(wù),推理能力是任務(wù)理解和規(guī)劃決策的重要前提。
“磐石·科學(xué)基礎(chǔ)大模型一直堅(jiān)持和重視推理能力的學(xué)習(xí)與強(qiáng)化?!敝袊茖W(xué)院自動化研究所研究員張家俊介紹,如今磐石·科學(xué)基礎(chǔ)大模型將數(shù)字幻覺(大模型生成看似合理但實(shí)則虛構(gòu)或失真的信息)從30%降至11%,科學(xué)模態(tài)數(shù)據(jù)分析和理解能力全面提升。
“隨著應(yīng)用場景日趨復(fù)雜,用戶更需要大模型在不確定的條件下進(jìn)行綜合分析并作出合理判斷與決策。眼下,推理能力是大模型規(guī)?;瘧?yīng)用的競爭焦點(diǎn)?!焙鷪冶硎?。
智能體成重要形態(tài)
智能體是一個由“大模型+記憶系統(tǒng)+工具調(diào)用+規(guī)劃能力”構(gòu)成的智能系統(tǒng),已成為開發(fā)機(jī)構(gòu)發(fā)力重點(diǎn):磐石大模型新增創(chuàng)新評估科學(xué)智能體,為科研選題、技術(shù)方案等科研決策提供支持;??低晫I和大模型融入研發(fā)、生產(chǎn)決策全流程,打造了系列智能體;北航在智能無人機(jī)系統(tǒng)中引入智能體,使無人機(jī)自主完成復(fù)雜的飛行任務(wù)……
“當(dāng)前,深化與拓展大模型核心能力,業(yè)內(nèi)主要聚焦3個方面尋求突破。”胡堃介紹,一是進(jìn)一步提升多步推理和因果推理能力;二是持續(xù)創(chuàng)新高效訓(xùn)練與推理算法,通過優(yōu)化模型結(jié)構(gòu)、改進(jìn)訓(xùn)練策略等,顯著降低大模型對高昂算力的依賴,推動其向更廣泛的應(yīng)用場景普及;三是不斷增強(qiáng)大模型智能體化與自動化任務(wù)執(zhí)行能力,讓大模型能自主接收任務(wù)目標(biāo)、規(guī)劃執(zhí)行路徑、動態(tài)調(diào)整策略并完成連貫的復(fù)雜流程。
“智能體能力意味著大模型不僅能給出實(shí)際可行的方案,還可從被動的信息提供者轉(zhuǎn)變?yōu)橹鲃拥娜蝿?wù)執(zhí)行者。”胡堃說。
在生產(chǎn)端,面對每日上萬個訂單,海康威視的計(jì)劃智能體可快速下達(dá)生產(chǎn)計(jì)劃和物料需求計(jì)劃,實(shí)現(xiàn)訂單24小時快速響應(yīng);其工藝智能體可自動推薦最優(yōu)工藝,提升工藝設(shè)計(jì)效率。“大模型光有聰明的‘大腦’是不夠的,從感知認(rèn)知走向決策執(zhí)行,智能體正成為大模型產(chǎn)品落地的重要應(yīng)用形態(tài)?!睆埣铱≌f。
在科研和工業(yè)領(lǐng)域,智能體帶來的變革同樣深刻。例如,為改變材料研發(fā)“大海撈針”式的局面,中國科學(xué)院基于磐石大模型構(gòu)建的材料逆向設(shè)計(jì)系統(tǒng)智能體,已成功從2000萬種新型析氫反應(yīng)合金催化材料候選配方中,快速鎖定13種高性能材料,并將原本需耗時數(shù)月的材料設(shè)計(jì)周期縮短至30分鐘。
提供更好交互體驗(yàn)
“今天,用戶早已不滿足于簡單的文字對話或文本生成,下一代大模型不僅可以理解文本、圖像、視頻、聲音等多模態(tài)信息,還可理解現(xiàn)實(shí)世界的因果關(guān)系?!眲⒌卤f,當(dāng)它具備了多模態(tài)理解能力和因果推理能力,就可以感知環(huán)境變化并主動調(diào)整行為,為用戶提供更自然、直觀和沉浸式的交互體驗(yàn)。
劉德兵介紹,通用人工智能可分為L1預(yù)訓(xùn)練大模型、L2對齊與推理、L3自我學(xué)習(xí)、L4自我認(rèn)知、L5意識智能5個等級。未來3年到5年,大模型領(lǐng)域的突破將主要圍繞如何實(shí)現(xiàn)通用人工智能從L3自我學(xué)習(xí)向L4自我認(rèn)知推進(jìn)。最值得關(guān)注的是“沉思級”推理的實(shí)現(xiàn),即模型能夠自主分析復(fù)雜問題、生成優(yōu)化方案,并在決策中進(jìn)行自我批評和反思,而不再完全依賴人類輸入。
這需要堅(jiān)實(shí)的技術(shù)支撐。張家俊表示,除了當(dāng)前備受關(guān)注的推理能力、智能體外,大模型還在朝著多模態(tài)、后訓(xùn)練、通專融合(通用能力與專業(yè)能力融合)、代碼生成等技術(shù)方向演進(jìn)。
其中,多模態(tài)旨在讓模型從底層架構(gòu)上學(xué)會同時理解和生成文本、音頻、圖像、視頻以及其他模態(tài)信息;后訓(xùn)練旨在通過投入更多后訓(xùn)練資源,突破模型推理能力的上限;通專融合旨在充分利用超大模型的超強(qiáng)通用能力與領(lǐng)域模型的高效專業(yè)能力;代碼生成既可提升軟件研發(fā)等任務(wù)的效率,也是模型推理能力和智能體能力躍升的關(guān)鍵因素。
科技創(chuàng)新的落腳點(diǎn)是滿足人民對美好生活的向往。胡堃表示,要關(guān)注大模型的安全可解釋性、隱私保護(hù),以及社會接受度?!霸诓痪玫膶?,大模型將進(jìn)一步成為人類可靠的智能伙伴?!眲⒌卤f。