大模型兩年:百度與它的“超級應(yīng)用”還有多遠(yuǎn)

2024-11-12 21:02:59 來源: 北京商報

  “應(yīng)用來了”,百度世界大會2024年的主題簡單明了,11月12日百度CEO李彥宏一上場也緊扣主題,“這代表了百度對當(dāng)前大模型和生成式人工智能時代的認(rèn)知和判斷”,并從智能體和產(chǎn)業(yè)應(yīng)用兩個方向“上新”:可以直播的角色類智能體、可以將照片變成動畫的工具類智能體等。

  大模型是新的革命還是新的泡沫?李彥宏認(rèn)為百度有資格回答這個問題,截至11月12日文心大模型日均調(diào)用量超15億,他也承認(rèn)眾所期待的AI超級應(yīng)用還沒有出現(xiàn)!癙C時代的應(yīng)用是軟件和網(wǎng)站,移動時代是App,大模型時代是智能體”,多次強(qiáng)調(diào)智能體還不夠,李彥宏當(dāng)天將智能體的重要性拔到新高度。

  基本解決幻覺問題

  “要想基于大模型開發(fā)應(yīng)用,消除幻覺是必須的”,李彥宏一針見血,“如果這個模型總是一本正經(jīng)的胡說八道,就不會有人信你,就不會有應(yīng)用”。

  其實,在大模型爆發(fā)的兩年里,幻覺現(xiàn)象在不同使用場景下的改善程度也不一樣。

  在李彥宏看來,“大模型是一個概率模型,生成的內(nèi)容具有不確定性。采用RAG(檢索增強(qiáng)生成)技術(shù)后,大模型會利用檢索到的信息來指導(dǎo)文本或答案的生成,提高內(nèi)容的質(zhì)量和準(zhǔn)確性。文字層面的RAG已經(jīng)做得很好了,但圖像等多模態(tài)內(nèi)容和RAG的結(jié)合還不夠”。

  他拿兩張?zhí)靿膱D片舉例,大模型生成的天壇是四層的,真正的天壇其實只有三層,這就是典型的文生圖幻覺現(xiàn)象;氐綉(yīng)用層面,這種幻覺現(xiàn)象目前仍然很普遍,“所以今天的多模態(tài)大模型,沒有什么成規(guī)模的應(yīng)用出來。就是幻覺沒有解決,至少沒有像文生文RAG解決得那么好”,李彥宏說。

  基于此,百度開發(fā)了iRAG技術(shù),即檢索增強(qiáng)的文生圖技術(shù)。該技術(shù)將百度搜索的圖片資源跟基礎(chǔ)模型能力相結(jié)合,可以生成各種超真實的圖片。

  百度CTO王海峰詳細(xì)介紹稱,“百度基于大模型對用戶的需求進(jìn)行分析理解,自動規(guī)劃精準(zhǔn)或泛化方案;接著在增強(qiáng)階段,對需要增強(qiáng)的實體,檢索并選擇相應(yīng)的參考圖;最后在生成階段,自研了多?煽厣鷪D大模型。在實際應(yīng)用中,這個方法也支持用戶上傳參考圖,應(yīng)用戶期望進(jìn)行生成”。

  一些立等可取的現(xiàn)貨

  不論是熱門新能源汽車還是大模型,技術(shù)、應(yīng)用、商業(yè)模式都是漸進(jìn)的過程。就像中歐AI與管理創(chuàng)新研究中心秘書長錢文穎說的,“人工智能目前處于早期階段,更多是以實驗室創(chuàng)新為主。隨著技術(shù)成熟,企業(yè)需要將這些橙黃新應(yīng)用到實際場景中,滿足實際需求,逐步實現(xiàn)商業(yè)化”。

  當(dāng)天,李彥宏就展示了iRAG的應(yīng)用場景:品牌宣傳!霸囅胍幌,如果給大眾汽車生成的海報,車型長得像豐田”,他開了個玩笑,“之前一組汽車海報拍攝需要一二十萬,甚至大幾十萬元,現(xiàn)在創(chuàng)作成本接近于0,iRAG的商業(yè)價值在于:無幻覺、超真實、沒成本、立等可取”。

  55分鐘的演講中,他提到兩次“立等可取”這個詞,第二次是談到“自由畫布”時,一個由百度文庫和百度網(wǎng)盤聯(lián)合開發(fā)的工具類智能體,核心功能體現(xiàn)在輸入、編輯、創(chuàng)作、分享環(huán)節(jié)。

  以創(chuàng)作為例,在劃好重點后,用戶框選全部需要的素材就能一鍵生成,根據(jù)現(xiàn)場分享的視頻,輸入一張兒童的照片,加上故事的背景等,自由畫布就可以生成一個漫畫。

  “自由畫布可以幫你完成從找資料、到編輯、再到生成和分享的全部任務(wù)。每個人都可以成為漫畫家、短視頻導(dǎo)演”,說到這兒,李彥宏的聲音明顯提高,“這不是期貨,是立即可用的現(xiàn)貨”。

  和自由畫布一樣零門檻的還有無代碼工具“秒噠”,一個多智能體協(xié)作工具。以設(shè)計一個蘿卜快跑新技術(shù)發(fā)布會的邀請函為例,包括海報生成、文案生成、嘉賓報名、地圖信息展示等,工作人員不需要懂代碼就可以完成,用李彥宏的話說,“你不需要去招募項目經(jīng)理、設(shè)計人員、開發(fā)人員、測試人員等,自己就可以指揮多個智能體來協(xié)同完成任務(wù)”。

  應(yīng)用的樣貌不一樣

  一個是智能體,一個是智能體協(xié)作工具,李彥宏看好的智能體在百度世界大會2024官宣前、預(yù)熱時、主論壇演講和展區(qū)都出現(xiàn)在C位。

  北京商報記者體驗了展區(qū)的農(nóng)民院士智能體!澳愫,我是農(nóng)民院士朱有勇的智能體,你可以通過向我提問,了解旱地優(yōu)質(zhì)稻的具體問題解答”,“院士”有問必答。截至北京商報記者發(fā)稿,這款智能體在文心智能體平臺上的瀏覽次數(shù)11.3萬次,幫助2.9萬人。整個文心智能體平臺上,已吸引15萬家企業(yè)和80萬名開發(fā)者參與。

  11月12日當(dāng)天,李彥宏大部分時間也在給智能體打call,他將百度的智能體分為四類:公司類智能體、角色類智能體、工具類智能體、行業(yè)類智能體。

  “智能體是AI應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點”,他再一次強(qiáng)調(diào),“未來公司官方智能體很可能替代官網(wǎng)”,并從PC時代追溯至今,“在人類信息技術(shù)變革的不同歷史時期,應(yīng)用出現(xiàn)的樣貌也不一樣:在PC時期,它是一個個的軟件和網(wǎng)站;在移動時期,它是一個個的App和可被關(guān)注的賬號;在AI時代,應(yīng)用主要的形態(tài)就是智能體”。

  應(yīng)用、智能體為什么屢次被提及?換一個角度或許更容易理解,“正常健康的生態(tài)應(yīng)用是:應(yīng)用創(chuàng)造的價值>云廠商>芯片GPU(圖形處理器)”,零一萬物創(chuàng)始人及CEO 李開復(fù)說。

關(guān)注同花順財經(jīng)(ths518),獲取更多機(jī)會

0

+1
  • 嶺南股份
  • 瑞斯康達(dá)
  • 匯洲智能
  • 露笑科技
  • 光迅科技
  • 國星光電
  • 瑞芯微
  • 友阿股份
  • 代碼|股票名稱 最新 漲跌幅