| 隨著技術(shù)的進(jìn)步,AI已不再局限于理解我們說(shuō)的話(huà),而是能夠獨(dú)立完成復(fù)雜的任務(wù)。2025年3月,中國(guó)AI公司Monica發(fā)布了名為Manus的通用智能體。這款號(hào)稱(chēng)“全球首款通用AI代理”的產(chǎn)品,憑借其在“思考”與“行動(dòng)”方面的能力,迅速引起了廣泛關(guān)注。 在一段4分47秒的演示視頻中,Manus展示了其較高的自主性:當(dāng)用戶(hù)上傳一個(gè)包含15份簡(jiǎn)歷的壓縮包時(shí),它不僅能自動(dòng)解壓,還能逐頁(yè)分析,提取關(guān)鍵信息,最終生成候選人的排名和評(píng)估表。當(dāng)面對(duì)“紐約購(gòu)房”這一需求時(shí),它會(huì)把任務(wù)分解、編寫(xiě)Python腳本來(lái)計(jì)算預(yù)算,整合社區(qū)的安全和教育資源數(shù)據(jù),輸出一份堪比專(zhuān)業(yè)房產(chǎn)經(jīng)紀(jì)的詳細(xì)報(bào)告。甚至在金融分析方面,它也能調(diào)取工具,分析股票趨勢(shì),并用可視化圖表清晰地解釋因果關(guān)系。 Manus的名字源自拉丁語(yǔ)“Mens et Manus”(心智與手),它的設(shè)計(jì)哲學(xué)強(qiáng)調(diào),知識(shí)不僅要存在大腦中,更應(yīng)轉(zhuǎn)化為實(shí)際行動(dòng)。Manus的定位遠(yuǎn)超傳統(tǒng)的聊天機(jī)器人或任務(wù)助手,它的核心能力是從目標(biāo)設(shè)定到成果交付的全方位自主執(zhí)行。正如網(wǎng)友所言:“ChatGPT是‘紙上談兵’的軍師,Manus則是‘披甲上陣’的將軍。” Manus的獨(dú)特之處,不僅在于它能夠理解語(yǔ)言、分析數(shù)據(jù),更在于它能像人類(lèi)一樣,實(shí)際操作、解決現(xiàn)實(shí)問(wèn)題。這種能力突破了傳統(tǒng)大語(yǔ)言模型(Large Language Model,簡(jiǎn)稱(chēng)LLM)僅限于文字生成的桎梏,展示了“大行為模型”(Large Action Model,簡(jiǎn)稱(chēng)LAM)所蘊(yùn)藏的潛力。此前,谷歌的Project Astra、微軟的Copilot Studio均已布局智能體生態(tài)。Manus和這些前沿產(chǎn)品一起,被認(rèn)為是“AI智能體商業(yè)化”進(jìn)程中的重要節(jié)點(diǎn)。 大語(yǔ)言模型 VS 大行為模型:從“思維鏈”到“行動(dòng)鏈”的技術(shù)躍遷 要理解LAM的核心價(jià)值,我們可以先從LLM談起。像ChatGPT、Deepseek這樣的大模型,通過(guò)海量文本數(shù)據(jù)訓(xùn)練,擁有強(qiáng)大的語(yǔ)言處理能力。它們能寫(xiě)詩(shī)、解題、生成商業(yè)計(jì)劃書(shū),甚至模擬心理咨詢(xún)。但當(dāng)任務(wù)從“回答如何預(yù)訂機(jī)票”升級(jí)為“實(shí)際完成機(jī)票預(yù)訂”時(shí),LLM便顯得力不從心。它更像一個(gè)“戰(zhàn)略顧問(wèn)”,擅長(zhǎng)提供建議,卻無(wú)法“擼起袖子”親自操作購(gòu)票系統(tǒng)。LLM的局限性在于,它更多扮演的是一個(gè)“思維者”,而非“行動(dòng)者”。 于是,大行為模型應(yīng)運(yùn)而生。LAM不僅僅停留在語(yǔ)言生成和知識(shí)提煉上,更具備了通過(guò)計(jì)算、協(xié)調(diào)和實(shí)時(shí)行動(dòng)的能力。它能思考問(wèn)題,但更重要的是,它能夠行動(dòng)、調(diào)整方案并付諸實(shí)踐。以Manus展示的“我要在紐約買(mǎi)房”為例,LAM像一個(gè)高效的私人助理,幫你從規(guī)劃到執(zhí)行,再到檢查優(yōu)化,完成所有任務(wù)。 規(guī)劃階段,當(dāng)你給出購(gòu)房需求,LAM就會(huì)把這個(gè)大目標(biāo)拆解成一系列小任務(wù)——預(yù)算計(jì)算、房源篩選等,并生成一張動(dòng)態(tài)的流程圖,確保每個(gè)步驟有條不紊。執(zhí)行階段,它開(kāi)始動(dòng)手,利用工具調(diào)取房產(chǎn)數(shù)據(jù)、編寫(xiě)算法、生成報(bào)告等,確保每個(gè)環(huán)節(jié)都精準(zhǔn)到位。驗(yàn)證階段,通過(guò)強(qiáng)化學(xué)習(xí),LAM會(huì)評(píng)估任務(wù)結(jié)果,核對(duì)房源的準(zhǔn)確性和預(yù)算的匹配度,甚至自動(dòng)調(diào)整并優(yōu)化方案。通過(guò)這三步,LAM不僅能“想得明白”,還能夠“做得精確”。更重要的是,它會(huì)在執(zhí)行過(guò)程中不斷自我優(yōu)化,像一個(gè)無(wú)時(shí)無(wú)刻不在調(diào)整的精密機(jī)器,確保最終結(jié)果完美無(wú)缺。 大語(yǔ)言模型(LLM)與大行為模型(LAM)的本質(zhì)差異,在于前者專(zhuān)注于語(yǔ)言的解析與生成,而后者則打破了語(yǔ)言與行動(dòng)的界限,實(shí)現(xiàn)了從意圖理解到任務(wù)執(zhí)行的完整閉環(huán)。這不僅僅是技術(shù)架構(gòu)的不同,更是AI從“思考者”到“行動(dòng)者”的范式躍遷。正如德勤報(bào)告所預(yù)測(cè)的,到2028年,15%的日常工作決策將由LAM驅(qū)動(dòng)的智能體完成。如果說(shuō)LLM讓我們獲取知識(shí)更加便捷,那么LAM則讓我們的行動(dòng)更加高效、精準(zhǔn)。未來(lái)的智能世界,不再是一個(gè)靜止的圖書(shū)館,而是一個(gè)不斷變動(dòng)、不斷執(zhí)行的行動(dòng)場(chǎng)。 LAM的核心優(yōu)勢(shì):讓“行動(dòng)”變得可控與智能 想象一下,你是一位公司CEO,面臨一系列復(fù)雜的戰(zhàn)略決策。你向傳統(tǒng)的AI咨詢(xún)系統(tǒng)提問(wèn),它會(huì)為你提供大量的數(shù)據(jù)分析、預(yù)測(cè)和建議。但最終,這些信息仍需要你親自篩選、分析、做出決策。整個(gè)過(guò)程充滿(mǎn)了“思考”的成分,但行動(dòng)依舊掌握在你手中。 而LAM的工作方式不同。它是一個(gè)虛擬的“智能CEO”,不僅能為你提供決策依據(jù),還能主動(dòng)執(zhí)行計(jì)劃中的每一項(xiàng)任務(wù)。例如,LAM能夠根據(jù)市場(chǎng)變化自動(dòng)調(diào)整公司資源、安排員工任務(wù),甚至在戰(zhàn)略執(zhí)行過(guò)程中進(jìn)行實(shí)時(shí)優(yōu)化。這樣一來(lái),你不僅獲得了決策支持,還通過(guò)LAM的能力將計(jì)劃轉(zhuǎn)換為具體行動(dòng)。無(wú)論是招聘、財(cái)務(wù)調(diào)整還是營(yíng)銷(xiāo)策略,它都能精準(zhǔn)地為你執(zhí)行。甚至在面對(duì)突發(fā)危機(jī)時(shí),LAM能夠迅速調(diào)整應(yīng)對(duì)策略、制定應(yīng)急預(yù)案。 這種超強(qiáng)超前的執(zhí)行能力,正是LAM與LLM最大的不同——LAM不再僅停留在知識(shí)表層,它進(jìn)入了行動(dòng)的深水區(qū),具備了更多的“主動(dòng)性”和“執(zhí)行力”。通過(guò)增強(qiáng)行動(dòng)智能,LAM打破了“語(yǔ)言的巨人,行動(dòng)的矮子”的魔咒,將AI技術(shù)從單純的理解和表達(dá),推向了更高的層次——實(shí)際操作和執(zhí)行。 商業(yè)、生活、城市治理:LAM帶來(lái)的全方位變革 LAM的魅力,不僅在于它的技術(shù)原理,更在于它如何徹底改變我們的工作和生活方式。在隨著技術(shù)的不斷發(fā)展,LAM將會(huì)在越來(lái)越多的領(lǐng)域中發(fā)揮作用。讓我們來(lái)看幾個(gè)典型的應(yīng)用場(chǎng)景: 從“輔助工具”到“數(shù)字員工” LAM驅(qū)動(dòng)的智能體將不再是簡(jiǎn)單的輔助工具,而是能夠獨(dú)立承擔(dān)完整工作流的“數(shù)字員工”。例如,在市場(chǎng)營(yíng)銷(xiāo)領(lǐng)域,LAM不僅能進(jìn)行市場(chǎng)調(diào)研、數(shù)據(jù)分析、廣告投放,還能實(shí)時(shí)評(píng)估廣告效果,完成整個(gè)流程。而在財(cái)務(wù)部門(mén),LAM可以自動(dòng)處理發(fā)票、生成財(cái)務(wù)報(bào)告,甚至進(jìn)行預(yù)算規(guī)劃和風(fēng)險(xiǎn)評(píng)估。在物流配送中,LAM能根據(jù)實(shí)時(shí)交通信息優(yōu)化路徑,確保貨物按時(shí)送達(dá)。這種從“輔助”到“執(zhí)行”的轉(zhuǎn)變,極大提升了工作效率,減少人為錯(cuò)誤。 個(gè)人助理:從提醒到全面執(zhí)行 想象有一天,你醒來(lái)時(shí),身邊有一個(gè)虛擬助手,它不僅能提醒你今日日程、重要事項(xiàng),還能根據(jù)天氣自動(dòng)調(diào)整出行計(jì)劃、預(yù)訂符合健康需求的餐廳,甚至在你下班前啟動(dòng)掃地機(jī)器人并預(yù)熱空調(diào)。LAM驅(qū)動(dòng)的個(gè)人助理,已經(jīng)遠(yuǎn)超傳統(tǒng)語(yǔ)音助手的功能。它不僅主動(dòng)分析需求、協(xié)調(diào)事務(wù),甚至在你未曾察覺(jué)時(shí)優(yōu)化你的時(shí)間安排。它的執(zhí)行力,不再局限于“提醒”或“建議”,而是全面滲透到你日常的決策與行動(dòng)中。 聚會(huì)籌備無(wú)憂(yōu):從菜單到送餐的無(wú)縫銜接 想象一場(chǎng)家庭聚會(huì)的籌備過(guò)程,LAM不僅能提前幫你規(guī)劃菜單和布置場(chǎng)地,還能根據(jù)來(lái)賓的飲食偏好和過(guò)敏信息自動(dòng)調(diào)整食品安排。它會(huì)與送餐服務(wù)平臺(tái)對(duì)接,確保食物準(zhǔn)時(shí)送達(dá)。在這個(gè)過(guò)程中,你只需要享受成果,LAM為你完成了從構(gòu)想到執(zhí)行的所有步驟。在這場(chǎng)聚會(huì)中,你從“決策者”變成了“驗(yàn)收者”,享受著LAM帶來(lái)的高效與便捷。 我們可以想象LAM在更大范圍發(fā)揮的作用。例如在城市治理方面,LAM能夠集成交通、能源、環(huán)境等各類(lèi)數(shù)據(jù),實(shí)時(shí)優(yōu)化決策。在極端天氣來(lái)臨時(shí),LAM可以自動(dòng)調(diào)度排水系統(tǒng)、調(diào)整交通信號(hào)燈配時(shí),甚至為市民推送避險(xiǎn)路線,確保城市在突發(fā)事件中的穩(wěn)定運(yùn)行。在環(huán)境保護(hù)與治理中,城市的空氣質(zhì)量、垃圾處理等環(huán)保問(wèn)題,通常需要跨部門(mén)的協(xié)調(diào)與實(shí)時(shí)監(jiān)控。LAM能夠整合這些不同領(lǐng)域的數(shù)據(jù),實(shí)時(shí)監(jiān)控污染源,自動(dòng)調(diào)整應(yīng)對(duì)措施。例如,當(dāng)空氣污染指數(shù)達(dá)到一定標(biāo)準(zhǔn)時(shí),LAM會(huì)自動(dòng)啟動(dòng)應(yīng)急預(yù)案,控制工業(yè)排放,并指導(dǎo)市民如何減少外出,及時(shí)發(fā)布防護(hù)提示。同時(shí),LAM能夠優(yōu)化垃圾清運(yùn)路線,根據(jù)實(shí)際情況動(dòng)態(tài)調(diào)整垃圾處理頻率,避免污染擴(kuò)散。 LAM與LLM:互補(bǔ)共生,共同推動(dòng)AI進(jìn)化 盡管LAM與LLM分別在理解與行動(dòng)領(lǐng)域各自占據(jù)獨(dú)立的技術(shù)陣地,但它們并非對(duì)立,而是互為補(bǔ)充,攜手推動(dòng)AI的進(jìn)化。LLM賦予AI強(qiáng)大的語(yǔ)言理解和生成能力,讓它能夠與人類(lèi)進(jìn)行流暢溝通;而LAM則賦予AI行動(dòng)力,使其能夠?qū)⒄Z(yǔ)言轉(zhuǎn)化為具體操作,實(shí)現(xiàn)真正的“行動(dòng)”。 以醫(yī)療場(chǎng)景為例,LLM可以與患者進(jìn)行詳細(xì)對(duì)話(huà),準(zhǔn)確理解癥狀并生成醫(yī)學(xué)報(bào)告;而LAM則將報(bào)告轉(zhuǎn)化為具體的治療方案,自動(dòng)安排后續(xù)的治療、檢查以及藥物處方。兩者攜手配合,才真正實(shí)現(xiàn)了從“理解”到“執(zhí)行”的無(wú)縫銜接,將復(fù)雜的醫(yī)療過(guò)程自動(dòng)化且精準(zhǔn)化。 這種“理解與行動(dòng)”相輔相成的機(jī)制,正在推動(dòng)AI從“腦袋型”智能走向“行動(dòng)型”智能。正如一位優(yōu)秀的指揮官不僅需要擅長(zhǎng)指揮(理解),更需要帶領(lǐng)隊(duì)伍去執(zhí)行(行動(dòng)),LAM與LLM的結(jié)合,是推動(dòng)AI走向全面智能的重要一步。 LAM技術(shù)的困境:智能決策與自主行動(dòng)的平衡 盡管LAM展現(xiàn)了巨大的潛力,但它的應(yīng)用背后依然存在許多挑戰(zhàn)和難題。 首先,LAM的決策和行動(dòng)高度依賴(lài)于數(shù)據(jù)的準(zhǔn)確性與全面性??梢哉f(shuō),數(shù)據(jù)是LAM的“眼睛”,如果眼睛看錯(cuò)了,行動(dòng)就會(huì)偏離軌道。例如,在企業(yè)管理中,若LAM依賴(lài)的市場(chǎng)數(shù)據(jù)有誤,它可能做出錯(cuò)誤的戰(zhàn)略決策,反而加劇公司風(fēng)險(xiǎn);在醫(yī)療場(chǎng)景中,錯(cuò)誤的病歷數(shù)據(jù)可能導(dǎo)致誤診,甚至危及生命。因此,確保數(shù)據(jù)的精準(zhǔn)與完整,建立“輸入數(shù)據(jù)質(zhì)檢”和“執(zhí)行結(jié)果復(fù)核”的雙重機(jī)制,成為了LAM系統(tǒng)不可忽視的基礎(chǔ)保障。 其次,LAM的過(guò)度依賴(lài)可能導(dǎo)致“依賴(lài)性文化”的出現(xiàn)。當(dāng)過(guò)多的決策權(quán)交給AI時(shí),人們可能逐漸失去自我判斷的能力,甚至盲目信任系統(tǒng)。例如,某電商公司會(huì)因完全依賴(lài)LAM定價(jià)系統(tǒng),未能及時(shí)識(shí)別競(jìng)爭(zhēng)對(duì)手“偽裝數(shù)據(jù)”的漏洞,導(dǎo)致季度虧損。人機(jī)協(xié)同的關(guān)鍵,正是劃定AI的權(quán)限邊界。在復(fù)雜的決策場(chǎng)景中,人類(lèi)的判斷力與直覺(jué)依然至關(guān)重要,尤其是在面對(duì)非標(biāo)準(zhǔn)化、不可預(yù)測(cè)的情況時(shí),AI的決定不應(yīng)完全取代人類(lèi)的洞察力和決策。 最后,如何確保LAM的行為符合道德和倫理標(biāo)準(zhǔn),也是一個(gè)亟待解決的問(wèn)題。假設(shè)LAM在執(zhí)行醫(yī)療方案時(shí)出現(xiàn)錯(cuò)誤,責(zé)任該由誰(shuí)承擔(dān)?是醫(yī)生、系統(tǒng)運(yùn)營(yíng)方,還是患者本人?如何避免AI的行為失控,確保它始終為人類(lèi)服務(wù),而不是帶來(lái)傷害?這些問(wèn)題涉及科技倫理的邊界,亟須通過(guò)行業(yè)規(guī)范和法律框架來(lái)約束。人工智能的“智慧”越高,其“責(zé)任”也越重,如何在提升AI自主性的同時(shí),保持其可控性,是未來(lái)發(fā)展的關(guān)鍵課題。 通過(guò)解決這些挑戰(zhàn),LAM才能真正發(fā)揮其潛力,既不失控,也不讓人類(lèi)的判斷力被過(guò)度削弱。未來(lái)的AI,應(yīng)當(dāng)是智慧與責(zé)任并行的“伙伴”,而非無(wú)條件的“執(zhí)行者”。 當(dāng)AI不僅能回答“怎么做”,還能主動(dòng)“做到”,人機(jī)協(xié)作將進(jìn)入真正的共生時(shí)代。我們是否準(zhǔn)備好將更多的“行動(dòng)權(quán)”交給AI?在追求高效與便利的同時(shí),我們又該如何平衡控制與信任的微妙關(guān)系? 或許,未來(lái)的某一天,當(dāng)LAM技術(shù)更加普及與優(yōu)化,它將成為我們每個(gè)人的得力助手、企業(yè)的核心引擎,甚至是社會(huì)運(yùn)作的“中樞大腦”。人類(lèi)需要重新思考自身的角色——是成為全局的監(jiān)督者,還是細(xì)節(jié)的執(zhí)行者?答案或許在于找到那個(gè)微妙的平衡點(diǎn):讓AI挑起重復(fù)勞動(dòng)的扁擔(dān),讓人類(lèi)牢牢掌控創(chuàng)新的韁繩。 (作者胡逸為數(shù)據(jù)工作者,著有《未來(lái)可期:與人工智能同行》一書(shū)) 來(lái)源:胡逸 (本文來(lái)自澎湃新聞,更多原創(chuàng)資訊請(qǐng)下載“澎湃新聞”APP) |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽