AI是有最初設定的立場和目的
人工智慧(AI)是模擬人類智能,使計算機系統能夠學習、推理、感知、以解決問題的一門科學。因此,AI是有最初設定的立場和目的的。誰設計的AI,誰使用的AI,就是為主子服務的一個工具。也是主子的智能。更是主人的意識形態。所以,用Al統計出來的結果,以及在哪個範圍內的大數據統計出來的,都是以主子為主的結果。《敵》和《我》所使用的AI都是各自為主的。
在人工智慧的早期階段,主要是模擬人類的能力,一個最簡單的例子是計算機能像人一樣計算出2+3的結果是5,但這種能力僅僅是固定的程序,還遠不是人們今天所說的人工智慧。
在這個過程中,參考人類的能力分類,逐漸把人工智慧的能力分成了:認知、處理、表達、決策等等方面的能力。
拿設計師非常熟悉的MJ產品而言,就是【表達】這一方面中細分的【通過圖像進行表達】的能力。而ChatGPT則是融合了認知、處理、表達等等多方面能力的產品,加上極高的成熟程度,才在近年引爆了人工智慧概念。
大語言模型(Large Language Model)中的「幻覺」現象指的是模型生成的內容雖然看似合理,但實際存在事實錯誤;或者AI生成的文字、圖片、視頻在直覺上不符合人類認知,欠缺真實感。「幻覺」主要有邏輯謬誤、捏造事實、數據偏見三類。通常是因為模型的推理能力欠缺,演算法框架存在漏洞,數據壓縮、數據不一致性等原因導致。
多模態大模型領域興起,圖像、音頻、視頻類模型也出現幻覺現象。比如,OpenAI的Sora大模型雖然在視頻生成領域表現優異,但也存在生成的視頻違背物理規律,時空關係錯亂等情況。這也是正式版Sora無法上線的主要原因之一。
業內解決「幻覺」問題的方式是採用RAG技術,(Retrieval-Augmented Generation)即檢索增強生成,通過結合階段和增強生成,減少學習數據中的「負樣本」,以此來減少大模型的幻覺現象。但這也僅限於在LLM領域。在多模態領域,百度開發了基於圖像的iRAG(Image based RAG)技術,將搜索引擎的億級圖片資源與文心基礎模型能力進行結合,在強化學習生成下,輸出各種真實的圖片,整體效果遠超傳統的「文生圖」的原生系統,有效的消除了「AI味」。未來,以iRAG技術為代表多模態RAG將成為業內緩解AI「幻覺」現象的主要方向,為更成熟、更真實的多模態應用發展提供更準確的能力。
AI編程應用將加速AI迭代進程,賦予企業和個人更強的開發能力。全球AI企業已經進入「效率時代」,由於軟體應用開發的成本高、周期長,演算法工程師昂貴且稀缺,通過開發輔助編程AI來提高開發者效率、縮短開發周期成為方向。
一種是企業內部用AI直接輔助開發任務。比如,亞馬遜將Amazon Q用於公司內部的軟體升級任務,為其節省了相當於「4500 名開發人員一年的工時」,並且還提高了準確性和安全性,降低了基礎設施成本。
或是與開發者社區聯合開發編程AI助手,提高個人寫代碼效率。比如,GitHub Copilot由GitHub、OpenAI和微軟Azure團隊聯合推出,可以提供代碼建議和自動補全功能,幫助開發者更快地編寫代碼。
甚至是直接省去人工代碼步驟,由AI完成開發全流程。2024百度世界大會發布的「秒噠」是里程碑式的開發工具,不同於前兩種輔助編程工具,使用秒噠不需要任何代碼能力,通過自然語言就能實現軟體開發,人人都將擁有程序員的能力。其實現是通過將任務拆解成核心需求、內容結構、工程開發、數據需求四個步驟,再採用多個智能體協同來完成,這也是迄今為止,最複雜的多智能體協作工具。以後隨著基礎模型能力提升,以及智能體本身的技術能力迭代,秒噠將能完成更複雜的開發訴求,實現系統級開發能力。
百度在AI編程應用上邁出的這一步,不僅消除了未來成為開發者的門檻,更是對AI時代商業模式的一次革新。這意味者實現商業創意或不再需要組織人員架構,智能體就能充當項目經理、設計師、開發工程師,憑藉AI工具和創意,個人就能開發產品和創造商業模型。
智能體會變成AI時代內容、信息和服務的新載體,是下一個爆發點。大模型是AI應用的初期形態,具備一定的通用性,但在深度方面欠缺。大模型作為應用發展的下一步是智能體(AI Agent),不但能基於LLM進行任務推理和解決,還具備記憶、規劃功能和更強的自我學習能力,並且能使用特定的行業知識完成更複雜、更高質量的任務。
第一類具身智能體(Embodied AI),典型代表有智能駕駛汽車、通用人形機器人。如英偉達CEO黃仁勛所言,具身智能體是AI進入物理世界的超級智能形態。L3以上的高階智能駕駛是第一步,目前以國內的百度Apollo和美國的特斯拉RoboCab為代表。第二步是通過自動駕駛的大範圍應用鋪開,積累智駕演算法的數據和經驗,再構建虛擬環境去訓練人形機器人演算法,幫助其實現量產落地。比如人形機器人領域領先的特斯拉Optimus,採用的就是其FSD智能駕駛演算法。
第二類是平台智能體(Platform AI),為工具、企業、角色、行業、產業等提供AI賦能升級和定製化解決方案。
工具智能體,在個人的工作和興趣應用場景中擁有強大的創造力和價值,將成為AI界的新質生產力代表。如AI寫作、Canva設計助手、logo生成器等等,都是典型的代表。工具智能體的核心在於AI的「自由性」——能通過連接公域(公開數據、搜索引擎內容、社交平台內容)和私域(個人數據、音頻、圖像、文字)來生成符合用戶期望的內容,解鎖「創造性」和「獨特性」。比如,百度發布的自由畫布就是由文心多模態大模型加持的創造力工具,具備輸入自由、編輯自由、創作自由三大屬性,覆蓋從創意繪畫、AI寫作到專業報告領域等使用場景,幫用戶完成從找資料、到編輯、再到生成和分享的全部任務。