人形不是終極答案,機器人如何真正完成演化?
來源:倍可親(backchina.com)
圖源:Unsplash / Possessed Photography
撰文|劉少山
● ● ●
過去一年裡,我被問得最多的問題之一是:未來的機器人是否一定會走向人形?這一問題在科技界引發了大量討論,其背後其實對應著兩種截然不同的技術哲學,「創世論」與「進化論」。所謂「創世論」,是指只要把某一種機器人形態做到足夠強大、足夠全面,它最終就能解決所有類型的問題。在這種理念中,人形機器人被視為最接近「通用形態」的存在,因此許多公司試圖通過不斷增強一款人形機器人,讓它承擔從搬運、清潔到陪伴、護理的各種任務,彷彿在「創造」一個萬能的技術生命體。
與之相對的「進化論」則認為,機器人應像自然界的生命一樣,根據場景需求不斷分化和演化為不同形態,沒有任何一種形態是預設的終極答案,而是依靠大規模應用帶來的數據、成本、效率和場景適配度來決定成敗。從掃地機器人到倉儲機械臂,從室內移動底盤到外骨骼,每一種形態都在市場競爭和現實約束中經歷「物競天擇」:適應場景和經濟性的形態得以規模化,不具備場景價值或成本優勢的形態則自然會被淘汰。在具身智能逐步走向大規模應用的過程中,我個人更相信「進化論」的道路,它更符合商業規律、技術演化的真實路徑,也更符合這個複雜世界的真實結構。
01
觀點一:讓一個機器人適應所有場景是線性進化,而多種形態并行演化才是指數級效率
如果從工程和商業的角度冷靜審視,試圖讓單一機器人形態適應所有場景,幾乎註定是一條線性且低效的演進路徑。假設我們希望一台人形機器人同時勝任清潔、烹飪、護理、遞物、整理等完全不同的任務,那麼每新增一個場景,都意味著要額外構建一整套動作庫、採集對應的數據、開發新的感知與決策模型,並通過大量安全與可靠性驗證。這類能力擴展本質上是「串列累積」:每跨入一個新領域,都需要投入巨量工程資源,而且不同場景之間的技能遷移度有限,很難通過某一次突破帶來整體能力的指數級躍遷。現實中,人形機器人在高自由度控制、精細力控和複雜視覺理解等方面仍存在大量技術難題,而在許多具體任務場景里,人形的結構優勢並不明顯,甚至不如專用機器人高效。這使得「讓一台人形機器人包打天下」在實踐中往往陷入緩慢的線性演進:可以做的事越來越多,但每邁出一步都成本高昂、周期漫長。
反觀現實世界,許多機器人形態已經在各自垂直場景中實現了大規模應用,並沿著自己的賽道高速進化。以掃地機器人為例,經過十多年的發展,全球清潔機器人市場已經形成「數億台級別」的保有量,僅頭部廠商就累計出貨數千萬台。在這樣的大規模基礎上,導航、路徑規劃、避障、地面建模、纏繞處理等能力得到了持續優化,背後依託的是每天在真實家庭環境中產生的海量運行數據,而不是在實驗室中「設計出完美通用形態」。外賣配送和園區/校園配送機器人在中國等地已較為常見,它們在複雜道路結構和高頻任務調度中,快速積累了導航策略、感測器融合和異常場景處理的豐富經驗。倉儲物流中的機械臂與 AGV 系統,每天在電商和製造企業的倉庫里執行上億次抓取與搬運操作,形成了極其龐大的動作樣本和失敗樣本,使得抓取策略、路徑規劃和系統魯棒性在幾年內實現了跨越式迭代。
從這個角度看,多種機器人形態在各自高頻場景中并行演化,形成的是一種「生態式」的指數級能力增長。每一種形態都在自己最擅長、最高頻的場景里快速迭代,通過真實世界持續反饋推動演演算法和系統不斷優化,而並不需要等到某個「終極形態」完善之後再統一賦能。這種結構性的差異意味著,多形態并行演化比單形態通吃式通用化,更符合技術發展規律和商業規模化邏輯。即便未來不同形態之間會逐漸沉澱出一組「共性能力」,甚至在某些場景中自然收斂為類似人形的結構,那也應被視為規模化進化后的結果,而不是一開始就被寫死在技術藍圖上的答案。具身智能真正的效率和活力,來自一個多物種、多路徑的生態,而不是來自某個單一形態的極限強化。
02
觀點二:具備基礎出貨量的機器人形態,更有演化潛力與成本優勢
如果多形態并行演化是更高效的道路,那麼一個自然的問題是:哪些形態更有資格在這條路上跑得更快?答案往往是那些已經在市場上擁有大規模裝機量和穩定需求的機器人形態。掃地機器人、各類服務機器人和移動底盤之所以發展迅速,並不是因為它們在結構上多麼「接近人形」,而是因為它們已經擁有數百萬乃至數千萬級別的年度出貨規模,在這一基礎上形成了堅實的供應鏈體系和成本結構。核心元件如電機、輪組、減速器、激光雷達、攝像頭、IMU、電池和主控晶元等,在大批量採購和持續優化的過程中不斷降本增效。同時,這些設備長期運行在真實家庭、餐廳、酒店、園區和倉庫環境中,產生了遠超實驗室的感知數據、故障樣本和邊緣場景案例,使得演演算法、結構設計與系統穩定性都在「用中學、學中迭代」。
當一種形態已經具備如此龐大的存量和增量基礎時,在其上做輕量級功能擴展,就能以非常高的性價比快速拓展應用邊界。例如,在成熟的掃地機器人平台上加裝一個輕量機械臂,可以讓其從單一清掃任務擴展到拾取地面小物件、放回指定區域、做簡單的分類和歸位,甚至與家庭成員產生低風險的互動。這類「從地面到手部」的升級,由於底盤、導航、供電和控制等基礎設施已經高度成熟,其邊際成本遠小於從零打造一套全新形態。類似的思路同樣適用於配送機器人、餐飲機器人、巡檢機器人等,通過在現有平台上添加適當的執行機構、感測器或軟體功能,就能顯著提升任務價值密度,進入更多高價值場景
在這種模式下,銷量越大,演演算法迭代越充分、故障場景覆蓋越全面、供應鏈成本越低,進而又提升了產品的性價比和可用性,吸引更多用戶和應用場景加入,形成正向反饋。這才是真正意義上的商業閉環:技術能力和市場規模互相促進,而不是靠單次融資或概念驅動「硬拽」出來的應用。從進化的角度看,具身智能的演化並不是從零開始設計某種「理想軀體」,而是在已有的高頻形態中不斷疊加能力,逐步向更多場景和更複雜生態擴散。就像智能手機的形態是在幾十億用戶的長期使用中演化出來,而不是在第一天就被完美設計好一樣,那些已經在市場中證明自己、具備穩定需求和規模基礎的機器人形態,更有可能成為具身智能演化的主幹;而那些缺乏規模基礎、難以形成成本優勢或缺乏真實場景支撐的形態,則很可能在商業競爭中逐漸被淘汰。
03
觀點三:如果用人形機器人做所有事情,成本結構會成為最大阻力
在討論人形機器人時,最大的現實掣肘往往不是「能不能做」,而是「值不值得做」,也就是成本結構是否與任務價值匹配。當前一代人形機器人普遍採用高度複雜的機械和控制系統:幾十個自由度的關節驅動器、價格不菲的精密減速器和高性能電機、多模態感測器(包括多攝像頭、激光雷達、力矩感測器、IMU 等)、大容量電池組以及高算力的計算平台。這類系統即便在未來實現量產,單機成本短期內仍大概率處於數萬美元甚至更高的區間。與之對比,清潔機器人、餐飲服務機器人、AGV、協作機械臂等成熟形態,其單機價格已經壓縮到消費者可以接受、企業可以規模採購的水平。
問題在於,當一台造價極高、結構極其複雜的人形機器人被用來執行「擦桌子、端水、疊衣服」這類中低複雜度任務時,其大部分硬體能力、冗餘自由度和感測配置在日常工作中很可能並未被真正用到,從而形成典型的「用火箭送快遞」的成本錯配。這並不是否認技術上的可行性,而是質疑這種形態在當下大部分場景中的經濟意義。相比之下,那些已經大規模應用的專用或半通用機器人形態,在成本與能力之間往往達成了相對合理的平衡:掃地機器人以百美元級的價格完成了絕大多數家庭難以堅持的日常清潔工作;商用服務機器人在幾萬元人民幣的價格帶上,支撐了餐廳、酒店和醫院等高頻場景中的穩定運行;倉儲里的 AGV 和機械臂則通過針對性結構設計,實現了在固定場景中的高效作業,很少為了「可能有一天會需要」而預留大量閑置的自由度和感測器。
從商業邏輯上看,如果一種機器人形態的總擁有成本明顯高於它所解決問題的經濟價值,那麼無論技術多麼炫目,都難以實現真正的大規模部署。人形機器人如果被設想為「做所有事的唯一入口」,在絕大多數中低複雜度任務場景中,都會面臨嚴重的性價比壓力。而那些柔性機器人、模塊化移動平台、低自由度輕量機械臂之所以成長迅速,正是因為它們圍繞特定任務做了結構約束和成本約束,在安全性、可靠性與成本之間達成了工程上的平衡。換句話說,成本結構本身就是具身智能生態中的一種「自然選擇機制」:那些在給定場景下用更低成本提供足夠價值的形態,更容易被市場選中並獲得規模化生存空間;而那些過度設計、難以匹配主流需求價格帶的形態,即便短期因概念極具話題性,也往往難以跨過長期商業化的門檻。最終,哪些機器人形態會真正「活下來」,不是由某個技術路線拍板決定的,而是由成本、需求與規模效應共同完成的長期篩選。
04
觀點四:規模化演化后,最終會出現「共性功能」,其中一部分可能會自然匯聚成類似人形的形態
當成本結構完成第一輪「自然篩選」之後,倖存下來的多種機器人形態,並不會彼此完全割裂,而是在長期規模部署中逐漸顯露出一組被反覆重用的「共性功能」。無論是清潔機器人、倉儲機械臂、配送機器人,還是未來的護理機器人,它們在抓取、移動、視覺感知、姿態控制、環境建模等核心能力上,都會隨著數據和演演算法的沉澱而不斷趨同。現實中,物流倉庫里的機械臂和家庭中的掃地機器人雖然外形和工作條件完全不同,但在路徑規劃、障礙避讓、狀態估計這些底層演演算法上具有高度相似性;自動駕駛車輛與室內移動機器人在 SLAM、目標檢測和軌跡優化方面也共享了大量技術組件。隨著更多機器人進入真實環境,這種「技術內核重疊」的現象只會愈發明顯,只是被封裝在不同的外形、任務介面與軟體棧之中。
在這一過程中,人形結構有可能在某些特定場景中成為這些共性功能的「匯聚載體」,原因並不是人形在抽象意義上更高級,而是因為人類的物理世界在很大程度上是按人形設計的:樓梯高度、門把位置、工具形狀、操作台和櫥櫃的尺寸,都圍繞著一個雙足、雙臂、眼睛高度在一米五到一米八之間的生物來布局。在需要大規模使用現有工具、頻繁開門上下樓梯、搬箱子、穿行於狹窄通道和人類工作空間的場景中,具備與人類相近的身體比例、手部形態和視角高度,確實在適配性上具有明顯優勢。許多面向工業共融和服務協作的人形機器人項目,都強調無需改造現有工廠和樓宇環境、可以直接使用人類工具、在「為人類設計的空間」中與人並肩工作,這從側面印證了人形在「復用既有物理基礎設施」方面的天然長處。
即便如此,這種向人形方向的潛在收斂,依然更像是一種「演化的結果」,而不是一開始就寫死在技術路線圖上的必然終點。從當前現實出發,在工業場景中真正規模落地的是固定基座機械臂和各類輪式移動平台,而不是雙足人形;在家庭場景中真正進入千家萬戶的,是掃地機器人、擦窗機器人以及若干簡單的服務機器人,而不是能夠獨立完成全部家務的全能人形。市場已經通過「用腳投票」的方式,選擇了在成本、可靠性和場景適配度之間平衡得更好的形態。未來如果有一天,人形或半人形形態在某些領域自然成為主流,更大概率是因為抓取、導航、平衡控制、視覺理解、雙手協作等底層共性能力已經在其他形態上充分成熟,最後在少數需要高度兼容人類工具與空間的高價值場景中,被「打包」進一個更接近人形的結構中。
從這個意義上講,與其一開始就把人形當作唯一目標,不如讓不同形態在各自場景中充分競爭、充分演化,由市場和真實環境去篩選哪些共性能力是剛需,哪些身體結構真正能提供凈收益。當這些共性能力不斷沉澱、在不同形態間反覆重用時,人形有可能在部分關鍵領域裡,作為一種高通用性的「彙集形態」自然出現,但那是一種順應進化、順應成本和場景約束的結果,而不是先驗的信仰。具身智能領域真正值得追問的問題,已經不再是「要不要人形」,而是「在哪些具體場景中,經過充分演化之後,人形恰好是性價比最高、適配度最好的那個答案」。而這一答案,不會寫在某位工程師的白板上,而是會在成千上萬台機器人與真實世界的長期互動之中,被緩慢而堅定地「選」出來。
05
結 語
如個人認為,真正決定具身智能未來形態的,從來不是誰畫出一個「終極人形」,而是無數機器人在真實世界里的長期博弈與優勝劣汰。與其執著於造一個萬能的技術「神」,不如擁抱多形態并行演化的生態,讓成本、場景和規模去篩選最合適的答案。也許有一天,人形會在某些關鍵領域自然成為收斂形態,但那是進化的結果。我們要做的,不是替未來下結論,而是把更多機器人儘快送進真實世界,讓時間和市場完成最後的選擇。
劉少山,深圳人工智慧與機器人研究院(AIRS)具身智能中心主任, 國際計算機學會(ACM)技術政策委員會成員。
