暗黑厨房里的机械共舞，人形机器人如何从科幻走进现实？-（南京）软件科技有限公司

动态行业资讯

动态

行业资讯

暗黑厨房里的机械共舞，人形机器人如何从科幻走进现实？

发布时间：2025-03-03 09:13:31 阅读量: 489

Figure机器人（图源：Figure）

在科幻电影的预言中，人类与机器人的共生总是始于一场静默的革命——那些曾经笨拙的机械臂开始像人类一样思考，冰冷的金属关节学会与生活场景共舞。而2025年2月，这一幕似乎悄然在现实中上演。

美国初创公司Figure推出的新一代人形机器人，搭载了名为Helix的视觉-语言-动作（VLA）模型，极大增强了机器人的感知、控制、理解能力，让两台机器人无需预演便能默契传递物品，以近乎科幻的智能协作能力，将家庭场景中的机械管家从幻想拉入现实。

人形机器人：科技的集大成者

电影《大都会（Metropolis）》剧照

机(jī)器(qì)人(rén)（Robot）的(de)概(gài)念(niàn)，最(zuì)早(zǎo)出(chū)现(xiàn)在(zài)捷(jié)克(kè)著(zhe)名作(zuò)家(jiā)卡(kǎ)雷(léi)尔(ěr)·恰(qià)佩(pèi)克(kè)（Karel Čapek）于(yú)1920年(nián)创(chuàng)作(zuò)的(de)戏(xì)剧(jù)《罗(luō)素(sù)姆(mǔ)万(wàn)能(néng)机(jī)器(qì)人(rén)》中(zhōng)。1927年(nián)电(diàn)影(yǐng)《大(dà)都(dōu)会(huì)》中(zhōng)的(de)人(rén)造(zào)人(rén)玛(mǎ)丽(lì)亚(yà)，便(biàn)以(yǐ)机(jī)械(xiè)之(zhī)躯(qū)承载人性，成为赛博朋克美学的早期雏形。

人形机器人（Humanoid Robot）是一种利用人工智能和机器人技术制造的具有类似人类外观和行为的机器人，融合了机械工程、电子技术、计算机科学、人工智能等多学科领域的前沿成果。

NASA 的 Valkyrie （R5）机器人

图源：NASA

人形机器人的核心技(jì)术(shù)由(yóu)四(sì)部(bù)分(fēn)组(zǔ)成(chéng)：

感(gǎn)知(zhī)系(xì)统(tǒng)：指(zhǐ)人(rén)形(xíng)机(jī)器(qì)人(rén)需(xū)要(yào)具(jù)备(bèi)感(gǎn)知(zhī)环(huán)境(jìng)的(de)能(néng)力(lì)，通(tōng)过(guò)传(chuán)感(gǎn)器(qì)等(děng)设(shè)备(bèi)来(lái)获(huò)取(qǔ)外(wài)部(bù)信(xìn)息(xi)，如(rú)视(shì)觉(jué)感(gǎn)知(zhī)、听(tīng)觉感知、触觉感知等。

智能决策：指通过机器学习、深度学习、神经网络等人工智能技术，使机器人能够根据情景和任务要求自主决策和判断。

人机交互：指人形机器人能够更好(hǎo)地与人类进行交流和互动的功能，如语言识别、情感识别等。

运动控制：指通过使用各种传感器和算法来对机器人进行姿势控制、步态规划和平衡控制。

人形机器人的发展史，是一部人类试图用机械复刻自身的史诗。从蒸汽时代的齿轮幻想，到AI时代的神经网络革命，每个技术节点的突破都暗合着科幻作品的预言与启示。

早期发展阶段（1970s-2000）：

早(zǎo)期(qī)的(de)人(rén)形(xíng)机(jī)器(qì)人(rén)模(mó)型(xíng)外(wài)表(biǎo)简(jiǎn)略(è)，仅(jǐn)仅(jǐn)具(jù)有(yǒu)初(chū)级(jí)的(de)人(rén)类(lèi)躯(qū)干(gàn)与(yǔ)肢(zhī)体(tǐ)形(xíng)状(zhuàng)，能(néng)实(shí)行(xíng)的(de)功能也存在很大局限性，只能实现简单的行走和手部运动，尚未具备交互能力且智能化水平较低。

WABOT-1机(jī)器(qì)人(rén)（图(tú)源(yuán)：早(zǎo)稻(dào)田(tián)大(dà)学）

例如1973年，日本早稻田大学研发出了世界上第一款人形机器人WABOT-1，它只能够执行搬运物体等任务，智力水平相当于一岁半的婴儿；同时期日本本田公司研发的自主行走机器人P2和ASIMO也仅仅在行走和平衡方面进行不断优化。

高度集成发展阶段（2001-2011）：

这一阶段是人形机器人初级感知功能的起步阶段。这一时期的人形机器人因技术的突破可以实现与外界环境有限的互动，并且运动自由度提升。虽然应用场景较为简单，主要用于展览和娱乐，但在运动控制和人机交互方面确实有很大进步。

本田机器人发展历史与第三代ASIMO（图源：本田Honda）

例如2003年索尼QRIO机器人配备了语音识别功能和人脸识别功能，能识(shi)别(bié)10种(zhǒng)面(miàn)部(bù)表(biǎo)情(qíng)；2011年(nián)，日(rì)本(běn)本(běn)田(tián)推(tuī)出(chū)的(de)第(dì)三(sān)代(dài)ASIMO，其(qí)利(lì)用(yòng)传(chuán)感(gǎn)器(qì)避(bì)开(kāi)障(zhàng)碍(ài)物(wù)等(děng)自(zì)动(dòng)判(pàn)断(duàn)并(bìng)行(xíng)动(dòng)的(de)能(néng)力(lì)，还(hái)能(néng)用(yòng)五(wǔ)根(gēn)手(shǒu)指(zhǐ)做(zuò)手(shǒu)语(yǔ)，或(huò)将(jiāng)水(shuǐ)壶(hú)里(lǐ)的(de)水(shuǐ)倒(dào)入(rù)纸(zhǐ)杯(bēi)；ASIMO不(bù)仅(jǐn)能(néng)上(shàng)下(xià)楼(lóu)梯(tī)、端(duān)茶(chá)倒(dào)水(shuǐ)，还(hái)曾(céng)在(zài)2014年(nián)指(zhǐ)挥(huī)底(dǐ)特(tè)律(lǜ)交(jiāo)响(xiǎng)乐(lè)团(tuán)。

高(gāo)动(dòng)态(tài)运(yùn)动(dòng)与(yǔ)交(jiāo)互(hù)能(néng)力(lì)提(tí)升(shēng)阶(jiē)段(duàn)

（2012-2020）：

该(gāi)阶(jiē)段(duàn)的(de)研(yán)发(fā)重(zhòng)点(diǎn)放在强化人形机器人的运动能力或交互能力上。强化学习技术让人形机器人在与环境的交互中不断优化动作和行为，情感识别和语言交互技术也得到显著提升。

POPPY机器人发展历史（图源：Inria）

例如，2013年美国波士顿动力公司研发的双足人形机器人Atlas具有超高的运动能力，可以熟练地完成垂直起跳、倒立、跨越障碍、后空翻，甚至和Spot机器人一起舞蹈，具有手脚都参与的跑酷功能。

2016 年法国 Inria Flower 实验室开发的第一款开源人(rén)形(xíng)机(jī)器(qì)人(rén) POPPY 上(shàng)市(shì)，它(tā)在(zài)教(jiào)育(yù)、科(kē)研(yán)、文化(huà)艺(yì)术(shù)等(děng)多(duō)个(gè)领(lǐng)域都(dōu)展(zhǎn)现(xiàn)出(chū)出(chū)色(sè)的(de)适(shì)应(yīng)能(néng)力(lì)。在(zài)教(jiào)育(yù)领(lǐng)域，POPPY 可(kě)以(yǐ)作(zuò)为(wèi)教(jiào)学(xué)工(gōng)具(jù)，帮(bāng)助(zhù)学(xué)生(shēng)更(gèng)直(zhí)观(guān)地(de)理(lǐ)解(jiě)机(jī)器(qì)人(rén)原(yuán)理(lǐ)和(hé)编(biān)程(chéng)知(zhī)识(shi)；在(zài)文化(huà)艺(yì)术(shù)创(chuàng)作(zuò)中(zhōng)，艺(yì)术(shù)家(jiā)们(men)借(jiè)助(zhù) POPPY 的(de)独(dú)特(tè)表(biǎo)现(xiàn)力(lì)，创(chuàng)作(zuò)出(chū)许(xǔ)多(duō)新(xīn)颖(yǐng)的(de)艺(yì)术(shù)作(zuò)品(pǐn)。

高度智能化发展阶段（2020至今）：

借助现代人工智能、计算机视觉系统等先进技术，人形机器人迈向智能化进阶之路。如今的人形机器人的感知与认知能力大大增强，大多具有高度仿生的躯干构型和拟人的运动控制，在重量、灵活性等方面都有显著进步，实用性大大增强。

Ameca机器人发展历史（图源：Engineered Arts）

例如，英国 Engineered Arts 为 Ameca 接入 GPT-3/4 后，它如获新生。Ameca 配备了高级传感器，具备面部和多种语音识别功能，可以自然地与人类互动，不仅能敏锐检测人类情绪，还能通过丰富的表情和手势传达信息。

在一些高端科技体验场所，Ameca 作为接待员，以亲切的交流和互动为访客提供服务，给人留下深刻印象。特斯拉公司的Optimus Gen2人形机器人的移动功能、灵巧性、平衡性和实时处理方面的功能也因为AI大模型的介入得到了显著提升。

Unitree H1机器人（图源：宇树科技）

虽然国内人形机器人的发展起步较晚，上个世纪90年代才开始研究。但近年来，国内人形机器人研发取得了显著进展，众多企业和科研机构积极投身其中，在技术创新和产品应用方面不断探索。宇树科技便是国内人形机器人领域的佼佼者。

在春晚舞台上，宇树科技的16台人形机器人Unitree H1与舞蹈演员共同演绎《秧BOT》，以“赛博秧歌”惊艳全场。这些机器人拥有19个关节，手臂额外增加3个自由度，实现了手绢旋转、抛掷回收等高难度动作。

这支名为《秧BOT》的舞蹈背后，是19个关节的精密协同，是每帧动作的AI映射，更是双足机器人在复杂动态平衡领域的突破性进展，充分展现了宇树科技在人形机器人研发方面的深厚实力。

人形机器人的发展前景令人充满期待。随着人工智能、材料科学、传感器技术等领域的持续创新突破，人形机器人将变得更加智能、灵活和强大。

在智能水平方面，它们将具备更强大的学习能力和推理能力，能够理解和处理更加复杂的任务和情境。通过与物联网、大数据等技术的深度融合，人形机器人可以实时获取和分析海量数据，实现更精准的决策和更高效的行动。

在运动能力上，新型材料和机械设计将使人形机器人的动作更加流畅、自然，能够适应各种复杂的地形和环境，完成更多高难度的动作。

Figure机器人（图源：Figure）

随着人形机器人技术的不断成熟，其应用场景也日益广泛。在工业领域，它们可以承担一些危险、重复或高精度的工作；在医疗领域，人形机器人可协助医生进行手术，凭借其高精度的操作能力，降低手术风险；在家庭服务方面，人形机器人可以担当家务助手，扫地、擦窗、洗碗等家务都能轻松完成；在教育领域，人形机器人作为创新的教学工具，能够以生动有趣的方式传授知识。

由此可见，人形机器人未来潜力巨大，不过仍面临多种挑战。

1.高算力：人形机器人的姿态、速度和力度等方面，都需要高算力，现阶段的计算能力面临巨大挑战。

2.弱技术：现在基础技术能力仍然很弱，现有的软件算法等不足以支撑人形机器人的大规模应用，仍需技术大幅创新。

3.高成本：研发成本高昂，高额亏损、研发投入高，是人形机器人行业的常态。

4.不安全：数据安全能力和体系均存在不足，面临安全隐私等问题。