当前位置: 首页 > web >正文

「银河通用」创始人王鹤:人形机器人跳舞是预先编程,马拉松是遥控操作!

 温馨提示运营团队2025年最新原创报告(共210页)

图片

——

正文:

4月18日,在“第19届中国投资年会·年度峰会”上,国内头部人形机器人创企【北京银河通用机器人有限公司】(以下简称“银河通用”)创始人及CTO王鹤发表了题为“开启人形机器人的生产力时代”的主题演讲。

王鹤(教授):博士毕业于斯坦福大学,师从美国三院院士Leonidas. J Guibas教授,现任北京大学前沿计算研究中心助理教授、博士生导师,创立并领导的北京大学具身感知与交互实验室(EPIC Lab),北大-银河通用具身智能联合实验室主任以及北京智源人工智能研究院具身大模型负责人;2023年5月北京成立人形机器人初创公司[银河通用],目前公司累计融资超12亿元,处于国内人形机器人赛道第一梯队,并于2024年6月14日,发布公司首款轮式仿生机器人盖博特Galbot G1。

图片

图片

演讲中,王鹤教授提到:人形机器人正在经历由中国企业引领的运动时代,在运动时代,人形机器人从简单地形到复杂地形,到跑步,到拟人舞蹈,到一系列武术动作;同时提到,虽然当下人形机器人能够完成跳舞、跑马拉松等动作,但离真正的劳动力时代还有些距离。并进一步揭露这类动作的本质,人形机器人的跳舞、跑步,都没有用到视觉传感器,比如马拉松是背后有人在用遥控器遥控,让它往前跑;跳舞是这支舞蹈已经编好了舞,上台以后是不用看的,所有机器人各司其职;但这样的技术跟现在讲的生产力时代还不是一回事,毕竟没有活是闭着眼睛干的。并表示,我们真正发展的应该是手眼脑的协调,这一点是推进人形机器人迅速赋能千行百业的关键。

这也是首位人形机器人业内大佬对国内人形机器人频繁“炫技”这一现象的技术层面解读。

人形机器人最终可用,要做到四个可达:第一,移动可达,想让它去哪里就去哪里,包括避障;第二,操作可达,能抓什么就可以抓什么,或者把一个物品放在指定位置;第三,语义可达,比如拿苹果是为了榨;第四,价值和智慧可达。

小编早期曾在多篇文章中提到类似观点,“直膝行走”、“跳舞”、“跑步”、“空翻”等这类炫技视频都是完全依赖于遥控器和预先设定编程动作来完成;抗击打等干扰后保持动作稳定,则是依赖于控制算法;并梳理诸多人形机器人赛道行业乱象。

王鹤(教授)同时表示:未来,人形机器人即将开启生产力时代;而在从运动时代迭代到生产力时代的过程中,最先要发展的就是手眼脑的协调,这一点是推进人形机器人迅速赋能千行百业的关键;而这背后很关键的技术是一个实时视觉输入,闭环反馈的端到端的具身大模型(机器人“大脑”)。

图灵奖得主、Meta首席AI科学家杨立昆之前也提出类似观点,他表示:“过去一两年里,成立了很多机器人公司,他们制造人形机器人和类似的技术;很多人形机器人演示令人印象深刻,但实际很蠢;它们不能做人类能做的事情,不是因为它们缺乏身体能力,而是因为它们根本不够聪明(没有聪明的机器人“大脑”),无法驾驭现实世界的复杂性。

目前国内已有很多家人形机器人本体企业已宣布完成交付或者即将百台交付,如优必选、乐聚机器人、宇树科技、傅利叶、魔法原子、众擎机器人、松延动力、零次方等等,但深究交付或者预交付场景,皆是以教育、科研、数据采集场景为主,其次是展示、表演场景,落地工业制造场景的进展极少部分。

[银河通用]曾表示,预计在2024年第四季度正式预售,并计划在商超、车厂、工业等场景落地应用,但后续没有公布预售进展;目前根据官方披露,已与多家ToB客户(美团、奔驰、极氪等)进行战略合作。

2025年4月30日,公司发布旗下人形机器人Galbot最新视频,视频内容为:极氪智慧工厂迎来智能「新搭档」—— Galbot 正式上岗打工!导航讲解、语音互动、实时避障、拿取咖啡,还能给你来场灯光秀!全流程自主执行,全面展示多模态感知理解与泛化操作能力。

当然,具身智能机器人是一个复杂的AI+机器人+自动驾驶的系统性学术+工程问题,远期AGI的物理世界载体,受算力、软件算法、数据、硬件、工程化等多面因素影响。

加入知识星球“机器人头条”,与910+位行业从业者一起,深度探讨“具身智能&人形机器人”赛道;

http://www.xdnf.cn/news/5481.html

相关文章:

  • C语言文件读写函数详解与示例(fread、fgets、fgetc、fscanf、fwrite、fputs 和 fputc比较)
  • 专业课复习笔记 5
  • 可视化赋能电子围栏:开启智能安防新视界
  • 9.1.领域驱动设计
  • 大模型应用中常说的Rerank是什么技术?
  • 第26节:卷积神经网络(CNN)-数据增强技术(PyTorch)
  • URP - 能量罩实现
  • Scala 中累加器的创建与使用格式详解
  • 【面板数据】省级农业及农村现代化指标数据(2011-2022年)
  • C++初阶-string类的增删的模拟实现
  • C# 通过ConfigurationManager读写配置文件App.Config
  • 如何实现并运用责任链模式
  • 英语时态--中英文对“时间”的不同理解
  • 抽奖系统-基本-注册
  • Redis从基础到高阶应用:核心命令解析与延迟队列、事务消息实战设计
  • JVM 监控
  • 【Java学习笔记】多态
  • HTML5中的Microdata与历史记录管理详解
  • 安装typescript时,npm install -g typescript报错
  • .Net HttpClient 处理响应数据
  • 每日一题洛谷P8615 [蓝桥杯 2014 国 C] 拼接平方数c++
  • 被一个人影响情绪是爱吗?这 3 个真相越早明白越好
  • AI面经总结-试读
  • 深度解析六大AI爬虫工具:crawl4ai、FireCrawl、Scrapegraph-ai、Jina、SearXNG、Tavily技术对比与实战指南
  • COT思维链:SequentialChain 方法有哪些参数;优化后的提示词
  • ES面试题系列「一」
  • MySQL的索引分类
  • 软件体系结构(Software Architecture)
  • IDEA:如何设置最上面菜单栏一直显示出来
  • 图片转ICO图标工具