一:未来预期和催化
两会召开的时间是3月4日和5日,也就是下周一、二消息面就会铺天盖地弹窗各位的手机,财联社这种快速媒体也会第一时间推送并影响盘面。
而写在政府文件里的《新质生产力 - 布局未来产业》章节里的,其实不是一般的机器人,而是人型机器人。也就是说,届时各委员针对“机器人”提案的内容大概率是“人型机器人”而不是工业母机、或者物流机器人或者叉车等等。
英伟达GTC是3月18日,其中最令人期待的一方面是英伟达在机器人领域的技术和应用,但东方精工的“提前抢跑”其实已经“兑现”了工业机器人的部分。
从嘉腾机器人官网产品来看,他们也确实没有人型机器人的产品。
二:Open AI、英伟达、国内顶级机构、政府高层一致观点
综合上述第一个部分来看,我们可以得出这么几个推导:
1、下周两会期间财联社不断推送的消息里,涉及人型机器人的委员提案,政策方向等等都会引起资金波动。结合最近几天大盘环境其实受到外部消息影响较大,且逻辑正宗票或者容量票,走势>情绪票。
2、英伟达GTC除了东方精工代表的工业机器人外,最有神秘感的应该是他和英伟达共同投资的“人型机器人公司-Figure",会不会发布什么重磅演示!而今日,大涨的轮动题材似乎把这条消息给淹没了。
三、为何一定要人形机器人
有小伙伴要问了,那么国家为啥一定要发展人型机器人?
我找到了优必选两位技术大拿在WAIC世界人工智能大会上的一段重要发言:
优必选科技CTO熊友军博士:
从工业革命以来,每一个时代都有它的标志性产品,第四次工业革命是智能化的改革,其标志性产品就是人形机器人。因为通用人工智能因ChatGPT的问世令人看到了曙光,而人形机器人则是通用人工智能技术的最佳载体。人形机器人是一个多任务、通用型的机器人平台,更能适应人类的生存环境,更易使用人类的生产工具,更易与人进行情感交流,人形机器人将赋能各行各业,最终走入家庭。生成式人工智能与人形机器人技术融合后,有望极大提高人形机器人产品迭代速度和提升交互体验,使人形机器人变得更加智能,从而加速走入家庭的进程。
熊友军认为,理想中的人形机器人一定是仿生设计的人形机器人。人的肌肉看起来这么小小一块,在能量的存储和释放上却是收放自如,在需要的时候可以展现极高的爆发力,但是现在人形机器人的技术暂时还做不到。所以此时争论是滚珠丝杠还是伺服驱动的技术路线没有太大意义,这些都还不是人形机器人的理想形态,百花齐放虽是热闹非凡,但要发展人形机器人,还需要全行业共同努力去推进产业的技术创新和应用发展。
人形机器人事业部负责人付春江博士:
具身智能是“感知、运动、环境”三者的映射闭环涌现,所解决的是物理世界的问题,而人形机器人,恰恰是最贴近生产生活的通用机器人的代表。付春江在论坛中表示,因此,人形机器人能够和具身智能非常好地结合,是具身智能的终极形态。
在两者的结合中,具身智能能够让人形机器人发挥更大的价值。首先,人形机器人作为通用平台要解决通用性的问题,而具身智能刚好解决了与环境感知交互过程中通用性的问题,让我们的人形机器人看起来更加智能化、更加实用。
其次,通过人形机器人,我们可以收集很多现实数据。在一些垂直领域,实践数据对于大模型也好,或者具身智能也好,都很重要。相比于仿真,人形机器人的实际操作,所提供的现实数据是更加有价值的。之后随着人形机器人的成本下降,数量的提升,相信能够收集的现实数据也会越来越多,采集难度也会不断下降。
另一方面,人形机器人也能推动具身智能的发展。付春江认为,人形机器人对于具身智能的最大意义,就是提供了与物理环境相交互的“身体”和更精密的运动感知能力。只要是人类进行生产生活的地方,人形机器人都能够提供协助,并且可以使用现有的工具完成任务。这样一来,人形机器人就可以帮助具身智能强化对现实世界的理解。
国外最顶尖的OpenAI联创Greg今早发文表示,我们正将OpenAI的多模态模型扩展到机器人上。
以上是国外最强人工智能公司和国内最强人形机器人公司的观点,下面再来看看政府大拿的观点:
黄奇帆:中国应抓住类似人型机器人、数字秘书智能终端等产品 使之成为万亿美元级别耐用消费品
重庆市原市长黄奇帆3月25日在中国发展高层论坛2023年年会上表示,第一、第二和第三次工业革命分别带来四到五个代表性的耐用消费品进入千家万户,成为风靡一时的消费主流。今后二三十年,中国应该抓住类似无人驾驶的新能源汽车、家政服务的人型机器人、提供数字秘书服务功能的智能终端等符合未来产业发展方向的整机产品,使之成为世界性的、具有万亿美元级别的耐用消费品。“在这些领域,中国有的跟跑、有的并跑,还有的领跑全球。要积极进行前瞻性布局、主动出击,围绕这些重点产业形成一批具有全球竞争力的产业链集群。”黄奇帆说。(中证报)
从行业来看:机器人未来国家鼓励的主要用途包括新能源车制造,医疗和养老、物流等等。
结论:
结合用途,再看国内外大佬的发言的关键:人形具身智能的核心就是从“人”的视角出发,做“人”做的事情,积累“人”的感受和经验,再通过“超级学习加速器”GPT大模型,通过训练做前述事情积累的视觉,听觉,触觉等五感的“数据要素”,来“涌现”出智能。
一但上述假设成立,那么为什么必须人形就成立了,比如,再怎么用英伟达生成式ai训练东方精工的叉车机器人,训练场景和数据特征决定了,永远无法训练出用于家庭和养老照顾能用的机器人。又比如机器狗再聪明,它再涌现出智能,也只能用于“宠物领域”或者“警犬领域”,你去给他投喂照顾老人,扶老人,喂药等场景的数据,没有用,因为他不具备执行这些任务的身体。
所以人形身体的重要性凸显出来了,这在人形机器人领域叫做人工智能身体AB(artificial body)。只有人形,才能在未来广泛用于只有人才能执行任务的复杂场景,比如新能源汽车组装里一些细微复杂,但重复程度很高的场景,人来做成本高,出错率也高。又比如家庭照料和养老照顾场景,工作多而细致,且容错率低,不够智能会对人构成危险。所以必须让人形机器人重走一遍“成为人”的场景,让他成为人力的替代,所以人形机器人智能领域两个必不可少的是AI X AB的组合。比如在MWC大放异彩的Ameca
四、技术面分析:
人形机器人新开概念以来,4天尚未走出趋势。我们回忆一下,但凡新设定的,在全球范围内引起轰动的新技术新题材,比如ChatGPT、AIGC、算力租赁、光模块CPO等等,有没有开概念后连前高都没有突破的?
五、炒作思路?
经过以上梳理,我们就明白了,人形机器人的炒作可以分为三个板块:硬件,软件,应用场景。类比炒作Ai时,硬件的算力芯片服务器光模块,软件的GPT大模型,和应用场景的AIGC,传媒,游戏等
那么人形机器人领域,炒作会和大模型路径相似吗?我认为有相似的地方,但也有差异的地方。
首先大模型GPT,为何迭代这么快,算力芯片当然是一个因素,但另一个不可忽视的是应用端的升级多在搜索问答机器人,办公智能化,传媒广告影视游戏等,特征是欧美在技术端或者用户端都占优势的市场。
我国是“制造大国”,也正朝着“制造强国”之路迈进,发展人形机器人作为AI具身智能的主体,我国相比后发的语言大模型GPT或者文生视频大模型,是有优势的。
由于前面说的Ai+AB的特点,更多了一些智能制造To B的场景,比如新能源整车厂制造领域的降本,比如养老机构用照料机器人等等。而这些领域的数据,显然更有利于地球上掌握这两个市场领域的国家。(兔子和小日子掌握了人形机器人领域最多的技术专利)
如果说GPT的技术细节,老美是领先兔子的,在人形这个领域,恐怕就不那么遥遥领先了。这一点直接用Sora,或者lightrick的效果 VS 央视的千秋诗颂(传媒领域对比)
VS
我之前曾有过一个比喻:
“很多人惊叹Sora算法精妙,别忽略它“阅片无数”,阅的是Ureal虚幻游戏引擎的视频数据,一个20年的游戏老粉不客气的说,虚幻引擎是美国公司,它的物理和光追特效也是全球领先的。大家都以为Sora学会了九阴真经,搞懂了物理效果。殊不知它学的其实是“小无相功”,依靠强大的算法和处理能力,用记忆力“复现”了虚幻引擎在游戏里的物理效果。进一步验证了:如果要让一个大模型特别神奇,那么给它投喂业内最顶级的“数据要素”是必不可少的。” 欧美极为发达的影视工业和3A游戏引擎给予了大模型最顶级数据养料。
为了验证这个比喻是否准确,我还查询了文心一言:
上面延伸出来了“中文在线”等传媒出版的炒作,本质就是这些出版商是语言类或者文生视频类大模型的“数据要素”
扯远了,拉回来:
而另一方面,在工业制造领域,国产新能源车厂打工 VS 马斯克人形或者Figure ai人形的视频效果可以得出,国产的智能程度其实并不差,至少没有在聊天机器人或者文生视频领域那样的巨大差距。
所以如果说AI大模型、芯片领域兔子是跟跑鹰酱,新能源车领域是领跑鹰酱,那么人形这个领域,用并跑(并行跑)这个词也是合适的。
而国外大网红“Figure AI”给人形机器人的行业定位,也印证了我的推断:
Figure AI成立于2022年,该公司已经开发了一款名为Figure 01的通用机器人,其外观和动作与人类相似,目标是能够用来执行替代人类的危险或者无聊的工作,例如在制造、运输和物流、仓储和零售等行业。这些领域被认为是“劳动力短缺最为严重的领域”。
而兔子,随着老龄化加剧,也会呈现这个趋势。上述推论不知对错,如果有专业人士请后台私信交流。但如果大致是正确的,那么炒作思路会很不一样。具体我会在深度挖掘里提及。
六、后续预期:
3月4~5日:两会关于新质生产力-人型机器人方面的表述
3月18日:英伟达GTC,明星公司Figure AI会否有爆款展示?
3月内:小米机器人第二代或将在第一季度发布
3月内:腾讯机器人行业解决方案或在第一季度发布