今天,我们有幸邀请到商汤科技的田丰院长,与我们深入探讨当前热门话题:人工智能+。首先,请您从大模型+机器人的角度,分享下您的看法。
田丰:从英伟达黄仁勋先生的未来战略来看,如果我们对比OpenAI与英伟达,可以发现背后涉及大模型的两条发展路径。第一条路径是基于全球人类知识数据训练出的GPT基础大模型,它对人类知识有着深刻的理解。第二条路径是认识到仅从互联网获取数据是不够的,未来的发展需要从物理世界中获取数据,例如工厂、生产线或供应链。黄仁勋先生正在布局一个宏大的战略,不仅涉及底层的GPU芯片,还包括Omniverse这样的工业平台。
目前,宝马、奔驰、西门子、三星等工业制造企业都已接入Omniverse Cloud。这是一个云平台,利用一套AI算法分析产业链中的各种数据。从工厂的规划、设计到部署、调试,甚至培训和运营,都可以在Omniverse Cloud上进行。
以宝马在亚洲建厂为例,可以由多个国家团队在云平台上共同设计,将生产线的虚拟设备放入数字工厂中运行。建成后,类似有一个线上数字工厂与实体工厂同步运作,简单讲,就是打造一个从物理世界、工业领域汇聚数据,进行工业智能制造全流程管理的模型平台。下一步的重点是如何从物理世界获取更多与生产相关的数据,并利用人类知识进行各种生成式应用。我将这称为“新智生产力”。
有人称去年为大模型的元年,今年则是机器人技术爆发的一年。今年,我们需要特别关注美国的3-4家公司。首先是英伟达,在GTC大会上,60%的时间都在讨论Omniverse工业领域的AI平台,目前已有许多机器人创业公司接入。其次是特斯拉,马斯克不仅涉足大模型Grok和计算中心,还致力于机器人技术。第三家是谷歌,拥有Gemini大模型和远超OpenAI的算力中心。最后是OpenAI与微软的合作,他们也投资了两家机器人公司。这四家公司正全力将物理世界融入大模型中,或者可以说是将大模型嵌入到物理世界的机器人执行体中。
任泽平:传统的机器人只能执行单一功能,现在我们称之为具身智能。那么,具备人工智能的机器人与以往的机械手臂有何不同?它们将带来哪些变革?
田丰:过去制造机器人的首要任务是解决零部件问题。例如,国内一些机器人创业公司致力于让机器人关节的电机更小巧、更轻便。
第二步,如美国的机器人创业公司,广泛采用仿真测试环境。例如,谷歌在加州湾区的实验室里,线下有十台机器人进行打扫卫生等任务的训练,而线上则有超过一千个虚拟机器人在不停地进行训练。线上训练仅消耗算力,大幅节约成本。训练到一定程度后,将虚拟的机器人模型移植到物理机器人上,这一过程可以随时同步,显著加快了机器人的训练进程。这可以理解为在仿真环境中的快速进化。
第三步,是将机器人投入到真实的生产环境中进行测试。例如,特斯拉的擎天柱机器人在超级工厂中安装汽车。谷歌则专注于开发通用人工智能机器人。以往的机器人在生产线上只能执行几个固定动作,且需预先编程。现在的机器人则是通用型,通过摄像头和传感器感知不同的零部件。它们甚至具备大模型带来的人机交互和常识能力,无论是生产线上的柔性生产还是日常生活中的各种问题,它们都能灵活应对,无需预先训练。
当然,大模型本身需要经过预训练。一旦将大模型与机器人结合,就可以根据人类的自然语言指令,让机器人灵活执行各种非标准任务,这也带来了“泛在感知”和“泛在智能”的概念。黄仁勋先生甚至认为:在未来,所有移动的物体都将是机器人。在我们有生之年,可能会看到AGI(人工通用智能)与机器人的结合。
在软件层面上,我们认为机器人中应该集成的是大模型构成的智能体。智能体与大模型的区别在于:大模型依靠的是自身能力,即基础模型,具有广泛的应用能力,但存在边界。而智能体承认自身能力的局限性,能够调用其他软件和工具,类似于管理者,能够协调软硬件资源,完成复杂任务的分配。
任泽平:您刚才提到,将大模型嵌入机器人,使其更加智能化,能够实现更加人性化的生产。那么,未来面向企业和消费者的应用空间应该会非常广阔。
田丰:任博的见解非常独到。我们可以用三个圆圈来表示这种应用需求。左边的圆圈代表物理世界,右边的圆圈代表人类的精神世界,中间的圆圈则是大模型存在的数字世界。实际上,我们可以看到两个方向的应用需求:一是工业领域,它越来越逼真地重现物理世界,更多地表现为功能性工具,如完成生产制造的机器人;另一个方向是大模型越来越能够与人类共情,例如目前非常流行的虚拟宠物、虚拟男女朋友等。
任泽平:这些虚拟伴侣既能聊天,又能不断学习用户的爱好,如果真的成为人类的虚拟伴侣,那么生育率是否会大幅下降?
田丰:我们目前观察到,年轻人将这些技术作为一种游戏来玩。外向型的人更愿意在现实中进行社交,内向型的人则可能设计自己的分身。
例如,一位男性大学生正在上课,没有时间回复女朋友的信息,他可以让数字分身,即语言大模型挂机回复,以促进两性关系的和谐。如果对“分身”的性格不满意,可以根据MBTI进行优化,比如从偏知性改为偏感性。白天与真实的男朋友相处,晚上与虚拟男朋友聊天,我认为这可能成为未来的常态。当前的大模型正在不断为人类提供情感价值。真正的大模型,未来不会以取代真人为目标,而是作为情感的补充。
电影《非诚勿扰3》中有与机器人和真人谈恋爱的情节,这代表了人类多了一种选择。如果人们对真人寄予希望和感情,那么机器人就只是游戏工具。如果在两性关系中受过伤害,人工智能的语言模型可以成为心理咨询师,帮助人类走出失恋的阴影,重新面对真实世界。机器人制造商、大模型研发企业和运行平台都肩负着社会责任。任何科技的出现,都应符合人类伦理,不论手机还是AI,应缩短人与人之间的距离,也不能影响人类的传宗接代。无论是机器人还是大模型,都必须清楚自己的本职工作和使命。
《流浪地球2》中有一句台词从科幻角度阐述了数字生命的意义:数字生命的意义在于什么?我个人觉得在于辅助人使得人类文明得以延续。”在未来的星际大航海时代,人类可能会先派遣有情感的机器人去开发其他资源行星,在改造到一定程度后,再迎来人类的宇航员。按照刘慈欣的观点,人工智能、机器人、具身智能是跨星际文明的一张船票。如果没有人工智能和机器人,我们可能仍处于地球母亲的子宫中,无法走出太阳系。因此,数字生命对人类文明的进化具有极其重要的意义。
任泽平:人工智能有几个核心要素:算力、算法、数据、模型以及各种应用。那么,中国在算法和数据方面是否具有优势?我们在发展大模型时应该在哪些维度上发力?
田丰:任博的问题直指人工智能竞争力的本质。我们先讨论优势,再谈挑战。优势方面,有传言称OpenAI启动了一个包含一百万块GPU的集群来训练GPT,我相信GPT5和GPT6都在其训练过程中。GPT-4有17万亿的参数量。而现在,当我们训练具有百万亿参数量的模型时,能源消耗巨大,对电网造成了巨大冲击。人工智能的终极问题在于能源。中国在全球新能源中位居前列,新能源成本低廉,如生产的光伏组件、中西部广阔的土地成本。我们完全有能力在青海、甘肃、新疆等地建立集中式的光伏厂或风电厂。如果未来的超大规模AI智算中心紧邻核电站或光伏集群建设,中国将具有比较优势。许多欧洲和东南亚国家并不具备如此广阔的土地优势。
第二是数据方面的优势。无论是OpenAI还是中国的一些领先人工智能企业,都在进行合成数据的生成。通过虚拟的数字孪生环境,使机器人、自动驾驶汽车、无人机产生更多的合成数据。这种合成数据是大模型的未来。有预测显示,到2025年合成数据将超过线年合成数据将完全替代真实世界的数据。因此,合成数据是未来的战略要地。从传统数据优势来看,中国14亿人口产生的数据量自然超过美国3亿人口,中国130多亿的智能终端产生的物理数据也超过美国30多亿的智能终端。但在合成数据方面,我们必须加大科研投入。
第三是算力。OpenAI和微软计划投资1000亿美元,打造一个相当于现有算力100倍的超级计算机——星际之门。OpenAI认为,其算力目前明显落后于谷歌。谷歌在英伟达发布BG200时,大量采购了最新的芯片,而且目前本身就是全球云计算领域的领头羊。谷歌拥有自己的TPU,同时还在采购最先进的芯片,有可能打造出地球上最大的AI计算中心。微软实际上也提出了条件,如果OpenAI不能继续证明GPT5取得重大突破,那么1000亿美元的投资可能不会那么快到位,纳德拉会根据AI近期的进展来决定是否分期投资。话说回来,所有人工智能企业都面临着算力和数据的短缺。Transformer模型决定了尺度定律,投入越多的算力、越多的数据,模型的效果就越好,参数量也越大。人类的大脑有1000亿的神经元,但功耗很小。那为什么AI还没有达到通用人工智能?人类其实拥有非常节能、环保而且效率很高的思考模式和神经网络。回到第一性原理,就有可能出现下一代架构,甚至颠覆式创新现在的Transformer。
现在很多大模型都在卷算力,一秒钟回复答案。但OpenAI等公司却在开发围棋里的“长考”。思考时间很长,但给出的是一个非常严谨的答案,通过反复推敲,多个数据源的交叉验证。真正的科学研究是需要这种“长考”的。我相信在未来很快会出现推理更精准可靠,贴近人类科研思维的模型架构。中国受到的算力限制更紧迫,所以更有动力去探索新的架构模式。美国依靠“大力出奇迹”的惯性时间会更长一些。
历史总是辩证的。当年钱学森先生回到中国研发导弹、两弹合一、卫星等被超级大国封锁的前沿技术。当时美国每个零件做的精度都比我们小几个数量级。钱学森先生就研发出了工程控制学,每一个零件的精度都比较差,但能通过一套有效的体系达到整体最优。科研竞赛就像打冰球,想要抢球就得看到球运动的方向,下一个位置在哪。所以中国现在更多的是要去思考下一代的Transformer架构。下一代能够颠覆GPU的架构是什么?下一代的算力集群应该怎么提升整体的效率?
任泽平:从算力到数据,中国目前还很难达到美国的水平。但是在全球来看,稳居第二问题不大。我们未来可能会利用丰富的绿电资源,而不是像美国那样纯粹堆算力。当人工智能进入大规模商用以后,丰富的应用场景可能就爆发出来了。中国大规模的生产能力和降成本的能力是非常强的。
我们在光伏、锂电、新能源汽车领域势头迅猛。现在特斯拉都不敢公布Model 2了,因为它发现中国已经推出十万人民币以下的新能源汽车了。马斯克宣布在8月8号将推出Robotaxi,无人驾驶的出租。
m6米乐主页 上一篇:国际观察:以中美对话合作推进人工智能全球治理 下一篇:KIMI、SORA、AIGC等概念股持续飙升人工智