李想带着抱负，走向AI「无人区」

liukang20242个月前 (05-24)在线吃瓜653

抱负的AI Talk 第二季，时隔130天后，总算回归。

最新一季访谈中，李想不只谈到了对人工智能的最新考虑，以及当下辅佐驾驭的状况，还触及了DeepSeek、特斯拉、苹果等很多AI公司。

在李想看来，现在辅佐驾驭尽管处于十字路口，但对抱负影响不大，今日的辅佐驾驭就像正处于黎明前的黑暗时刻，辅佐驾驭职业遇到了问题，恰恰是抱负证明自己价值地点的时刻。

早在第一季，李想在访谈上就提出了自己的观念，抱负是一家人工智能企业，不露锋芒要做的不是轿车的智能化，而是人工智能的轿车化。

面向人工智能年代，抱负的逻辑是当AI成为生产东西时，人工智能才会迎来迸发时刻。

现在，人工智能的轿车化，抱负现已有了具象的体现——VLA 司机大模型。

李想也坦言，做 VLA司机大模型，像走向一个无人区，Deepseek 没有走过这条路，OpenAl 没有走过这条路，谷歌、Waymo 也没有走过这条路。

AI要成为生产力东西

访谈刚开始，李想就抛出一个现实——尽管人工智能国内开展很快，但自己每天的喜欢时刻并没有削减，仍是在添加。

这是由于大多数人还把AI作为信息东西，李想以为AI只是作为信息东西是不完美的，某种程度上，眼下的 AI 仍然是在做熵增，会添加很多的无效信息、无效效果、无效定论。

正视AI的东西特点，也是李想在曩昔的几个月，在内部跟很多人要点评论的问题。

李想把AI东西分为三个层级，分别是信息东西、辅佐东西和生产东西，作为信息东西时，仅具有参阅价值。

如果把AI视为辅佐东西，不能自制提高功率，比方现在的辅佐驾驭功用，或许用语音的方法来进行导航，翻开美团或许听歌等，它会让不露锋芒的功率更高，但仍然离不开不露锋芒。

什么时分，能真实改动不露锋芒的喜欢的效果以及削减喜欢时长，就会变成生产东西，也便是Agent（智能体）的诞生，在李想看来，那时才是人工智能真实迸发的时刻。

“判别Agent（智能体）是否真实智能，关键在于它是否成为生产东西。就像人类会雇佣司机，人工智能技术终究也会承当相似责任，成为真实的生产东西。”

为了迎候这个时刻，抱负的“VLA司机大模型”应运而生，也不能自制称为司机 Agent，在李想看来，VLA司机大模型便是成为交通范畴专业的生产东西。

其实在一个月前，抱负轿车的下一代自动驾驭架构VLA就现已露脸了，VLA是视觉-言语-行为大模型，它将空间智能、言语智能和行为智能统一在一个模型里，赋予了模型强壮的3D空间了解、逻辑推理和行为生成才干，让自动驾驭不能自制感知、考虑和适应环境。

所以它既是一个能与用户、了解用户目的的智能体，也是一名听得懂、看得见、找得到的专属司机。

而李想期望这个智能体，能像人类司机相同喜欢，将来也能像人类司机那样发明商业价值。

在访谈中，抱负还展现了搭载了VLA司机大模型的 demo 演示视频，在视频里，抱负的这个“司机 Agen”展现了和人类司机相似的智能才干，不只具有现有的优异辅佐驾驭才干，并且还能直接通过语音的方法和人类驾驭员高效交互。

比方在通过高速收费站时，直接说出“走人工”三个字，体系就不能自制从 ETC 收费通道转向人工收费通道，在日常驾驭和泊车环节，也不能自制通过“前方掉头”、“C 区泊车”、“靠边泊车”等简略指令，调整行车或泊车的道路。

换句话讲，人类和VLA之间相似人和代驾的联系，人们怎样和代驾说，就怎样和司机Agent说。

在主持人发问试驾VLA（司机大模型）的车有没有惊喜时刻时，李想较为“凡尔赛”地表明，挺难有什么惊喜时刻，由于当你把它作为一个人看待时，它所呈现出的体现就很正常。

当然，当普通用户第一次看到 VLA 的测验视频的时分，仍是会惊奇于它的体现。

在谈及VLA司机大模型的时分，李想特意先感谢了DeepSeek，正是由于最初DeepSeek的开源，才让VLA推出的速度比本来的预期要快。

依照李想的说法，其内部本来计划要到今年年底才干做出不能自制满意需求的言语模型，但DeepSeek一开源，瞬间就加快了9个月的时刻。

不过DeepSeeK的开源只是加快了 VLA（视觉言语举动模型）的L（language 言语）的部分，像VL（视觉和言语）的组合语料，无论是OpenAI仍是DeepSeek，都没有这样的数据，也没有这样的场景和需求，只能自己来做。

依照李想的话说，“我不能自制站在伟人的膀子上，可是它只是我其间的一部分”。

其更是在访谈上直言，自己之所以将自研的整车操作体系抱负星环OS给开源了，一方面是出于对DeepSeeK的感谢，一方面也是由于受到了那么大的协助，所以自己以为应该对社会做点什么奉献，不让职业这么卷。

辅佐驾驭的三个阶段

VLA就像一个「司机大模型」，不能自制像人类司机相同喜欢，不过 VLA 的诞生不是骤变，而是进化，究竟“没有办法直接吃第十个包子”。

整个进程阅历了三个阶段，对应了抱负轿车辅佐驾驭的昨日、今日和明日。

第一阶段，李想将其比喻为“昆虫动物智能”：通过机器学习感知合作规矩算法的分段式辅佐驾驭处理计划，有既定的规矩，一起还依靠高精地图，相似蚂蚁完结任务的方法。

只是百万量级的参数天然无法完结更杂乱的工作，因而需求不断地加限制规矩，构成相似“有轨交通”的方法。

这对应了抱负轿车自2021年起，通过自研依靠规矩算法和高精地图的辅佐驾驭计划。

而第二阶段则对应了抱负轿车自2023年起研讨，并于2024年正式推送的端到端+VLM（Vision Language Model，视觉言语模型）辅佐驾驭。

李想将其称之为“哺乳动物智能”阶段：通过端到端大模型学习人类驾驭行为，比方马戏团里的一些动物像人类学习怎样骑自行车，它们能学会人类的各种行为，但其本身对物理国际的了解并不充沛。

因而需求通过三维图画判别本身速度和轨道以及在空间中所在的方位，尽管足以应对大部分泛化场景，但很难处理从未遇到过或特别杂乱的问题，此刻需求合作视觉言语VLM模型，但现有视觉言语模型在应对杂乱交通环境时只能起到辅佐效果。

在端到端的根底上，才干来到第三阶段，也便是李想说的“人类智能”的阶段，给出的答案便是VLA司机大模型。

它能通过3D和2D视觉的组合，完好地看到物理国际，而不像VLM仅能解析2D图画。一起，VLA具有完好的脑体系，具有言语、CoT（Chain of Thought，思想链）推理才干，既能看，也能了解并真实履行举动，契合人类的运作方法。

李想还列举了端到端+VLM（视觉言语模型）架构或许无法处理，但VLA（视觉言语举动模型）不能自制处理的corner case（长尾事例）。

怎样才干像人相同开车

至于怎么操练VLA，李想也做了具体的论述，整个进程就像人学会怎么开车相同。

第一步是预操练，这一步的方针是让AI具有对国际和交通的根底认知，就像人先学习各种交规常识相同。

这一步放入满意多的Language，Vision的语料和token（词元）。其间Vision包括两个部分，一部分是物理国际的3D Vision，另一部分是高清2D Vision，然后再放入VL（视觉和言语）联合的数据，例如将导航地图和车辆对导航地图的了解一起放入操练会集。

然后构成一个VL的基座模型，然后会被“蒸馏”成一个更小、能更快运转的约 32B 端侧的模型，确保它运转速度满意得顺利。

第二步是后操练，在VL的根底上参加Action，Action部分的后操练相似人类去驾校学开车，不能自制直接从视觉到了解再到输出，构成一个初级的 VLA「端到端」模型。

李想还着重，不会做长思想链，一般是两步到三步，不然长时延会无法满意安全性。别的，当 Action 完结后，VLA 还会依据性能做4-8秒的分散模型（difussion），猜测轨道和环境。

第三步归于强化学习，首要分为两部分，一是RLHF，根据人类反应的强化学习，会参阅很多人类司机的驾驭数据，当它做得好时得到鼓舞，做得欠好的时分，会得到反应。

一起，抱负轿车建立了一个十分传神的虚拟“交通国际”，有点像一个超高水平的模拟器，让AI在里面自己操练，这部分归于朴实的强化学习。

在操练指标上，抱负会通过G值来判别辅佐驾驭的舒适性，一起做磕碰的反应，还有交通规矩的反应。

不难看出，第三步，就相当于人类拿到驾照后，来到社会上来开车来强化自己的驾驭技术。当这三个过程完结了今后，VLA 不能自制跑在车端的模型其实就产生了。

但还没有完事，这时尽管有了VLA司机大模型，但还无法做到人类跟VLA的交互，这时分抱负就需求建立一个司机 Agent（智能体），用天然言语教辅佐驾驭体系应该怎么开车。

如果是一些短指令，通用的短指令VLA司机大模型直接就处理了，不需求再通过云端。如果是一些杂乱的指令，其实先要到云端的 32B 的基座模型那里，VL（视觉和言语）处理完今后，再整个交给VLA司机大模型来进行处理。

在李想看来，VLA是现阶段才干最强的架构，它的才干是最接近人类的，甚至有时机超越人类。但不一定是终究极的架构。

“是否是一个功率最高的方法，是否有功率更高的架构呈现，这些还要打个问号，我以为大概率仍是会有下一代架构的。”

就像他说的那样，前面没有任何人走过这条路，抱负其实走的是一个无人区。

“抱负曾经走的是轿车的无人区，今后走的是人工智能的无人区。”

本文源自：超电实验室

告发/反应

标签: 李想 AI 无人区抱负走向

返回列表

上一篇：一流大学怎样建？全国人大代表、校长李蓬院士来答复！

下一篇：「佳作赏识」扬子晚报姑苏小记者工作室2024年第21周优秀作品“新鲜出炉”，欢迎投票！

此役，湖人双核勒布朗-詹姆斯和卢卡-东契奇“双拳反击”，两人合砍64分21次助攻。而跟着东契奇与湖人的磨合日渐深化，湖人在近期的情况也变得益发不行阻挠。

“他（东契奇）正变得越来越自若，不仅仅是与球队的战术合作，一起也包含与球迷以及洛杉矶这座城市的联络，”詹姆斯赛后说道，“我以为他每天都会变得更好，显然在健康方面也是如此。他的腿部情况正越来越好，咱们会持续尽力提高自己。”

本场竞赛，詹姆斯全场得到34分8篮板6助攻，东契奇全场得到30分8篮板15助攻。

（NBA官网）

红领巾吃瓜网

李想带着抱负，走向AI「无人区」

相关文章

詹姆斯：东契奇正益发自若他每天都会变得比之前更好

吃瓜爆料入口51cg吃瓜51cg 今日

五一上新丨新一批浙里乐土来啦，快来家门口打卡

周末大消息AI端侧有望率先修复3大龙头止跌企稳周一必看！2025年6月17日

孙俪主演新剧《蛮好的人生》开播，烟火气折射人世百态

五一 · 劳动者容貌｜何秀波：用“探头”照亮大众的健康美好

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

红领巾吃瓜网

李想带着抱负，走向AI「无人区」

相关文章

詹姆斯：东契奇正益发自若 他每天都会变得比之前更好

吃瓜爆料入口51cg吃瓜51cg 今日

五一上新丨新一批浙里乐土来啦，快来家门口打卡

周末大消息AI端侧有望率先修复3大龙头止跌企稳周一必看！2025年6月17日

孙俪主演新剧《蛮好的人生》开播，烟火气折射人世百态

五一 · 劳动者容貌｜何秀波：用“探头”照亮大众的健康美好

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.

詹姆斯：东契奇正益发自若他每天都会变得比之前更好