来源:智能车参考

  知道DeepSeek这把“火”迟早点燃车圈,但没想到这么快。

  1月20号刚刚发布的大模型R1,就是让全世界尤其是海外“震惊”的那一版,现在已经官宣上车。

  更没想到,车圈率先拥抱国产顶尖大模型能力的,是它。

  谁上车了DeepSeek大模型?

  率先上车DeepSeek大模型的是它杭州老乡——吉利汽车。

吉利率先宣布DeepSeek上车  第1张

  给用户的体验升级,目前集中在人车交互层面。

  后续吉利智能汽车AI不仅能对用户的模糊意图实现精准理解,进而准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,并为用户主动提供车辆控制、主动对话、售后等等服务。

  例如自动调整座椅、提醒车辆保养、拥堵时推荐绕行路线,或根据用户日程提前规划充电等等。

  可以理解为对吉利原有的交互模型一次全面的升级,彻底打通了车机UI、交互助手与数千种汽车原子化功能的壁垒,“可见即可说”不再限定在某些特定领域,扩展到全车智能。

吉利率先宣布DeepSeek上车  第2张

  据透露,吉利主要使用了知识蒸馏手段,智能车参考之前详细科普过,主要通过让一个较小的模型学习较大模型的预测分布来获得类似的表现。出现个别的能力不足和输出异常,可以补充有限数据使用强化学习的方案调整。

  吉利具体怎么做的没细说,不过可以推测应该是将617B参数的R1大模型,基于星睿自身的车控FunctionCall大模型、主动交互端侧大模型等核心组件进行蒸馏,将R1大模型训练成适应智能汽车交互场景,并且能在车端跑起来的状态,之后在融合进吉利自己的技术体系里。

  之所以能这么操作,离不开R1大模型本身的技术特征。

  与之前常见的大语言模型不同,R1显著的特征有两个,一是多模态能力更强,二是训练成本更低。

吉利率先宣布DeepSeek上车  第3张

  前者来自R1的架构级创新,包括Multi-Head Latent Attention(MLA)、DeepSeekMoE和Multi-Token Prediction(MTP)。

MLA解决长序列处理的效率问题,将过程中的键和值压缩成低秩的潜在向量,显著降低了推理过程中的内存占用。这种机制使得DeepSeek-V3能够处理如整本书或高分辨率图像这样的长序列,同时保持较低的计算开销。

MoE模型通过将任务分配给不同的“专家”来处理,即在处理每个 token 时,仅有部分参数被激活,这使得模型能够聚焦于一小部分经过高度训练的专家模块,从而快速且精准地给出答案。

MTP的意思是多token预测目标,即在每个步骤中预测多个未来的token。这种方法增强了模型的文本生成能力,特别是在长文本生成任务中,能够生成更加连贯和上下文丰富的文本。

  后者来自训练过程中的创新,比如FP8混合精度训练、DualPipe管道并行性和跨节点全对全通信内核等优化技术,实现了高训练效率。完整训练需要278.8万个H800 GPU小时,成本约为557.6万美元,仅为传统大模型数十分之一。

  R1发布两周左右就落地上车,核心依然离不开它强大的多模态能力,以及低廉链接的训练方式、成本。

吉利率先宣布DeepSeek上车  第4张

  实际上R1相比以往任何基础大模型,都更容易被应用到千行百业的具体场景中。

  而应用在智能汽车上,上车方式不是简单在吉利的车机上安装一个DeepSeek应用,背后DeepSeek给吉利的技术支持,不再仅仅局限于授权一个API,而是把震惊全世界的R1大模型能力,融合进吉利自己的技术体系。

  车企没有AI能力,接不住DeepSeek

  何小鹏是第一个公开谈论DeepSeek的车企老板,昨天刚刚在内部开工信中承认DeepSeek在AI领域取得了显著成就,并预测AI将在未来十年驱动汽车行业产生巨大变革。

  随着吉利的新进展,后续DeepSeek毫无疑问会迎来一波上车热潮,各家争先恐后官宣。

  DeepSeek大概率会成为类似华为ADS、高通8295、英伟达Orin一样的旗帜图腾,深深烙印在用户思维中,成为智能车的核心产品力和卖点之一。

  不过和这些具体的产品功能相比,DeepSeek对于整个智能汽车产业影响可能更深远。

吉利率先宣布DeepSeek上车  第5张

  吉利与DeepSeek的合作方式,是将R1模型的知识能力蒸馏融合进自研模型。实际上这也是目前DeepSeek在千行百业落地的模式。

  因为DeepSeek率先实现了高性能低成本、泛化能力好又方便部署的大模型,不必(或者说当下也没条件)分出团队针对某种应用场景专门研发模型。

  所以作为车企,没自己的东西,还真接不住DeepSeek:必须具有大模型基础能力和产品,以及综合研发、维护、迭代的体系化AI能力。

  这也是从车企角度看,吉利会成为第一个官宣上车DeepSeek的原因。

  整个星睿大模型是一个技术体系,吉利已经搭建了3年之久。包括车控大模型、主动交互端侧大模、云端大模型、多模态融合引擎、算力基础设施等等。整合了自然语言处理(NLP)、计算机视觉(CV)、语音识别、多模态交互等AI技术,支持车辆控制、语音交互、场景化服务等功能。

  DeepSeek“上车”后,也不会局限于只能座舱的交互应用。未来,DeepSeek R1的生成能力可以用来模拟复杂驾驶场景,加速算法迭代…

吉利率先宣布DeepSeek上车  第6张

  所以最前沿的大模型技术进入汽车行业,眼下还不是大水漫灌让所有玩家水涨船高,只有自身AI能力积累最深的头部车企,才能接住最早的一波红利。

  以前是AI公司专门成立汽车团队和子公司,以项目形式作为乙方交付;国产基础大模型突破后,这种合作方式被颠覆,车企需要根据大模型的特征调整自己的技术体系和功能落地。

  当然对车企本身自研能力和大模型基础提出更高要求。