跳转到主内容

DeepSeek-V4大模型发布在即,野村研报看好:将有效打破“芯片墙”与“内存墙”

智通财经APP 智通财经APP · 2026.02.13 12:10 · 2,022阅读
来源: 智通财经APP
发稿编辑: 智通财经APP
DeepSeek-V4大模型发布在即,野村研报看好:将有效打破“芯片墙”与“内存墙”

来源:智通财经APP

即梦、千问……国产头部AI公司推出的各种应用争奇斗艳,正成为近期的一道亮丽风景线。而现象级应用层出不穷,背后是国产大模型的日趋成熟。

近日,野村证券发布一份AI主题研报,聚焦DeepSeek即将发布的新一代旗舰大语言模型V4。野村认为,作为去年推出DS-V3/R1并搅动全球AI产业链的玩家,DeepSeek的全新技术布局不仅将推动中国AI产业链创新周期加速,更将通过技术创新,在算法与工程层面缩小中国与全球大模型产业的差距。

野村研报认为,DS-V4的技术突破将有效打破“芯片墙”与“内存墙”的桎梏,赋能本土算力硬件与AI应用双向发展,推动中国开源大模型生态走向成熟。

Part.01 核心底牌:mHC+Engram双技术

野村判断,DS-V4将深度融合DeepSeek近期发布的两篇重磅研究论文中的核心技术——mHC和Engram,这两项技术均针对当前大模型发展的核心瓶颈,从层间信息流动和存算协同两个维度实现创新,在提升模型性能的同时进一步降低训练与推理成本,代表了大模型产业从“规模竞争”向“架构与系统优化”的重要转向。

mHC:重构层间信息流动

当前基于transformer架构的大模型训练,高度依赖“残差连接”实现数百甚至数千层网络的信息传递,但这种简单的信息传递方式在模型层数指数级增长后,已成为训练效率与稳定性的核心瓶颈。

行业曾尝试通过“超连接”实现更复杂的层间通信,但却引发了信号放大、内存访问开销过大、训练失败率高等问题。

DeepSeek提出的mHC(流形约束超连接)机制,核心是在超连接的基础上增加严格的数学约束,通过打造多内部信息流,同时避免信号的放大或破坏。

其核心技术包括三方面:一是双随机矩阵约束,将残差连接矩阵限制为行和列均为1的非负矩阵,有效缓解梯度爆炸问题;二是通过Sinkhorn-Knopp算法将矩阵投影到双随机矩阵流形;三是保持恒等映射,确保深度信号传播的稳定性。

为将mHC理论落地,DeepSeek还在系统工程层面进行了多重优化:通过内核融合减少内核启动开销与内存访问,通过重计算缓解训练中的内存压力,通过流水线并行优化(DualPipe)解决mHC带来的通信延迟问题。

从实验效果来看,DeepSeek在DS-V3 27B参数模型上的测试显示,融入mHC的模型在多个基准测试中全面超越基线模型和普通超连接模型,其中推理类任务(GSM8K、MATH)提升尤为显著——GSM8K(8-shot)准确率从46.7%提升至53.8%,MATH(4-shot)准确率从22.0%提升至26.0%,BBH、DROP等自然语言理解任务的表现也实现5%-7%的提升。

Engram:解耦存算协同,打破大模型“内存墙”

如果说mHC解决的是训练效率问题,Engram(条件记忆模块)则聚焦于训练与推理的内存效率优化,核心是补充MoE架构的不足,通过解耦内存与计算,缓解大模型发展中的“内存墙”痛点,这也是针对中国AI产业硬件短板的关键技术创新。

当前大模型的任务包含两大核心类型:需要深度动态计算的组合推理,以及涉及大量静态文本模式的知识检索。但现有大模型主要依赖MoE等条件计算机制扩展容量,缺乏原生的知识检索机制,只能通过“计算模拟检索”,导致算力与内存的大量浪费,同时挤占了昂贵的高带宽内存(HBM)资源。

Engram作为一款部署在系统动态随机存取存储器(DRAM)中的专用稀疏内存表,本质是现代N元语法嵌入查找系统,能以O(1)的时间检索实体、固定表达式等静态知识,将Transformer底层网络从知识检索中解放,使其更聚焦于动态推理。

这款模块具有三大设计特征:部署在注意力机制和MoE之前,不改变现有Transformer架构的核心组件;仅在部分层部署,避免所有层重复建模静态模式;不修改分词器或嵌入/解嵌入接口,属于低侵入式结构增强模块。

在技术落地层面,Engram通过分词器压缩、多头哈希、上下文感知门控、多分支架构融合四大技术,解决了词汇效率、哈希冲突、一词多义等问题,并实现与MoE架构的高效协同。

而其最大的产业价值在于存算解耦的实际应用:训练阶段,通过模型并行将大尺度嵌入表分片到多个GPU,实现内存容量随加速器数量线性扩展;推理阶段,可将百亿参数的嵌入表完全卸载至更廉价的CPU DRAM,释放GPU的HBM资源用于高优先级计算,且推理吞吐量损失可控制在3%以内,几乎不影响模型性能。

野村研报指出,mHC和Engram的结合,将让DS-V4在保持高性能的同时进一步降低训练与推理成本,同时更适合医疗、法律、金融等知识密集型领域的行业大模型训练,为大模型的垂直场景落地奠定技术基础。此外,DS-V4还可能融入FP4精度计算、缓存优化等其他创新技术,进一步提升模型效率。

Part.02 产业影响:中国赛道迎核心赋能

野村研报对DS-V4的产业影响做出了全球化与本土化的差异化判断:这款模型不会像V3/R1那样对全球AI基础设施市场形成大幅冲击,但将成为推动全球大模型商业化的关键力量;而对于中国AI产业而言,DS-V4的技术创新将成为打破硬件瓶颈、加速产业链协同的核心推手,推动中国AI从算法到应用的全链路升级。

全球市场:加速商业化落地,缓解企业资本开支压力

当前全球头部云服务厂商正持续加码高阶算力,以追求通用人工智能(AGI)的发展目标,算力基础设施的投入逻辑已从“成本控制”转向“性能提升”,因此DS-V4的算力效率优化不会引发全球算力基建市场的大幅波动。

其核心价值在于推动全球大模型与AI应用的商业化变现进程:通过降低训练与推理成本,DS-V4将帮助全球大模型企业和AI应用玩家加速技术落地,缓解行业因持续高额算力投入带来的资本开支压力。

同时,DS-V4在编码、超长代码处理等领域的突破,将进一步推动AI与软件产业的融合,打破市场对“LLM扼杀软件”的担忧,反而让头部软件企业能借助大模型技术打造更强大的软件套件,实现价值增值。

中国市场:突破硬件瓶颈,赋能算力与应用双轮驱动

对于中国AI产业而言,DS-V4的技术创新是破解“芯片墙”与“内存墙”的关键抓手,从算力硬件和应用落地两个维度实现核心赋能,推动中国AI产业链的加速升级。

在算力硬件层面,mHC和Engram的技术创新将弥补本土硬件的短板,推动本土AI算力基础设施的规模化应用。

一方面,Engram的存算解耦机制能释放HBM资源,降低对高端海外芯片的依赖,推动本土服务器、光模块等硬件企业的投资周期加速。

野村研报重点看好紫光股份、光迅科技等企业;另一方面,mHC框架能实现更稳定的大模型训练过程,有效抵消本土AI芯片在大规模集群训练中失败率较高的性能短板,为摩尔线程、壁仞科技、天数智芯等本土AI芯片企业提供技术适配的机会,推动本土AI芯片的研发与商业化落地。

2025年底至2026年初,中国AI硬件企业迎来上市潮,摩尔线程、壁仞科技、天数智芯等先后登陆资本市场,长鑫存储、大普微等存储与主控芯片企业也推进IPO进程,本土硬件产业的成熟度持续提升,而DS-V4的技术创新将为这些企业提供更适配的软件算法环境,实现软硬件协同发展。

在应用落地层面,DS-V4将推动中国AI Agent从“对话工具”向“智能助手”的转型,加速AI应用的场景化落地。野村研报观察到,当前由中兴与字节跳动合作的Doubao AI手机、阿里Qwen APP已实现多步任务的自动化处理,代表着AI Agent的能力升级。

而DS-V4在编码、推理等领域的突破,将进一步催生更强大的多任务AI Agent,这类应用的大规模普及将提升token消耗与算力需求,形成“技术创新-应用升级-算力需求”的正向循环。

同时,AI应用的生态化发展趋势愈发明显,以阿里Qwen APP为例,其在2025年11月至2026年1月的三个月内,从基础对话功能快速拓展至视频生成、地图导航、支付宝支付、政务民生服务等400余项AI服务,实现与阿里生态的全面打通。

这种生态化的应用发展,将进一步推动AI技术从“单点应用”向“全场景渗透”,而DS-V4的技术创新将为这种渗透提供更坚实的模型基础。

野村研报指出,DS-V4的推出将推动中国AI应用的商业化周期加速,利好能借助大模型技术实现产品升级的头部软件企业,其中金山办公、金蝶国际被列为软件领域的核心推荐标的。

Part.03 行业趋势:中国开源生态迎黄金期

DeepSeek从V3/R1到V4的技术演进,折射出全球大模型产业的重要发展趋势:在预训练与后训练的缩放定律接近极限后,大模型的性能提升已从“参数堆砌”转向架构设计与系统优化,软硬件协同设计成为行业核心发展方向。

对于中国AI产业而言,这一趋势为中国实现全球化缩差提供了关键机遇:相较于海外在高端芯片等硬件领域的先发优势,中国在大模型的算法创新、工程优化与应用落地方面具备本土化优势,而DeepSeek等企业的技术探索,正推动中国在大模型架构与系统优化层面形成核心竞争力。

同时,开源大模型仍将是中国AI产业的主流发展方向。尽管2025年下半年全球开源大模型市场呈现碎片化特征,但DeepSeek的技术创新仍为中国开源生态提供了核心标杆,推动本土大模型企业从“跟跑”向“并跑”甚至“领跑”转型。随着DS-V4的推出,中国开源大模型的竞争将进一步从“规模与性能”转向“效率与场景落地”,而知识密集型的垂直领域(医疗、法律、金融)将成为下一个核心竞争赛道。

野村研报最后总结,DS-V4的推出将推动中国AI产业链进入新一轮的创新与商业化加速周期,从算力基建到应用落地的全链路都将迎来发展机遇;而全球大模型产业也将在效率优化的技术推动下,加速从“技术研发”向“商业变现”的转型,AI产业的价值创造将进入全新阶段。

0 0 0
微博

本文系作者 智通财经APP 授权深蓝财经发表,并经深蓝财经编辑,转载请注明出处、作者和本文链接

本内容来源于深蓝财经,文章内容仅供参考、交流、学习,不构成投资建议。

想和千万深蓝财经用户分享你的新奇观点和发现,点击这里投稿。 创业或融资寻求报道,点击这里