DeepSeek-V4发布重要价值,国产大模型领域再添新突破

发布日期:2026-04-25 12:07:44   来源 : 安徽财讯网    作者 :安徽财讯网    浏览量 :4691
安徽财讯网 安徽财讯网 发布日期:2026-04-25 12:07:44  
4691

  4月24日上午,深度求索(DeepSeek)正式发布全新系列大模型DeepSeek-V4预览版,同步完成开源,并开放官网、App及API调用服务,标志着百万字超长上下文能力进入普惠阶段,为国内开源领域及大模型产业发展注入新动力。




  受此消息影响,华丰科技(141.670. 12.92. 10.03%)、寒武纪(1352.500. 29.50. 2.23%)、摩尔线程(638.500. 32.88. 5.43%)等概念股直线拉升。算力相关板块表现活跃,截至午间收盘,海光信息(285.000. 21.60. 8.20%)上涨9.61%,星华新材(38.590. 6.43. 19.99%)上涨15.67%,众合科技(9.200. 0.84. 10.05%)、日海智能(9.640. 0.88. 10.05%)均上涨10.05%,润和软件(46.100. 3.99. 9.48%)上涨6.72%。

  迈入百万上下文普惠时代

  据悉,DeepSeek-V4系列大模型的核心优势的是具备100万Token(约合75万字)的超长上下文处理能力。该系列通过结构创新实现性能突破,开创全新注意力机制,结合Token维度压缩与DSA稀疏注意力(DeepSeekSparse Attention)技术,在大幅降低计算与显存开销的同时,将百万上下文能力设为所有官方服务的标配,可轻松应对整本著作、大型代码库、百万字法律合同等超长文本处理场景。

  DeepSeek-V4系列包含两个版本,以满足不同场景的使用需求。其中,DeepSeek-V4-Pro作为旗舰版本,性能可与顶级闭源模型比肩,在Agent能力、世界知识储备及推理性能方面表现突出;DeepSeek-V4-Flash定位为轻量高效的经济型版本,虽在世界知识储备上略逊于V4-Pro,但拥有接近的推理能力,且因模型参数和激活规模更小,能提供更快捷、低成本的API服务,可满足日常及轻量Agent场景的使用需求。

  Agent能力的专项优化是本次发布的重点内容之一。目前,DeepSeek-V4已完成与Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品的适配优化,在代码生成、复杂PPT方案等文档处理任务上的表现得到显著提升。同时,两款模型均支持非思考模式与思考模式,用户可通过不同设置提升答案的准确性。

  国产AI算力生态迎利好

  业内人士表示,DeepSeek-V4预览版的上线与开源,不仅填补了国内开源大模型在百万上下文及高阶Agent能力上的短板,还通过双版本布局降低了超长上下文技术的使用门槛,将推动大模型在代码开发、文档处理、复杂推理等场景的规模化应用。

  作为DeepSeek的下一代旗舰模型,DeepSeek-V4的硬件选择此前已成为行业关注的焦点。据报道,该模型打破了过往长期依赖英伟达芯片的格局,正式切换硬件方案,全面选用华为最新昇腾系列芯片作为核心算力底座。

  对此,英伟达CEO黄仁勋曾在采访中直言,DeepSeek基于华为平台开发的新模型“对美国来说将是一个糟糕的结果”。他认为,一旦AI模型被优化为在中国硬件上表现最佳,美国芯片的竞争优势将受到严重冲击。

  有专家认为,除技术突破外,DeepSeek-V4发布的更重要价值,在于推动中国AI算力生态实现从依赖进口到自主可控的关键跨越,这将为国产算力板块带来全链路利好,覆盖芯片、服务器、算力租赁等核心环节。

  该人士预计,未来随着模型持续迭代、开源生态不断完善,国产AI与算力产业链将进一步协同发力,相关产业机遇值得持续关注。

Copyright ©️ 2024 安徽财讯 All rights reserved.
扫码了解更多
18656973322
友情链接:
支持 反馈 订阅 数据