【AI前沿】DeepSeek V4
DeepSeek-V4 – DeepSeek推出的新一代大语言模型系列AI工具4周前发布AI小集06DeepSeek-V4是什么DeepSeek-V4是DeepSeek推出的新一代大语言模型系列预览版,拥有百万字超长上下文窗口,在Agent能力、世界知识与推理性能方面达到开源领域领先水平。模型包含deepseek-v4-pro 和 deepseek-v4-flash 两个版本,分别定位高性能与经济高效,均已开源并提供API服务,支持非思考与思考双模式,为长文本处理与智能体应用提供普惠化基础设施。DeepSeek-V4的主要功能百万上下文处理:原生支持1M Token超长文本理解与记忆,为官方服务标配。混合注意力机制:CSA与HCA架构大幅降低长上下文计算与显存开销。Agent编码增强:针对Claude Code、OpenClaw等主流Agent框架深度优化。双模式推理:支持非思考与思考模式,后者可通过reasoning_effort参数调节强度。多领域专家融合:通过OPD蒸馏整合数学、代码、Agent等领域专家能力。经济高效选择:Flash版本用更低参数实现接近Pro的推理性能,API成本显著降低。DeepSeek-V4的技术原理CSA压缩稀疏注意力:将每m个token的KV压缩为1个条目,通过Lightning Indexer计算索引分数并执行Top-k稀疏选择,结合滑动窗口与Attention Sink机制保留局部依赖。HCA重度压缩注意力:以更大压缩比m’将KV条目合并为单个条目,保持密集注意力而不采用稀疏选择,进一步降低计算量。mHC流形约束超连接:将残差映射矩阵通过Sinkhorn-Knopp算法投影到双随机矩阵流形,约束谱范数不超过1,增强深层信号传播稳定性。Muon优化器:模型采用混合Newton-Schulz迭代对梯度矩阵进行正交化,分快速收敛与精确稳定两个阶段,支持大规模MoE高效训练。FP4量化感知训练:对MoE专家权重和CSA索引器QK路径进行FP4量化,用FP8扩展动态范围实现无损反量化,降低内存与计算开销。DeepSeek-V4的性能体现知识能力世界知识领先开源:SimpleQA-Verified达57.9%,超越所有已评测开源模型20个百分点,仅稍逊于Gemini-3.1-Pro(75.6%)。中文知识突出:Chinese-SimpleQA达84.4%,大幅领先K2.6(75.9%)与GLM-5.1(75.0%)。教育知识接近前沿:MMLU-Pro 87.5%、GPQA Diamond 90.1%,与GPT-5.4持平,略低于Gemini-3.1-Pro。推理与代码能力数学竞赛比肩闭源:HMMT 2026 Feb达95.2%,IMOAnswerBench达89.8%,超越K2.6与GLM-5.1,接近GPT-5.4与Opus-4.6。代码竞赛首次开源追平闭源:Codeforces Rating达3206,与GPT-5.4(3168)相当,当前排名人类选手第23位。高难度推理突破:Apex Shortlist达90.2%,超越GPT-5.4(78.1%)与Opus-4.6(85.9%);LiveCodeBench达93.5%,领先所有对比模型。Agent能力软件工程接近顶级闭源:SWE Verified达80.6%,与Opus-4.6(80.8%)基本持平;SWE Pro 55.4%、SWE Multilingual 76.2%。终端操作领先开源:Terminal Bench 2.0达67.9%,超越K2.6(66.7%)、GLM-5.1(63.5%)与Opus-4.6(65.4%)。工具调用泛化优秀:MCPAtlas Public 73.6%、Toolathlon 51.8%,在包含广泛工具和MCP服务的评测中表现突出。长上下文能力百万上下文检索强劲:MRCR 1M达83.5%,超越Gemini-3.1-Pro(76.3%);128K内检索性能高度稳定,1M时仍保持较强能力。真实场景长文档理解:CorpusQA 1M达62.0%,优于Gemini-3.1-Pro(53.8%)。效率表现计算量断崖式下降:1M上下文下,V4-Pro单Token推理FLOPs仅为V3.2的27%,V4-Flash仅为10%。KV缓存大幅压缩:1M上下文下,V4-Pro累计KV缓存为V3.2的10%,V4-Flash仅为7%。路由专家FP4量化:专家权重采用FP4存储,未来硬件上理论可再提升1/3效率。如何使用DeepSeek-V4网页端/App:访问DeepSeek官网或官方App,选择专家模式(Pro)或快速模式(Flash)。API调用:修改model参数为deepseek-v4-pro或deepseek-v4-flash,base_url保持不变。思考模式:复杂Agent场景建议启用思考模式并设置reasoning_effort: max。本地部署:通过Hugging Face或ModelScope下载开源权重自行部署。DeepSeek-V4的关键信息和使用要求版本规格:Pro版1.6T参数/49B激活,Flash版284B参数/13B激活,预训练数据分别为33T与32T。上下文长度:两个版本均支持1M Token,旧接口deepseek-chat与deepseek-reasoner将于2026-07-24停用。API定价(每百万Token):Pro输入缓存命中1元/未命中12元,输出24元;Flash输入缓存命中0.2元/未命中1元,输出2元。算力限制:Pro版当前服务吞吐有限,预计下半年昇腾950超节点批量上市后价格将大幅下调。DeepSeek-V4的核心优势百万上下文普惠化:1M Token超长上下文成为官方服务标配,突破传统注意力机制的二次计算瓶颈,使长文本任务与测试时缩放真正可行。极致长上下文效率:通过CSA压缩稀疏注意力与HCA重度压缩注意力的混合架构,1M上下文下V4-Pro的单Token推理FLOPs仅为V3.2的27%,KV缓存仅10%,Flash版更是低至10%与7%。开源模型性能新标杆:V4-Pro-Max在知识、推理、代码竞赛等评测中全面领先前代开源模型,Agent编码能力内部评测优于Claude Sonnet 4.5,交付质量接近Opus 4.6非思考模式。双版本灵活覆盖:Pro版(1.6T/49B)定位顶级性能,Flash版(284B/13B)以极小激活参数实现接近的推理能力,API价格低至Pro的1/12,普惠不同预算场景。Agent能力原生增强:针对Claude Code、OpenClaw等主流Agent框架专项优化,支持跨用户消息边界的连贯推理保留,在SWE、Terminal Bench等Agent评测中表现优异。DeepSeek-V4的项目地址HuggingFace模型库:https://huggingface.co/collections/deepseek-ai/deepseek-v4技术论文:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdfDeepSeek-V4的同类竞品对比对比维度DeepSeek-V4-ProClaude Opus 4.6Kimi K2.6模型定位开源高性能MoE闭源顶级通用开源Agent智能开源状态完全开源闭源API开源/开放API总参数量1.6T未公开未公开激活参数49B未公开未公开上下文长度1M Token200K1M Token核心架构CSA+HCA混合注意力传统TransformerMoE+长上下文MMLU-Pro87.589.187.1SimpleQA57.946.236.9Codeforces3206––SWE Verified80.680.880.2Terminal Bench67.965.466.7MRCR 1M83.592.9–API输入价格12元/百万Token约150元/百万Token约60元/百万Token长上下文效率KV缓存仅为V3.2的10%标准KV缓存高效但细节未公开DeepSeek-V4的应用场景长文档分析:支持百万字级论文、报告、法律合同的全文理解与跨章节推理。智能体编码:在Claude Code、OpenClaw等框架中执行复杂代码生成、重构与调试任务。多轮工具调用:在Agent工作流中保留完整推理历史,支持跨用户消息边界的连贯思考。知识密集型问答:在世界知识评测中大幅领先开源模型,适用于教育、科研与专业咨询。白领办公任务:模型在中文写作、信息分析、文档生成与编辑等场景表现优异。# AI工具# AI项目和框架©版权声明本站文章版权归AI工具集所有,未经允许禁止任何形式的转载。上一篇GPT-5.5 - OpenAI 推出的最新旗舰大模型下一篇StepAudio 2.5 ASR - 阶跃星辰推出的自动语音识别模型相关文章华为小艺 – 华为旗下小艺AI助手网页端,已接入DeepSeek-R1AI小集21法唠AI – AI法律助手,AI自动绘制逻辑关系图AI小集3文心 5.1 – 百度推出的旗舰大语言模型AI小集3Kilo CLI 1.0 – Kilo Code推出的开源命令行工具AI小集2Firefly Image Model 4 – Adobe 推出的图像生成模型AI小集2Lumina-DiMOO – 上海AI Lab推出的多模态生成与理解模型AI小集2暂无评论再想想发表评论暂无评论…热门工具豆包LibTV秒哒AiPPT秘塔AI搜索TRAE编程堆友AI美图设计室绘蛙AI星流AI响指HaiSnap办公小浣熊最新收录DataifyLumen Flow千问云微信读书Skill文枢三言堆友Agent最新文章ChatGPT Plus 和 Claude Pro 会员代充值 – 支持支付宝、微信支付3小时前Hy 翻译 – 腾讯混元团队推出的 AI 翻译小程序3小时前Hy-MT2 – 腾讯混元开源的新一代翻译大模型3小时前2026 十大专业数据采集服务选择指南6小时前微伴 Claw – 微伴助手推出的企业微信 AI 数字员工6小时前CloudDM – ClouGence 团队开源的数据库研发与管控平台6小时前ZCube – 智谱AI联合清华推出的下一代大模型推理网络架构11小时前HyperEyes – 小红书联合剑桥推出的并行多模态搜索智能体11小时前Agora-1 – Odyssey 推出的首款多智能体世界模型11小时前Lance – 字节跳动开源的轻量级原生统一多模态模型1天前HiDream-O1-Image-Pro – 智象未来推出的旗舰级图像模型1天前Qwen3.5-LiveTranslate – 阿里通义推出的实时同声传译模型1天前Qwen3.7-Max – 阿里通义推出的新一代旗舰大模型1天前Google Pics – 谷歌推出的 AI 图像创建与编辑工具1天前Gemini Omni Flash – 谷歌推出的多模态视频生成模型1天前