王鹤棣经不起深扒:碰瓷热巴、脚绊虞书欣,一壁太敏感一壁太大条?
刚刚,DeepSeek-V4 来了!预览版正式上线并同步开源。一共两个版本:DeepSeek-V4-Pro:对标顶级关源模型,1.6T,49B 激活,高低文长度 1M;DeepSeek-V4-Flash:更幼更快的经济版,284B,13B 激活,高低文长度 1M。官方原话是:在 Agent 能力、世界知识和推理机能上均实现国内与开源领域确当先。并且:目前 DeepSeek-V4 已经成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用履历优于 Sonnet 4.5,交付质量靠近 Opus 4.6 非思虑模式。但仍与 Opus 4.6 思虑模型存在肯定差距。目前官网和 APP 都上了,API 服务也已同步更新。各人都关切的国产算力方面,划沉点,下半年批量上华为算力。顶配和性价比之选,两个版本一路开这次 V4 一口气发了两个版本。V4-Pro,机能比肩顶级关源模型。官方给出的判断有三条:Agent 能力大幅提高:在 Agentic 能力 Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 有关评测中同样阐发优异。内部测评中,Agent Coding 模式下,V4 履历优于 Sonnet 4.5,交付质量靠近 Opus 4.6 非思虑模式,但仍与 Opus 4.6 思虑模式存在肯定差距。丰硕的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅当先其他开源模型,仅稍逊于顶尖关源模型 Gemini-Pro-3.1。世界顶级推理机能:在数学、STEM、较量型代码的测评中,DeepSeek-V4-Pro 超过当前所有已公开评测的开源模型,获得了比肩世界顶级关源模型的优异成就。V4-Flash,更幼更快的经济版。推理能力靠近 Pro,世界知识储蓄稍逊一筹,但参数和激活更幼,API 更便宜。在 Agent 工作方面,DeepSeek-V4-Flash 在单一工作上与 DeepSeek-V4-Pro 旗鼓相当,但在高难度工作上仍有差距。在洗车测试上,V4 也是急剧通过。而在 " 绝望的父亲 " 这个经典的生物学场景傍边,DeepSeek-V4 并没有一轮 get 到红绿色盲这个关键点(凭据遗传学法规,若是一名女性是红绿色盲,其生物学父亲必然也是)。百万高低文实现标配值得一提的是,从今天起头,1M 高低文是 DeepSeek 所有官方服务的标配。一年前,1M 高低文还是 Gemini 独家的王牌;其他所有关源模型要么 128K 要么 200K;开源这边险些没人玩得起这个量级。DeepSeek 直接把百万高低文从一个「高端职能」挪成了「水电煤」。并且开源。他们怎么做到的,颁布稿里直接给了答案——V4 开创了一种全新确把稳力机造,在 token 维度进行压缩,结合 DSA 稀少把稳力一路用。相比传统步骤,对推算和显存的需要大幅降低。DSA 不是新词。半年前 V3.2-Exp 那次更新初次引入,其时表界关注度不高,由于跑分和 V3.1-Terminus 险些一样,看起来像一次没什么料的中央版本。此刻回头看,那是 V4 的地基。Agent 能力专项优化Agent 这边,V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 产品做了适配和优化,代码工作、文档天生工作都有提升。颁布稿里还附了一张 V4-Pro 在某 Agent 框架下天生的 PPT 内页示例。API 价值API 这边,V4-Pro 和 V4-Flash 同步上线 , 支持 OpenAI ChatCompletions 接口和 Anthropic 接口两套。base_url 不变 ,model 参数改成 deepseek-v4-pro 或 deepseek-v4-flash 即可挪用。两个版本最大高低文都是 1M, 都同时支持非思虑模式和思虑模式。思虑模式下能够通过 reasoning_effort 参数调强度 , 两档 high 和 max。官方建议复杂 Agent 场景直接上 max。这里有个沉点——下半年批量上华为算力。此表,旧模型名要下架。deepseek-chat 和 deepseek-reasoner 将在三个月后 ( 2026 年 7 月 24 日 ) 停用,当前阶段内这两个名字别离指向 V4-Flash 的非思虑和思虑模式。对幼我开发者影响不大,改一个 model 参数。对接了出产环境的公司,这三个月要去做迁徙。One more thing颁布稿的结尾,DeepSeek 自己引了一句话。「不诱于誉,不恐于诽,率路而行,端然正己。」这是荀子《非十二子》里的一句。字面意思是,不被赞美引诱,不被离间吓到,按自己认定的路往前走,端正自己。放在今天这个场景里,有点意思。从前半年,关于 V4 什么时辰发、是不是跳票、是不是已经被别家超过、是不是已经被 Claude 蒸馏数据搞定了之类的传言在中文和英文 AI 圈来来回回跑了好几轮。岁首甚至还有人信誓旦旦说 V4 会在春节前发,了局比及了四月底。他们没回应过一次。而后在某个周五的上午,把 V4 放出来,同步开源,同步上线官网和 App,同步更新 API,顺便把内部员工已经弃用 Claude 的事实写进颁布稿。没有路线图,没有直播,没有访谈。率路而行这四个字,听着像是一句标语。但若是你把从前半年 V3.2 那次「没什么亮点」的 Exp 版本、DSA 那套为 V4 铺了半年的稀少把稳力、1M 高低文从王牌造成标配的这条蹊径放在一路看。DeepSeek 已经做到了。DeepSeek-V4 模型开源链接: [ 1 ] https://huggingface.co/collections/deepseek-ai/deepseek-v4 [ 2 ] https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4DeepSeek-V4 技术汇报:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf