赤峰锚索 DeepSeek V4初体验——读《三体》三部曲了54万token

发布日期：2026-04-26 18:36 点击次数：101

智东西4月24日报谈赤峰锚索，当天，DeepSeek矜重发布并开源DeepSeek-V4系列预览版块，这是其继V3.2之后的新代旗舰模子体系，智东西时候上手实测。

DeepSeek V4“源神”追溯影响力居然不落俗套，真是一刹刷屏，在微博热搜榜前五占三，仅次于小米YU7GT。

本次发布包含两款模子：DeepSeek-V4-Pro与DeepSeek-V4-Flash，分辩领受MoE架构，总参数限制达到1.6T（激活49B）与284B（激活13B），并统相沿长100万token高下文。

DeepSeek官同期评释，受限于端算力，当今DeepSeek-V4-Pro的工作微辞十分有限，展望下半年昇腾950节点批量上市后，其价钱会大幅下调。此外，DeepSeek-V4已取得寒武纪Day 0适配相沿，关连适配代码已开源至GitHub社区。

DeepSeek-V4-Pro主能上限，对标闭源旗舰模子；而DeepSeek-V4-Flash则在参数限制与激活限制上大幅松开，沟通低蔓延与低老本。

比拟上代模子，其在Agent才气、寰宇学问与复杂理任务上超过抬升，并次将“百万高下文”四肢默许才气通达。

在Agent才气面，DeepSeek-V4-Pro的Agent才气权贵增强。其在Agentic Coding等评测中参加开源梯队，里面评测袒露委派质地已接近Claude Opus 4.6非想考花式，但与其想考花式仍存在差距。

DeepSeek-V4-Pro在数学、STEM及竞赛型代码等难度任务中已过现时已公开评测的开源模子，举座说明接近致使并排GPT-5.4、Claude Opus 4.6-Max等顶闭源模子。

与此同期，DeepSeek-V4在长高下文率上给出了组激进的化：在100万token场景下，其单token理筹议量仅为V3.2的27，KV Cache占用降至约10，权贵缩短长链路任务的算力与显存老本。

同期，官公布了DeepSeek-V4系列的API订价：DeepSeek-V4-Pro在输入掷中缓存的情况下为1元/百万tokens，输入未掷中缓存则为12元/百万tokens，输出为24元/百万tokens；DeepSeek-V4-Flash在输入掷中缓存仅0.2元/百万tokens，未掷中输入1元/百万tokens，输出2元/百万tokens。

当今，DeepSeek-V4系列已上线官网与App，并同步通达API与模子权重。

体验地址：

chat.deepseek.com或DeepSeek官APP

API文档：

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

开源聚会：

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

时间陈述：赤峰锚索

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

01、Agentic编程才气培植较着，读《三体》三部曲了54万token

咱们初步感受了下DeepSeek-V4的变化，主要测试的模子是DeepSeek-V4-Pro。

手机号码：13302071130

在前端网页one-shot案例中，DeepSeek-V4-Pro展现出很的实践率。由于咱们的需求不复杂，模子仅用了5秒钟进行想考，之后马上进行竖立，这与之前DeepSeek模子在想考上糜费好多token的花式较着不同。

参加到试验生成经过后，DeepSeek-V4-Pro的输出长度要较着长于其他DeepSeek模子。其生成速率较快，基本能作念到以5行代码为单元输出。

终，DeepSeek-V4-Pro的生成恶果如下，可以看到其网页的完成度要比DeepSeek-V3.2些，盘算为丰富。

▲DeepSeek-V4-Pro造的网站

https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S

不外，这么肤浅的编程题目还是难不住DeepSeek-V4-Pro，咱们试着让它完成个结Agent才气与编程的任务：权术次去上海的旅行，然后把通盘关连信息整为个旅行网站，附上对应的景点定位。

实践经过中，可以看到DeepSeek-V4-Pro可以进行复杂多轮器具调用，联网搜索的条目数目也和之前模子的数目比拟有增多，信息收罗得为了。

终，DeepSeek-V4-Pro收罗到了完满的行程信息，权术理，况兼配上了每个景点的定位，点开后就可以平直在航App里使用，十分方便。在Agent任务中，可以不雅察到它的活动十分执意，器具调用、想考王人在几秒钟内处置，token率可以。

▲DeepSeek使用Agent才气和编程才气权术的旅行案旅行案

https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

咱们的下个案例与长文本议论，

DeepSeek-V4系列模子频频挂在嘴边的等于它能语气吃下《三体》三部曲，而咱们如它所愿上传了完满的《三体》。

上传这么的长文献后，锚索DeepSeek能够马上定位咱们指定的内容，顺利完毕大海捞针。不外，这种长高下文才气是有代价的，只是输出这点内容就掉了54万个token。

咱们还用“OpenAI新到了哪个模子”这问题，试了试模子的学问端正日历，可以看到，DeepSeek-V4-Pro的学问截止日历当今仍然停在2025年。

此外，这模子应该暂时还不相沿视觉才气，上传图像后如故会进行笔墨提真金不怕火，莫得笔墨的图像会袒露法处理。

02、百万高下文成标配，新架构把“长任务老本”压下来

这代V4平直的变化，是把“长高下文”酿成默许才气。

不同于传统通过肤浅彭胀窗口的式，DeepSeek-V4-Pro引入了全新的混防卫力架构，将Compressed Sparse Attention与压缩防卫力（HCA）结，同期配DSA稀疏防卫力，在token维度进行压缩。

此外，模子引入了流形管束勾通（mHC）增强传统残差勾通，并使用Muon化器培植敛迹速率和磨练褂讪。这系列盘算，使得模子在“牢记长”的同期，有端正筹议老本。

从官给出的数据来看，在100万token高下文下，DeepSeek-V4-Pro单token理TFLOPs比拟DeepSeek-V3.2下落约3.7倍至9.8倍区间，KV Cache占用下落9.5倍至13.7倍。

这意味着，曩昔难以试验运行的长链路任务（如多轮Agent权术、长文档处理），运行参加可实践领域。

03、理、学问、代码三线抬升，开源模子迫临闭源上限

从才气结构来看，DeepSeek-V4-Pro的培植是理、学问与Agent才气的同步抬升。

在学问与理类任务中，其在SimpleQA、Apex、Codeforces等评测中均过现时主流开源模子，并在多项任务上接近GPT-5.4与Gemini 3.1 Pro。举例在Apex Shortlist中达到90.2分，还是越顶闭源模子；在Codeforces等竞赛类任务中，也督察在梯队水平。

在Agent才气关连任务中，DeepSeek-V4-Pro在SWE Verified、Terminal Bench等认识上说明褂讪，SWE Verified达到80.6，接近Claude Opus 4.6，较着于多量开源模子。在Terminal Bench 2.0中，其说明雷同过GLM-5.1 Thinking、Kimi K2.6 Thinking等模子。

举座来看，DeepSeek-V4-Pro已是当今开源模子的“天花板”。

04、Agent才气项化，运行围绕信得过使命流磨

这代DeepSeek-V4较着强化了对Agent场景的适配。其针对Claude Code、OpenClaw、CodeBuddy等主流Agent框架进行了项化，在代码生成、文档生成等多依次任务中说明褂讪。下图为DeepSeek-V4-Pro在某Agent框架下生成的PPT内页示例：

从试验定位来看，DeepSeek-V4-Pro还是被DeepSeek里面四肢Agentic Coding模子使用，侧在于“完成任务”。在肤浅任务上，V4-Flash已可与Pro版块接近，而在复杂任务中仍存在较着差距。

本色上是在为Agent应用提供两种“算力档位”。DeepSeek-V4-Flash在肤浅Agent任务中还是能够与DeepSeek-V4-Pro“旗饱读终点”，但在复杂任务中仍有差距。这种各别，本色上是理度与高下文期骗才气的诀别。

05、结语：DeepSeek-V4亮相，国产算力与开源阶梯的落地之光

DeepSeek-V4的发布不仅展现了团队在时间和架构上的积淀，也符号着开源大模子在国产算力生态下的试验落地才气。

经过对华为昇腾、寒武纪等国产芯片的适配化，DeepSeek-V4系列完毕了百万token高下文的褂讪相沿和理，使长链路任务与多步Agent实践成为可能。

这版块将Pro与Flash的不同定位落到实处，在能上迫临闭源旗舰模子，在老本上保捏价比，为国内竖立者提供了前所未有的通达选项。

进犯的是，此次发布袒涌现开源模子不仅能在众人竞争中站稳脚跟，也能够借助国产算力和化架构，将时间后劲回荡为试验可用的坐褥力。

DeepSeek-V4约略是开源力量在能AI赛谈上迈出的关键步，也为国内AI生态的立异和落地提供了明确指导。

本文开首：智东西

风险提醒及责条目阛阓有风险，投资需严慎。本文不组成个东谈主投资忽视，也未辩论到个别用户稀罕的投资标的、财务现象或需要。用户应试虑本文中的任何意见、不雅点或论断是否符其特定现象。据此投资，包袱安详。相关词条:铁皮保温施工隔热条设备锚索离心玻璃棉万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

赤峰锚索 DeepSeek V4初体验——读《三体》三部曲了54万token

临夏锚索价格 南天气将“变脸”！暴雨大暴雨又再行上线，还有降

赤峰锚索 DeepSeek V4初体验——读《三体》三部曲了

龙岩预应力无粘结钢绞线 2026年4月西澳氧化铝到港价于指数

洛阳有粘钢绞线 徐璐大长腿白袜穿搭

临汾预应力钢绞线规格及参数 揭开母动机的答案，1979年什邡

东方钢绞线多少 阿斯：伊尼戈在利雅得告捷过得很好，他算与俱乐

临夏锚索价格南天气将“变脸”！暴雨大暴雨又再行上线，还有降

洛阳有粘钢绞线徐璐大长腿白袜穿搭

临汾预应力钢绞线规格及参数揭开母动机的答案，1979年什邡

东方钢绞线多少阿斯：伊尼戈在利雅得告捷过得很好，他算与俱乐