搜索

赤峰锚索 DeepSeek V4初体验——读《三体》三部曲了54万token

发布日期:2026-04-26 18:36 点击次数:101

钢绞线

智东西4月24日报谈赤峰锚索,当天,DeepSeek矜重发布并开源DeepSeek-V4系列预览版块,这是其继V3.2之后的新代旗舰模子体系,智东西时候上手实测。

DeepSeek V4“源神”追溯影响力居然不落俗套,真是一刹刷屏,在微博热搜榜前五占三,仅次于小米YU7GT。

本次发布包含两款模子:DeepSeek-V4-Pro与DeepSeek-V4-Flash,分辩领受MoE架构,总参数限制达到1.6T(激活49B)与284B(激活13B),并统相沿长100万token高下文。

DeepSeek官同期评释,受限于端算力,当今DeepSeek-V4-Pro的工作微辞十分有限,展望下半年昇腾950节点批量上市后,其价钱会大幅下调。此外,DeepSeek-V4已取得寒武纪Day 0适配相沿,关连适配代码已开源至GitHub社区。

DeepSeek-V4-Pro主能上限,对标闭源旗舰模子;而DeepSeek-V4-Flash则在参数限制与激活限制上大幅松开,沟通低蔓延与低老本。

比拟上代模子,其在Agent才气、寰宇学问与复杂理任务上超过抬升,并次将“百万高下文”四肢默许才气通达。

在Agent才气面,DeepSeek-V4-Pro的Agent才气权贵增强。其在Agentic Coding等评测中参加开源梯队,里面评测袒露委派质地已接近Claude Opus 4.6非想考花式,但与其想考花式仍存在差距。

DeepSeek-V4-Pro在数学、STEM及竞赛型代码等难度任务中已过现时已公开评测的开源模子,举座说明接近致使并排GPT-5.4、Claude Opus 4.6-Max等顶闭源模子。

与此同期,DeepSeek-V4在长高下文率上给出了组激进的化:在100万token场景下,其单token理筹议量仅为V3.2的27,KV Cache占用降至约10,权贵缩短长链路任务的算力与显存老本。

同期,官公布了DeepSeek-V4系列的API订价:DeepSeek-V4-Pro在输入掷中缓存的情况下为1元/百万tokens,输入未掷中缓存则为12元/百万tokens,输出为24元/百万tokens;DeepSeek-V4-Flash在输入掷中缓存仅0.2元/百万tokens,未掷中输入1元/百万tokens,输出2元/百万tokens。

当今,DeepSeek-V4系列已上线官网与App,并同步通达API与模子权重。

体验地址:

chat.deepseek.com或DeepSeek官APP

API文档:

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

开源聚会:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

时间陈述:赤峰锚索

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

01、Agentic编程才气培植较着,读《三体》三部曲了54万token

咱们初步感受了下DeepSeek-V4的变化,主要测试的模子是DeepSeek-V4-Pro。

手机号码:13302071130

在前端网页one-shot案例中,DeepSeek-V4-Pro展现出很的实践率。由于咱们的需求不复杂,模子仅用了5秒钟进行想考,之后马上进行竖立,这与之前DeepSeek模子在想考上糜费好多token的花式较着不同。

参加到试验生成经过后,DeepSeek-V4-Pro的输出长度要较着长于其他DeepSeek模子。其生成速率较快,基本能作念到以5行代码为单元输出。

终,DeepSeek-V4-Pro的生成恶果如下,可以看到其网页的完成度要比DeepSeek-V3.2些,盘算为丰富。

▲DeepSeek-V4-Pro造的网站

https://mcp.edgeone.site/share/9pD1cRzY1QA8bmmBLDZ8S

不外,这么肤浅的编程题目还是难不住DeepSeek-V4-Pro,咱们试着让它完成个结Agent才气与编程的任务:权术次去上海的旅行,然后把通盘关连信息整为个旅行网站,附上对应的景点定位。

实践经过中,可以看到DeepSeek-V4-Pro可以进行复杂多轮器具调用,联网搜索的条目数目也和之前模子的数目比拟有增多,信息收罗得为了。

终,DeepSeek-V4-Pro收罗到了完满的行程信息,权术理,况兼配上了每个景点的定位,点开后就可以平直在航App里使用,十分方便。在Agent任务中,可以不雅察到它的活动十分执意,器具调用、想考王人在几秒钟内处置,token率可以。

▲DeepSeek使用Agent才气和编程才气权术的旅行案旅行案

https://mcp.edgeone.site/share/4TxFYOy24bgaEwxFoxisj

咱们的下个案例与长文本议论,

DeepSeek-V4系列模子频频挂在嘴边的等于它能语气吃下《三体》三部曲,而咱们如它所愿上传了完满的《三体》。

上传这么的长文献后,锚索DeepSeek能够马上定位咱们指定的内容,顺利完毕大海捞针。不外,这种长高下文才气是有代价的,只是输出这点内容就掉了54万个token。

咱们还用“OpenAI新到了哪个模子”这问题,试了试模子的学问端正日历,可以看到,DeepSeek-V4-Pro的学问截止日历当今仍然停在2025年。

此外,这模子应该暂时还不相沿视觉才气,上传图像后如故会进行笔墨提真金不怕火,莫得笔墨的图像会袒露法处理。

02、百万高下文成标配,新架构把“长任务老本”压下来

这代V4平直的变化,是把“长高下文”酿成默许才气。

不同于传统通过肤浅彭胀窗口的式,DeepSeek-V4-Pro引入了全新的混防卫力架构,将Compressed Sparse Attention与压缩防卫力(HCA)结,同期配DSA稀疏防卫力,在token维度进行压缩。

此外,模子引入了流形管束勾通(mHC)增强传统残差勾通,并使用Muon化器培植敛迹速率和磨练褂讪。这系列盘算,使得模子在“牢记长”的同期,有端正筹议老本。

从官给出的数据来看,在100万token高下文下,DeepSeek-V4-Pro单token理TFLOPs比拟DeepSeek-V3.2下落约3.7倍至9.8倍区间,KV Cache占用下落9.5倍至13.7倍。

这意味着,曩昔难以试验运行的长链路任务(如多轮Agent权术、长文档处理),运行参加可实践领域。

03、理、学问、代码三线抬升,开源模子迫临闭源上限

从才气结构来看,DeepSeek-V4-Pro的培植是理、学问与Agent才气的同步抬升。

在学问与理类任务中,其在SimpleQA、Apex、Codeforces等评测中均过现时主流开源模子,并在多项任务上接近GPT-5.4与Gemini 3.1 Pro。举例在Apex Shortlist中达到90.2分,还是越顶闭源模子;在Codeforces等竞赛类任务中,也督察在梯队水平。

在Agent才气关连任务中,DeepSeek-V4-Pro在SWE Verified、Terminal Bench等认识上说明褂讪,SWE Verified达到80.6,接近Claude Opus 4.6,较着于多量开源模子。在Terminal Bench 2.0中,其说明雷同过GLM-5.1 Thinking、Kimi K2.6 Thinking等模子。

举座来看,DeepSeek-V4-Pro已是当今开源模子的“天花板”。

04、Agent才气项化,运行围绕信得过使命流磨

这代DeepSeek-V4较着强化了对Agent场景的适配。其针对Claude Code、OpenClaw、CodeBuddy等主流Agent框架进行了项化,在代码生成、文档生成等多依次任务中说明褂讪。下图为DeepSeek-V4-Pro在某Agent框架下生成的PPT内页示例:

从试验定位来看,DeepSeek-V4-Pro还是被DeepSeek里面四肢Agentic Coding模子使用,侧在于“完成任务”。在肤浅任务上,V4-Flash已可与Pro版块接近,而在复杂任务中仍存在较着差距。

本色上是在为Agent应用提供两种“算力档位”。DeepSeek-V4-Flash在肤浅Agent任务中还是能够与DeepSeek-V4-Pro“旗饱读终点”,但在复杂任务中仍有差距。这种各别,本色上是理度与高下文期骗才气的诀别。

05、结语:DeepSeek-V4亮相,国产算力与开源阶梯的落地之光

DeepSeek-V4的发布不仅展现了团队在时间和架构上的积淀,也符号着开源大模子在国产算力生态下的试验落地才气。

经过对华为昇腾、寒武纪等国产芯片的适配化,DeepSeek-V4系列完毕了百万token高下文的褂讪相沿和理,使长链路任务与多步Agent实践成为可能。

这版块将Pro与Flash的不同定位落到实处,在能上迫临闭源旗舰模子,在老本上保捏价比,为国内竖立者提供了前所未有的通达选项。

进犯的是,此次发布袒涌现开源模子不仅能在众人竞争中站稳脚跟,也能够借助国产算力和化架构,将时间后劲回荡为试验可用的坐褥力。

DeepSeek-V4约略是开源力量在能AI赛谈上迈出的关键步,也为国内AI生态的立异和落地提供了明确指导。

本文开首:智东西

风险提醒及责条目 阛阓有风险,投资需严慎。本文不组成个东谈主投资忽视,也未辩论到个别用户稀罕的投资标的、财务现象或需要。用户应试虑本文中的任何意见、不雅点或论断是否符其特定现象。据此投资,包袱安详。 相关词条:铁皮保温施工     隔热条设备     锚索    离心玻璃棉    万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。

查看更多