
春节档确凿吵杂!延边预应力钢绞线厂
印奇上任后,阶跃星辰也声势新了。
崇敬发布新代开源 Agent 基座模子Step 3.5 Flash,总参数 196B,激活参数 11B,复古 256K 高下文窗口。
生态层面,依旧走软硬结的本事道路,化模子自己的同期,兼容适配主流算力硬件。
当今,Step 3.5 Flash 照旧和昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥多芯片厂商完成适配,狡饰了刻下主流的国产 AI 加快芯片平台。
官数据称新模子的理峰值达350TPS,在 Agent 场景和数学任务上失色闭源模子,能胜任复杂、长链条任务。
被 AI "秒回"了
先来看波得益单。
官公布了 Step 3.5 Flash 在理、编码、智能体三大中枢场景的基准测试对比图(暗影条示意使用并行念念考增强的 Step 3.5 Flash 的能)。
新模子在理类测试排行均在前哨,其中 AIME 2025 基准测试中得分 97.3;
编码任务的 SWE-bench Verified 测试中达到 74.4,与海外闭源模子比较仍有小幅距离;
智能体任务的 τ² -Bench 测试中获得 88.2 的分数。
接下来实测走起!
请在不使用外部器具的情况下,瓜代推断比肩出以下算式的效果:项为 80、公役为 4 的等差数列前 30 项和;1 ² +2 ² + … +10 ² 的缓和;2!++4!+6!+8!+10! 的和;√ 169+ ∛ 216+ ⁵√ 32 的和。
好伙,理速率是"肉眼险些不可见"的快,秒回的谜底也准确。
看图推断也来试试:
(上传图片)推断
天然谜底没错延边预应力钢绞线厂 ,但尝试了国表里多个模子之后发现,唯有 Step 3.5 Flash 没把谜底并同类项到终模式……
接下来看编程场景,让 Step 3.5 Flash 开垦个模拟医疗资源监控系统。
开垦个医疗资源监控仪容盘,使用 WebGL 渲染 3D 院区场景。各科室、急诊、手术室确立发光点位,后放大区域并展示半透明数据层,包含床位、接诊量、诞生应用率图表。数据通过 WebSocket 及时新,网罗非常使用缓存。
系统完成脱手化加载后,左上角会及时展示刻下运办事态,显着标注系统的在线情况、新数据新时代和勾搭景况(模拟)。
右上角则了病院种种医疗诞生的在线率、负载景况与运行情况,诞生统率面板非常直不雅。
界面中枢区域看成主可视化大屏,聚集呈现全院各科室的及时勤苦进度、医护资源应用趋势与业务流量变化。
天津市瑞通预应力钢绞线有限公司同期对床位占用、环节诞生运办事态进行全天候及时监控,旦出现资源病笃或负荷情况,会自动触发忙碌预警与亮指示。
左侧航栏中的不同科室选项,可以伸开对应科室的详备运营数据与业务倡导,界面会自动切换至属科室视图。
当光标悬浮在科室床位分散的饼状图上时,还会及时弹出浮动指示框,显着展示床位占用、优游、预留等细分数据。
要是仔细不雅察布景的院区布局图层就会发现,每个科室选项,场景王人会自动平滑滑动,将镜头定位到对应科室的物理位置上。
再来个漂荡员得志仪容盘:
制作个艺术化得志仪容盘,使用 WebGL 渲染 3D 真确地球。列国主要城市炫耀发光秀丽点,钢绞线厂家后镜头平滑放大到对应区域,并切换为半透明 2D 类似层,展示该地区的详备得志图表。数据通过 WebSocket 及时流式传输,网罗非常时自动降使用缓存快照,保证界面知道运行。
可视化交互的果可以,但有个问题是这个模子弗成告成预览能够给出预览网址,生成代码后还告成动粘贴保存文献才气检察。
除了理和编程场景,端云协同亦然 Step 3.5 Flash 造的实用才略,中枢念念路是云霄负责脑的策画与理,端侧负责安全的数据读取与腹地奉行。
在官的电商比价演示中,面临用户"对比 Mac Mini M4 各平台价钱"的需求,Step 3.5 Flash 化身云霄大脑,告成将复杂的比价任务,拆解为隔离查询淘宝、京东、拼多多的立小任务。
云霄提前作念好任务策画后,腹地的 Step-GUI 就需复杂念念考,只需要注完成数据捏取使命。
后由云霄统汇总所有价钱信息,快速比对后为用户生成显着的购买参考。
已加快
主个数据不出腹地、心事不上云。
模子架构
架构层面,Step 3.5 Flash 选拔的是 MoE 衰退混架构。
总参数目达到 196B,但在内容理经由中,每个 Token 仅激活约 11B 参数。在保证模子才略的同期,通过衰退激活有竣事了推断与部署本钱。
针对长高下文化,模子使用3:1 滑动窗口细心力与全细心力交错的案,缓解了传统长文本模子的失忆问题。
此外,研发团队将 SWA 层的查询头数从 64 加多到 96,在不扩大 KV 缓存占用的情况下增强了模子的表征才略。
为了确保数值知道,模子还集成了头向门控细心力,通过动态调治信息流向来看处分经由的知道。
在理率上,Step 3.5 Flash 选拔了3 路多 Token 掂量(MTP-3)本事,允许模子在主输出的同期并行掂量将来的多个 token,并通过并行考据机制在单次处理中校验多个 token 假定。
这种式使其在 NVIDIA Hopper GPU 上的单流编程任务中,理峰值达到 350TPS。
为了强化模子理与智能体奉行才略,Step 3.5 Flash 还搭载了自研的MIS ‑ PO强化学习框架。
用严格的样本过滤机制替代了传统的迫切加权推断,有减少了数据噪声与梯度差,让模子在长序列任务上的化知道;即便在大界限离线考试的环境中,依然能保持可靠的输出。
此外,据官涌现,Step 4 也正在考试中。
参考聚合:https://static.stepfun.com/blog/step-3.5-flash/
— 迎接 AI 家具从业者共建 —
� �「AI 家具常识库」是量子位智库基于始终家具库跟踪和用户行为数据出的飞书常识库,旨在成为 AI 行业从业者、投资者、相干者的中枢信息环节与有筹办复古平台。
键原宥 � � 点亮星标
科技前沿推崇逐日见延边预应力钢绞线厂
相关词条:管道保温施工 塑料挤出设备 预应力钢绞线 玻璃棉厂家 保温护角专用胶