DeepSeek-V3.1正式发布：思考时间变短，但API调用价格涨了

马上注册，结交更多好友

您需要登录才可以下载或查看，没有账号？立即注册

x

界面新闻记者 | 宋佳楠

DeepSeek用户没能等到传闻中的R2模型，但V3.1版先来了。
8月21日，界面新闻从DeepSeek官方公众号获悉，其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。
据DeepSeek介绍，新升级版本的变化主要体现在三个方面：混合推理架构、更高的思考效率、更强的Agent（智能体）能力。如果仅从命名来看，DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。
DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑，当面对简单问题时，能以非思考模式快速给出答案。而在处理复杂问题时，可切换到思考模式，给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。
官方数据显示，与DeepSeek-R1-0528相比，DeepSeek-V3.1在思考模式下效率大幅提升，能在更短时间内给出答案，且经过思维链压缩训练，token（大模型文本处理的最小单位）消耗量可减少20%至50%，各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。

R1-0528与V3.1-Think的token消耗量对比图
同时，V3.1在非思考模式下的输出长度也得到了有效控制，相比于DeepSeek-V3-0324，能够在输出长度明显减少的情况下保持相同的模型性能。
通过Post-Training（后训练，大语言模型训练流程中的关键阶段）优化，新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中，DeepSeek-V3.1相较以往模型进步明显。
社区第三方测试数据显示，在Aider多语言编程基准测试中，V3.1取得了71.6%的高分，超越了Anthropic的Claude 4 Opus等多个知名模型，且完成一次编程任务的成本仅为1.01美元，成本效益优势显著。
随着V3.1发布，DeepSeek也同步调整了API接口调用价格，并取消夜间优惠。自北京时间2025年9月6日凌晨起，输入价格方面，缓存命中时为0.5元/百万tokens，缓存未命中时则涨至4元/百万tokens（此前V3为2元/百万tokens）；输出价格调整为12元/百万tokens（此前V3为8元/百万tokens）。

DeepSeek-V3.1 API调用价格
值得注意的是，DeepSeek还在评论区中提到，DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外，V3.1对分词器及chat template进行了较大调整，与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示，UE8M0 FP8是针对即将发布的下一代国产芯片设计。
此前有第三方数据显示，DeepSeek用户使用率和官网流量回落。据第一财经报道，360集团创始人周鸿祎对此表示，DeepSeek官网流量下降是因为DeepSeek没有花心思，但现在很多第三方云服务上都有DeepSeek的服务，用了DeepSeek的大模型流量一直很高。在中国，许多公司包括360智能体的基座模型等都使用DeepSeek来改，相当于很多公司的“武器装备”都是DeepSeek提供的。
DeepSeek（深度求索）是2023年成立于杭州的人工智能公司，由幻方量化孵化。创始团队由梁文锋领衔，成员来自顶尖高校与国际机构技术专家。
截至目前，DeepSeek推出了DeepSeek-V3、DeepSeek-R1等模型，具备混合专家架构（MoE）、多头潜在注意力（MLA）等技术优势，在数学推理、代码生成等任务上表现出色，且训练和推理成本较低。其部分模型采用MIT许可开源（一种广泛使用的开源软件许可证），已在金融、医疗等领域落地应用。

菲龙网编辑部7

本文来自

科技新闻

菲龙网编辑部7发布过的帖子

DeepSeek-V3.1正式发布：思考时间变短，但API调用价格涨了

马上注册，结交更多好友