切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek-V3.1正式发布:思考时间变短,但API调用价格涨 ...
菲龙网编辑部7
有 744 人收听 TA
156632
主题
156649
回复
183153
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/233
东西问|戈尔·赛格桑:我对中国研究的主要建议是尽快去中国
0/260
东西问|王英津:设立台湾光复纪念日,意义何在?
0/211
评论:说走就走 “馆长”大陆行再踏藩篱
0/232
记者手记:在庆州,当千年古都遇见APEC
0/232
APEC会议“非正式”,却为何如此重要?
0/216
(近观中国)四中全会后首访,中国元首外交为何落子亚太?
0/222
习近平将同美国总统特朗普举行会晤
0/290
法国卢浮宫盗窃案被捕嫌犯“部分认罪” 被盗珠宝仍未寻回
0/328
每分钟还200万美元利息,“美债炸弹”膨胀
查看TA的全部帖子>>
DeepSeek-V3.1正式发布:思考时间变短,但API调用价格涨了
时间:2025-8-22 09:52
0
486
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
界面新闻记者 | 宋佳楠
DeepSeek用户没能等到传闻中的R2模型,但V3.1版先来了。
8月21日,界面新闻从DeepSeek官方公众号获悉,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。
据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。如果仅从命名来看,DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。
DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。
官方数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。
R1-0528与V3.1-Think的token消耗量对比图
同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。
通过Post-Training(后训练,大语言模型训练流程中的关键阶段)优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1相较以往模型进步明显。
社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了Anthropic的Claude 4 Opus等多个知名模型,且完成一次编程任务的成本仅为1.01美元,成本效益优势显著。
随着V3.1发布,DeepSeek也同步调整了API接口调用价格,并取消夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。
DeepSeek-V3.1 API调用价格
值得注意的是,DeepSeek还在评论区中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
此前有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。
DeepSeek(深度求索)是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。
截至目前,DeepSeek推出了DeepSeek-V3、DeepSeek-R1等模型,具备混合专家架构(MoE)、多头潜在注意力(MLA)等技术优势,在数学推理、代码生成等任务上表现出色,且训练和推理成本较低。其部分模型采用MIT许可开源(一种广泛使用的开源软件许可证),已在金融、医疗等领域落地应用。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
菲龙广场
摄影爱好
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部