切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
斯里兰卡频道
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合 ...
菲龙网编辑部7
有 744 人收听 TA
154828
主题
154845
回复
181273
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/26
微短剧开播!丹巴籍演员兰卡腾杰用角色传乡音
0/29
宗庆后遗产争夺战愈演愈烈,施幼珍为何始终沉默?
0/28
《生万物》银子被迫为宁学祥玩物,方知苏苏为何与郭龟腰通奸生女
0/21
美女配丑男,实在嗑不动……
0/34
《生万物》结局:绣绣晚年凄惨,看懂宁学祥遗言,才知她是自找的
0/26
弃剧了!《生万物》露露倒贴大脚逼宫绣绣,狗血剧情气得人无语
0/28
以电影级制作,真实还原抗战艰辛
0/22
央媒锐评萌宝微短剧:不能无底线「消费童年」
0/24
《生万物》:土匪围村前后的苍凉人性,小山村里的大隐喻
查看TA的全部帖子>>
DeepSeek-V3.1震撼发布,全球开源编程登顶!R1/V3首度合体,训练量暴增10倍
时间:2025-8-22 09:53
0
28
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
新智元报道
编辑:桃子
【新智元导读】DeepSeek-V3.1官宣了,作为首款「混合推理」模型,将开启智能体新时代。新模型共有671B参数,编码实力碾压DeepSeek-R1、Claude 4 Opus,登顶编程开源第一。
官宣了!
刚刚,DeepSeek正式上线DeepSeek-V3.1,这是迈向智能体时代第一步。
新版V3.1采用了「混合推理」,一个模型,两种模型:思考与非思考(自主切换)。
相较于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快。
最关键的是,V3.1具备了强大的智能体能力,不论是工具使用,还是多步骤任务,全部拿捏。
在软件工程基准测试中,DeepSeek-V3.1全方位碾压V3-0324和R1-0528。
在人类的最后考试HLE中,V3.1拿下了29.8高分,另外在数学、知识问答、编程等任务中,全面超越推理模型R1。
CoT压缩训练后,V3.1-Think在输出token减少了20%-50%,与R1-0528打成平手
在Hugging Face上,一共开源了两款V3.1 Base和V3.1,前者在V3基础上又进行了8400亿token的持续预训练,扩展了上下文支持。
项目地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
总的来说,DeepSeek-V3.1此次更新的最大亮点:
参数共671B,激活参数37B,上下文128k
混合推理模式:一个模型,即可同时支持推理模式和非推理模式。
更智能的工具调用能力:工具使用、智能体任务有了显著提升,多步推理能力强化,复杂搜索不在话下
更高的推理效率:回答质量上与DeepSeek-R1-0528相媲美,思考效率飙升,反应快如闪电
全面基准测试:实力全面碾压DeepSeek-R1-0528、DeepSeek-V3-0324
在API方面,deepseek-chat是非思考模式,deepseek-reasoner是思考模式,全部支持128k。
从9月5日开始,采用新的API定价
继OpenAI gpt-oss之后,DeepSeek终于做出了最强回应。
V3.1编程击败Claude 4,训练扩增10倍
HF模型卡中,给出了DeepSeek新模型技术的详细解读。
基于DeepSeek-V3.1-Base,DeepSeek-V3.1通过后训练优化完成。而V3.1-Base又是基于V3模型训练而来。
具体来说,它通过「两阶段长上下文扩展策略」构建,遵循了原始V3论文中的方法。
研究团队又扩展了数据集,收集了更多长文档,并大幅延长了两个训练阶段的规模。
32k扩展阶段增加了10倍,达6300亿Token,而128k扩展阶段增加了3.3倍,达到2090亿Token。
此外,DeepSeek-V3.1采用UE8M0 FP8缩放数据格式进行训练,确保与微尺度数据格式的兼容性。
在通用能力的基准测试中,开启思考模式V3.1,在MMLU、GPQA上拿下了亮眼的成绩。
数学方面,V3.1同样刷新SOTA,创下了最高分。
如上文所述,V3.1是迈向智能体时代第一步。它可以支持多种Code Agent框架,开发者可以自己搭建智能体。
在编码测试中,DeepSeek-V3.1-Thinking在Aider编码测试中,拿下了76.3%高分,远超Claude 4 Opus、Gemini 2.5 Pro(0325)。
在编码智能体测试中,DeepSeek-V3.1-Non Thinking性能碾压R1、V3。
此外,DeepSeek-V3.1可以支持Search Agent,在推理模式下可以使用。
当需要访问外部信息或最新信息的复杂问题,V3.1可以通过多轮工具调用流程,利用用户提供的搜索工具来完成。
基准测试中,尤其是BrowseComp上,V3.1实力粉碎了R1。
**Artificial Analysis基准,同样验证了DeepSeek-V3.1强大实力,仅次于gpt-oss。
在推理效率方面,V3.1也与OpenAI相当。
如今来看,DeepSeek-V3.1稳坐编程开源第一王座。
参考资料:
https://x.com/karminski3/status/1958429843558945015
https://x.com/deepseek_ai/status/1958417062008918312
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
菲律宾新闻
华人世界
中国新闻
菲龙广场
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部