搜索
APP下载
扫码下载APP
关注我们
XHS
小红书
抖音
Facebook
X
YouTube
登录
注册
首页
热点资讯
互动论坛
同城服务
人才网
实用工具
搜索
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
本地新闻
全网热搜
华人世界
时事评论
中外新闻
斯里兰卡资讯
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
支票转换
便民电话
话费充值
实时汇率
每日签到
我的任务
道具商店
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调 ...
菲龙网编辑部7
有 745 人收听 TA
158399
主题
158416
回复
185168
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/326
东西问丨郝鲁怡:以发展权赋能气候正义 深化中欧绿色伙伴关系
0/286
东西问|董波:当亚里士多德“重返”希腊,古典伦理学能为当代解忧吗?
0/369
两天内4名驻冲绳美军士兵涉嫌违法被逮捕
0/331
外媒:美伊协议内容曝光 美国将取消制裁并解冻伊朗资产
0/318
本来想低调,但实力不允许!风靡全球的“液体黄金”竟然藏在这里
0/345
(聚焦海峡论坛)台湾媒体人:张凌赫走红台湾是年轻世代共鸣大陆文化的缩影
0/320
(聚焦海峡论坛)台舆论关注海峡论坛:释实质利好 赴陆热难挡
0/328
(经济观察)中国汽车的AI进行时:技术渗透全链,产业格局渐变
0/314
中国制造、中国技术、中国IP,成为世界杯“隐形冠军”
查看TA的全部帖子>>
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
时间:2025-9-30 14:02
0
1289
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
9月29日,DeepSeek-V3.2-Exp模型正式发布,并已在Huggingface与魔搭开源。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。
据官方介绍,DeepSeek-V3.2-Exp 模型是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
具体来说,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
据“华为计算”微信公众号消息,9月29日,DeepSeek-V3.2-Exp发布并开源,引入稀疏Attention架构。昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。
DeepSeek还表示,在新模型的研究过程中,需要设计和实现很多新的GPU算子。官方使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含TileLang与CUDA两种版本。官方建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。
得益于新模型服务成本的大幅降低,官方API价格也相应下调。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
DeepSeek于8月21日正式发布 DeepSeek-V3.1,本次升级包含以下主要变化:首先是混合推理架构,一个模型同时支持思考模式与非思考模式;其次是更高的思考效率,相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;最后是更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
9月22日,DeepSeek-V3.1更新至DeepSeek-V3.1-Terminus版本,此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:语言一致性,缓解了中英文混杂、偶发异常字符等情况;Agent 能力,进一步优化Code Agent与Search Agent的表现。官方表示,DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定
为了严谨地评估引入稀疏注意力带来的影响,官方特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
菲律宾新闻
扫码添加微信客服
快速回复
返回列表
返回顶部