搜索
APP下载
扫码下载APP
关注我们
XHS
小红书
抖音
Facebook
X
YouTube
登录
注册
首页
热点资讯
互动论坛
同城服务
人才网
实用工具
搜索
每日签到
本地新闻
时事评论
华人世界
斯里兰卡资讯
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
本地新闻
全网热搜
华人世界
时事评论
中外新闻
斯里兰卡资讯
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
支票转换
便民电话
话费充值
实时汇率
每日签到
我的任务
道具商店
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek知乎披露开源周数据 理论利润率达545% ...
菲龙网编辑部7
有 745 人收听 TA
158105
主题
158122
回复
184820
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/513
白宫宣布有“两个国王”?尴尬的远不止英国国王查尔斯
0/510
欧佩克“大群”,阿联酋为何想退就退?
0/465
“长期封锁”伊朗,美国的财政扛得住吗?
0/494
外媒:土耳其拒绝以色列总统专机飞越其领空
0/442
东西问丨田轩:不抄硅谷、不仿德国,中国金融支持创新如何走出“第三条路”?
0/445
东西问|王彩玲:将制度优势转化为治理效能,中国如何在长江书写“答卷”?
0/425
三亚亚沙会:中国体育代表团已创参赛历史最好成绩
0/471
中新人物丨“网红”导游迪丽努尔:想做一个小小而结实的桥梁
0/408
万万没想到,高德地图被民进党捧红了
查看TA的全部帖子>>
DeepSeek知乎披露开源周数据 理论利润率达545%
时间:2025-3-3 09:35
0
940
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
来源:环球网
【环球网科技综合报道】3月1日,DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。
文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。
值得一提的是,文章还率先披露了DeepSeek的成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”
据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论和赞叹。
“话不多说,DeepSeek和OpenAI一样重要。”知乎大模型话题优秀答主、算法工程师“刘聪NPL”如此评价。业内人士甚至认为,“DeepSeek开源周”的重要性已经超过了不久前OpenAI的发布会。DeepSeek用“量大管饱”的开源有力回击了欧美关于DeepSeek故意说低训练成本的说法,并且证明了在训练链路上存在极大的优化空间。“刘聪NPL”在开源周最后一天就感叹:“真没想到,最后一天DeepSeek对存储下手啊!”而知乎编程话题优秀答主“平凡”在第三天就做出判断:“这些工作几乎不可能在国外的AI公司里面完成。”(勃潺)
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
菲龙广场
华人世界
扫码添加微信客服
快速回复
返回列表
返回顶部