切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
特斯拉发布D1 AI芯片:500亿晶体管、400W热设计功耗 ...
菲龙网编辑部7
有 744 人收听 TA
138360
主题
138377
回复
164111
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/16
韩勇被逮捕!
0/15
无名烈士紧握女子照片82年,有网友称女子是其“二姑奶奶”,当地:以DNA比对结果为准
0/15
县委书记接受高档宴请、收受高档白酒和礼金第二天,被查了!
0/16
“70后”女性中央候补委员,有新身份
0/14
女生把列车清洁袋当“漂流瓶”,写下考研抱负,引发万千网友共鸣
0/10
成都范围内住房交易不再审核户籍、社保等购房条件,不再限制购买套数
0/15
重庆“燃气表跑得快”联合调查组:只有极个别表失准
0/10
哈尔滨道里区一小区独立结构楼体出现整体倾斜险情,当地通报:实施拆除
0/19
广州白云区龙卷风造成5人死亡33人受伤
查看TA的全部帖子>>
特斯拉发布D1 AI芯片:500亿晶体管、400W热设计功耗
时间:2021-8-23 07:36
0
3065
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
近日的特斯拉AI日活动上,特斯拉公布了最新的AI训练芯片“D1”,规模庞大,令人称奇。
该芯片采用
台积电7nm工艺制造,
核心面积达
645平方毫米
,仅次于NVIDIA Ampere架构的超级计算核心A100(826平方毫米)、AMD CDNA2架构的下代计算核心Arcturus(750平方毫米左右),集成了多达
500亿个晶体管
,相当于Intel Ponte Vecchio计算芯片的一半。
其内部走线,长度超过11英里,也就是
大约18公里。
它集成了四个64位超标量CPU核心,拥有多达354个训练节点
,特别用于8×8乘法,支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式,都是AI训练相关的。
特斯拉称,D1芯片的FP32单精度浮点计算性能达22.6TFlops(每秒22.6万亿次),BF16/CFP8计算性能则可达362TFlops(每秒362万亿次)。
为了支撑AI训练的扩展性,它的互连带宽非常惊人,
最高可达10TB/s
,由多达576个通道组成,每个通道的带宽都有112Gbps。
而实现这一切,
热设计功耗仅为400W。
特斯拉D1芯片可通过DIP(Dojo接口处理器)进行互连,
25颗组成一个训练单元(Training Tile)
,而且多个训练单元可以继续互连,单个对外带宽高达36TB/s,每个方向都是9TB/s。
如此庞然大物,耗电量和发热都是相当可怕的,电流达18000A,覆盖一个长方体散热方案,散热能力高达15kW。
特斯拉展示了实验室内部的一个训练单元,
运行频率2GHz,计算性能最高9PFlops(每秒9千万亿次)。
特斯拉还用D1芯片,打造了一台AI超级计算机“ExaPOD”,配备120个训练单元、3000颗D1芯片、1062000个训练节点,FP16/CFP8训练性能峰值1.1EFlops(每秒110亿亿次计算)。
建成后,
它将是世界上最快的AI超算
,对比特斯拉现在基于NVIDIA方案的超算,成本差不多,但拥有4倍的性能、1.3倍的能效比、1/5的体积。
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/2
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
第二届菲律宾华人线下招聘会参展公司在招岗位合集(上)
2023菲律宾第二届华人线下招聘会参展公司岗位集合!
查看 »
快速回复
返回列表
返回顶部