博罗| 那曲| 海淀| 晋城| 交城| 容城| 新建| 宜宾县| 齐齐哈尔| 屏东| 马尔康| 和龙| 共和| 龙泉驿| 唐山| 长子| 林芝县| 吉利| 天镇| 顺德| 辽宁| 阳西| 鹰潭| 公主岭| 吉首| 鲁甸| 正定| 黄石| 章丘| 胶州| 嘉义县| 鹤山| 印江| 东阳| 户县| 尼玛| 杭锦后旗| 兴海| 湛江| 灵宝| 涿鹿| 安徽| 鄂伦春自治旗| 柳河| 天峻| 龙陵| 平顶山| 习水| 贵定| 额尔古纳| 汉沽| 汝阳| 铜山| 顺德| 莱州| 大城| 宝应| 新青| 井冈山| 福鼎| 科尔沁右翼中旗| 汤旺河| 普宁| 易门| 聂荣| 嘉义县| 嘉义县| 旬阳| 班玛| 腾冲| 邹城| 扎囊| 嘉义市| 绥德| 松桃| 郫县| 民和| 上饶县| 民和| 莱芜| 岱山| 旬邑| 峨眉山| 霞浦| 昭觉| 会泽| 二道江| 阿图什| 尚义| 济阳| 竹山| 单县| 和县| 乌兰察布| 赞皇| 蒙城| 禄劝| 漳州| 乌达| 莱芜| 武隆| 察布查尔| 弋阳| 平阴| 万载| 固始| 两当| 宁县| 双桥| 台江| 庆安| 武隆| 开阳| 围场| 德惠| 昭通| 佛坪| 梅里斯| 盐池| 盐山| 永安| 南票| 岷县| 科尔沁左翼中旗| 江孜| 君山| 鹰潭| 红星| 围场| 彬县| 惠农| 汉南| 永善| 龙海| 涞源| 吉安县| 张家川| 青州| 新和| 岑溪| 湘乡| 织金| 台安| 安塞| 维西| 黑龙江| 伊通| 康马| 恒山| 聊城| 本溪满族自治县| 龙口| 石景山| 安岳| 盐都| 莒南| 达尔罕茂明安联合旗| 东平| 岳西| 渠县| 府谷| 扬州| 襄城| 新宾| 竹山| 远安| 高唐| 清河门| 海城| 靖州| 抚顺县| 崇左| 湖口| 开阳| 金州| 歙县| 武威| 庆元| 纳溪| 金昌| 闽侯| 开原| 定南| 无为| 苍山| 延安| 福安| 三穗| 鼎湖| 红古| 邢台| 贡觉| 沈丘| 景宁| 荥阳| 丹江口| 唐山| 永靖| 武平| 双阳| 泸西| 靖江| 新河| 通化县| 东方| 绍兴市| 黄山市| 杞县| 绍兴市| 从化| 自贡| 临邑| 冠县| 正镶白旗| 湛江| 金湾| 宜兴| 涿州| 永登| 惠阳| 淄博| 大悟| 吉县| 大同县| 邢台| 山丹| 华容| 芒康| 黟县| 孟津| 克什克腾旗| 丰顺| 花溪| 积石山| 旬阳| 湖南| 讷河| 郁南| 交城| 广汉| 襄垣| 南木林| 革吉| 林芝镇| 长治市| 仙游| 丰宁| 罗甸| 乌拉特前旗| 尚志| 阿荣旗| 罗城| 武陵源| 洛浦| 普宁| 石拐| 太白| 永年| 榆林| 大荔| 兴仁| 忻城| 普兰店|

劳动人事争议仲裁办案规则(修订草案)(征求

2019-08-24 06:02 来源:宜宾新闻网

  劳动人事争议仲裁办案规则(修订草案)(征求

  但是展会上贝唯他展馆里的人非常多,场面有点热,所以当场也没能聊什么,另外还有个原因,其实做为一个经销商选择代理合作一款新的产品还是要十分谨慎的,因为目前市场是吹牛的品牌或者假洋鬼子太多了,一旦误选,害人害己啊。中铝集团是我国国内有色金属行业的最大生产企业,目前已经成为全球第二大氧化铝生产商、全球第三大电解铝生产商、铝加工材产量世界第五,亚洲最大、装备水平最高的铝加工基地,综合实力成功跻身于世界三大铝业公司。

丽江市还提出打好沿江产业的“三张牌”:农业部门做好规划布局,发展生态花园、果园、菜园,打好“绿色食品牌”;倡导新能源绿色交通方式,发展沿江清洁载能产业,打好“绿色能源牌”;补齐卫生短板,发挥绿色资源优势,发展沿江民宿业和体验式休闲度假旅游,推进国际健康城建设,打好“健康生活目的地牌”。观照现实、反映社会生活的现实主义题材网络文学作品正在获得越来越多的关注,而阅文集团亦将持续发挥平台、渠道优势,努力发掘、倡导更多现实主义题材作品的创作,助力《中国铁路人》等优秀作品得到更好的传播与推广。

  而这一变更是为了进一步反映公司所处行业,明确了紫光国微聚焦微电子领域的核心业务定位。不少专家指出,对茅台集团来说,多元化应该是其做大做强必然的选择,但未来重点应放在“防范风险”上,从而推动集团整体健康发展。

  微信公号“YNTV2都市条形码”昨天(5月10日)条码君发布了消息→触目惊心!上百村民围着垃圾场挖冻肉!!鸡翅、牛肉去向成谜,忍吐怀疑人生.....,今天(5月11日)一早,金平县人民政府新闻办在官网发布了以下通告:5月10日下午5点50分,广播电视台二套都市频道都市条形码以《“严打”之下的走私肉:复活》为题,报道了金平县经无害化处理过的走私冻肉制品被群众盗挖的新闻,并在其官方微信公众号同步发布帖文。2018年3月10日至11日,在摇滚马拉松中国区第二站落地云南罗平之际,由云南省体育局、曲靖市人民政府、万达体育集团有限公司主办,罗平县人民政府、曲靖市文化体育局、曲靖市旅游发展委员会、万达体育中国公司承办的首届罗平农体旅产业融合发展高峰论坛(之后简称:高峰论坛)于曲靖市罗平县成功举办。

在国内芯片企业中,紫光集团布局较广,涉及产业链上的设计、生产到封测等环节,但国内整体芯片布局处于比较早期阶段。

  “纯悦”延续可口可乐与全球顶级赛事合作的传统,于2016年加入奥林匹克全球合作伙伴的行列,先后成为中国国家游泳队、2018平昌冬奥会及2018年俄罗斯FIFA世界杯的信赖之选。

  编辑:李燕华天保工程成效显著云南地处长江、珠江等国内重要河流和湄公河、萨尔温江、红河、依洛瓦底江等国际重要河流的源头或上游,是我国重点林区省份之一,也是全国乃至世界生物多样性最富集的区域之一,生态区位重要,国际影响巨大。

  值得注意的是,东北板块的辽宁省也交出一份亮眼的成绩单。

  (原标题为《我省向社会推介135个PPP项目总投资达亿元》)“人民对美好生活的向往,就是我们的奋斗目标。

  从国际精品旅游胜地丽江古城出发向北行进,穿越玉龙雪山风景旅游区,再向东北方向延伸到鸣音、大东、宝山、奉科,沿西北方向进入大具、下虎跳峡,这个过去在丽江被称为“东部林区”的区域,如今已经变成了令人向往的著名旅游风景区,每年吸引着数百万中外游客到这里休闲度假、旅游观光。

  小肥羊内蒙古小肥羊餐饮连锁有限公司1999年8月诞生于内蒙古包头市,以经营小肥羊特色火锅及特许经营为主业,兼营小肥羊调味品及专用肉制品的研发、加工及销售业。

  建立了60多家战略合作单位,有效对接社会拥军企业、军旅企业,打造为退伍士兵就业创业服务的大平台;连续三年承办京津冀退伍士兵就业“双选会”和2017年中央企业面向北京市退伍士兵就业招聘会,为京津冀退伍士兵提供7100多个就业岗位,解决了4700余名京津冀退伍士兵就业问题,在努力实现退伍士兵就业安置社会化、市场化和常态化方面做出了重要贡献。孙梅欣俊发地产总裁张海民今年1月初,经历了人事动荡的张海民,宣布加入云南本土龙头房企俊发地产,接任总裁一职。

  

  劳动人事争议仲裁办案规则(修订草案)(征求

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

本文作者:程弢 2019-08-24 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
通过前期实地调研,“2018掌趣公益-桃李天乡村教师培训”项目首站放在了甘肃省武山县。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
趣园巷 道孚县 广东三水区乐平镇 洛古波乡 孙庄子乡
雨儿胡同 大平房镇 华苑西路 南武湾村 天通苑第一社区