位置:编程技术网 > 研发管理 > 正文 >

深度揭秘华为AI战略!软硬件两手抓,AI王国雏形已现

2019年10月13日 01:43来源:未知手机版

驱蚊子,601600资金流向,女人吧

首页资讯视频直播财经娱乐体育时尚汽车房产科技读书游戏文化历史军事旅游佛教更多国学数码健康家居彩票公益酒业科技 数码 正文深度揭秘华为AI战略!软硬件两手抓,AI王国雏形已现| 智东西内参

2019年10月12日 19:27:29
来源:智东西

0人参与0评论

2019 年 7 月,华为总裁任正非在主题为《钢铁是怎么炼成的》的讲话中提到,“5G 就是一个小儿科,过于被重视了。5G 提供高带宽、低时延,支撑的是人工智能,人工智能才是大产业。”华为作为传统的 ICT 商,进军 AI 领域绝非头脑发热或盲目跟风,而是出于对自身业务整合的深入考量。AI 作为当今科技界技术风口,不仅拥有广阔的潜在市场空间,同时可以将华为 ICT、消费电子、IoT、云服务等业务联接起来。

本期的智能内参,我本期的智能内参,我们推荐安信证券的研究报告《华为的AI野望》,详解华为硬件和软件的AI体系,揭秘华为AI战略布局。如果想收藏本文的报告(华为的AI野望),可以在智东西(公众号:zhidxcom)回复关键词“nc408”获取。

一、 硬件体系:华为 AI 业务根基 1、 昇腾:专注于 AI 场景的华为芯

昇腾 310+910,云端两极体系已然成型。2018 年 10 月 10 日,华为正式在 2018 全联接大会上发布昇腾 310 和昇腾 910 两款 AI 芯片。昇腾将打造 Max、Mini、Lite、Tiny 和 Nano 五大系列,以面对各种不同的应用场景。其中,昇腾 310 属于 Mini 系列,昇腾 910 属于 Max 系列。

▲各类昇腾芯片横跨全场景的最优表现

昇腾 310 定位于边缘侧及端侧 AI 芯片,着重 AI 推理能力。昇腾 310 的 FP16 浮点运算算力达到 8TOPS,INT8 整型运算算力达到 16TOPS,最大功耗为 8W,采用 12nm 制程工艺。昇腾 910 定位于云端 AI 芯片,着重 AI 训练能力。昇腾 910 的 FP16 浮点运算算力达到256TOPS,INT8 整型运算算力达到 512TOPS,最大功耗为 350W,采用 7nm 制程工艺。目前,昇腾 910 的性能指标已在一定程度上超过了谷歌和英伟达推出的主流 AI 芯片。

▲昇腾 910 与 310 参数特征

▲主流 AI 芯片横向对比

达芬奇架构,锁定 AI 算子级别优化。针对 AI 计算场景,华为研发了达芬奇指令集架构,具备高算力、高能效、灵活可裁剪的特性。达芬奇架构的主要特性是针对矩阵运算的 3D Cube技术。AI 计算过程中由于神经网络链式求导的需求,大量张量(高维矩阵)计算成为传统处理器速度的瓶颈。3D Cube 技术针对矩阵运算做加速,使 AI核心在一个时钟周期内实现 4096个 MAC 操作,从而相对 CPU 和 GPU 产生数量级的提升。

▲达芬奇架构的 3D Cube 技术

CANN 芯片算子库,工欲善其事必先利其器。CANN 指神经网络计算架构,是位于芯片底层之上的芯片算子库和算子开发工具包。CANN 兼具最优开发效率和算子性能,其核心是高度自动化算子开发工具 Tensor Engine。通过统一的 DSL 接口,配合预臵的高层模板封装、自动性能调优等工具集合,用户可以方便地在昇腾芯片上开发自定义算子。同时,CANN 已经支持所有主要 AI 框架。同样在昇腾芯片上开发这个算子,通用的 DSL 需要 63 Loc,而Tensor Engine DSL 仅需 22 Loc 就能实现同样的功能,开发效率提高将近 3 倍,是开发者提高效率的有力工具。

本文地址:http://www.reviewcode.cn/yanfaguanli/81861.html 转载请注明出处!

今日热点资讯