位置:编程技术网 > 产品设计 > 正文 >

百度AI计算系统首次亮相2019CES 解决人工智能算力提升难题

2019年01月10日 13:45来源:未知手机版

苦笑直播,教师日记,假肢吧,洛阳招聘,智利大学葡萄牙 西班牙,摩洛哥伊朗

提高AI计算能力,为企业提供更好和更多的定制化解决方案是全球人工智能领域关注热点。美国拉斯维加斯时间1月8日2019CES开幕,百度展区的AI计算系统展台前人气火爆,这是百度全球领先的AI计算系统首次亮相国际舞台,观众和全球媒体把目光纷纷聚焦于此,希望透过百度这家中国AI 头雁 企业,感受中国在AI领域的创新实力。

百度AI计算系统展台拥有的超强AI实力系统,包括了百度自主研发的最新超级AI计算平台X-MAN3.0和支撑百度AI计算层面的FAST-F AI存储系统、百度AI计算训练平台KongMing、AI推理加速引擎Anakin等软件,服务于百度搜索、DuerOS、Apollo、百度智能云等核心业务。

算法、数据和计算是推动AI深度学习技术快速发展的三大要素。在人工智能应用场景和规模快速发展的背后,为支持更强的泛化能力,更高的预测精度,算法模型日趋复杂,越来越多的数据需要被及时标注和处理,计算性能成为关键。图像分析的样本量级大约为百亿级,而语音分析也达到了十万小时级。训练数据样本量越来越大,且主要是小文件,对存储系统的成本和性能都提出了很大挑战。最新的算法发展比如Deep Speech、BERT对整个计算需求所造成的挑战变得更大,同时AutoDL等技术在简化模型研发设计的同时也对算力提出了更高的要求,因此针对AI场景需要一整套计算系统,包括支持海量小文件高速访问的并行文件系统、AI计算机、大规模分布式训练平台以及在线服务推理框架,这正是百度AI计算系统要解决的挑战,提升整个计算系统的性能与效率提高尤为重要。

在百度AI计算系统展台最受瞩目的超级AI计算平台X-MAN3.0,就是专为AI深度学习场景优化设计,极大加快了AI深度学习模型的训练速度。还专门设计了两级AI加速芯片互联交换体系,是目前扩展AI加速器数量最多的AI计算平台之一,单机性能可达到2000 TOPS,可以为百度超大规模AI训练带来超出预期的应用价值。随着AI人工智能技术的快速发展,众多AI芯片公司应运而生,AI芯片格局正呈现多元化发展趋势。X-MAN3.0采用了硬件系统模块化、互联接口标准化、互联拓扑高灵活性的设计思路,既提升了多元化AI加速芯片的兼容性,也促进了AI加速芯片生态健康、快速、可持续的发展。

凭借着对AI业务模型的深刻理解、扎实的硬件基础架构技术和对行业趋势的准确预判,百度设计了X-MAN AI计算平台系列产品,创造了6项业界第一,包括单机16卡、支持64卡扩展、硬件解耦、资源池化、无损通信、液冷散热等,同时期关键技术 性能保持领先,引领行业发展趋势。该系列技术也获得了2018年中国国家专利技术优秀奖。

百度X-MAN的问世与升级为人工智能领域解决算力提升问题做出了重要贡献,成为人工智能发展真正的加速器。目前,X-MAN系列产品已在百度实现规模化部署,广泛应用于语音识别、计算机视觉、自然语音处理、无人车等基础AI技术的深度学习模型训练;X-MAN与FAST-F AI存储系统、百度AI计算训练平台KongMing一起构建了端到端的训练方案,将训练时间从周级别缩短到天级别,服务于百度DuerOS、Apollo、百度智能云等核心业务,助力百度AI战略的快速落地。

AI推理加速引擎Anakin是另一个吸引了众多业内关注的百度AI产品。它解决的痛点是能够跨越不同的深度学习训练框架。近几年,为了解决AI计算力提升问题,业界涌现出了很多优秀的解决方案。但是带来的问题是,不同训练框架需要的运营环境不同。这意味着每个训练框架在每个硬件平台下都需要各搭建一套运行环境,甚至还有些框架是不支持某些硬件平台的。他们之间的不互通,使得很多AI应用落地受到了阻碍。

Anakin主要由独立的Parser、灵活的Framework和高效的Saber计算库三部分组成。独立的Parser实现了将不同训练框架生成的model转换为Anakin计算图的解析功能,它支持任何训练框架生成的model解析,屏蔽了不同训练框架的差异。灵活的Framework屏蔽了底层硬件的差异,用于实现与硬件无关的所有操作,如网络构建、图融合、资源复用、计算调度等操作,方便用户使用。高效的Saber计算库是由大量的汇编级优化代码组成,支持众多业内产品,如Intel-CPU、NV-GPU、AMD-GPU和ARM等。

本文地址:http://www.reviewcode.cn/chanpinsheji/23980.html 转载请注明出处!

今日热点资讯