“3年来,我们从研发两颗测试芯片,一直到当初云端智能芯片的最终亮相,我们时刻筹备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽利用率,不论是从性能比,仍是功耗比来说,寒武纪都将建立智能芯片领域的新标杆。
5月3日,全球新一代人工智能芯片发布会在上海召开,中科院旗下的寒武纪科技公司发布了我国自主研发的Cambricon MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处理器IP产品。这款国内首个云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平。
点击进入专题: “芯”痛之下 中国该如何破局?作为此次发布会焦点,首次正式亮相的Cambricon MLU100云端智能芯片,是我国首款云端AI芯片。
智能芯片实现新打破
“由端入云”协同发展
中科院上海分院副院长、中科院院士张旭表现,从从前在手机等终端上利用的智能芯片,到今天更高一层的云端人工智能芯片,它能够使人们在手机等终真个应用回升为将来在云端等范畴更加辽阔的运用,所以这是一个开辟性的冲破。
“在新产品上,咱们搭载了寒武纪的芯片,有助于各行各业在人工智能、VR、高机能盘算等方面的研发和行业解决方案的落地。”童夫尧说。
当前,众多科技公司纷纭加大对人工智能芯片的研发,赛马论坛,包含智能手机、无人驾驶、云计算等各领域巨头。根据相干机构猜测,到2021年,人工智能芯片市场规模将超过110亿美元,而2016年这一数字仅为36亿美元。
与寒武纪系列终端处理器一样,MLU100云端芯片依然连续了寒武纪产品一贯杰出的通用性,可支撑千万量级用户的大规模商用测验,搭载各类深度学习和经典机器学习算法,充足满意视觉、语音、天然语言处理、经典数据发掘等领域庞杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
共建人工智能生态链
宣布会上,寒武纪局部工业搭档公然展现了基于寒武纪芯片的应用计划。联想团体高等副总裁童夫尧在发布会上推出了基于寒武纪MLU100智能处理卡的ThinkSystem SR650,攻破了37项服务器基准测试的世界纪录。
此外,这次最新发布的寒武纪1M处理器是公司的第三代IP产品,它延续了前两代产品(寒武纪1H/1A)出色的齐备性,单个处理器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地训练,为视觉、语音、做作语言处理以及各类经典的机器学习任务提供了灵巧高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域。
原题目:国内首款云端人工智能芯片发布 达世界先进水平
“寒武纪创建的初衷就是要让全世界都能用上智能处理器。”陈天石告知记者,寒武纪将秉承学术界开放、合作的精力,以处理器IP受权的情势与全世界同行共享寒武纪最新的技巧结果,使寰球客户可能快捷设计和出产具备人工智能处理才能的芯片产品。
“过去大部门芯片厂商都主攻端,例如芯片巨头ARM公司,或是主攻云,例如英特尔公司。两者统筹的却很少,由于端云的义务生态差别较大。然而智能时期这个局势会被全面打破。因为端和云的任务是一体的,编程和应用的生态也是一致的。作为一个通用机器学习芯片厂商,寒武纪就是要端云联合,独特推进智能芯片生态的发展。”陈天石说。
寒武纪科技公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。它的横空降生打破了多项纪录,并入选了第三届世界互联网大会评比的十五项“世界互联网领先科技成果”。目前,寒武纪处理器也已应用于某著名国产手机早先发布的旗舰机型,实现了集成应用。
近年来,人工智能产业迅猛发展,推动了芯片市场规模的倏地增加,也推动了人工智能计算从终端向云端的延伸。陈天石表示,寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独破完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完善适配,让终端和云端在同一的智能生态基本上协同完成复杂的智能处理任务。
智能芯片是前沿科技和社会关注的热门,也是人工智能技术发展进程中不可超越的要害环节。可以说,不管有怎么当先的算法,要想终极应用,都必需通过芯片实现。
陈天石指出,端侧智能处理可以最疾速响应用户需要,以十分低小的功耗、本钱跟延迟,辅助用户懂得图像、视频、语音和文本。同时,云侧的智能处置则可以把多个端的信息汇聚在一起。因为终端的数据量有限,只能依据单个用户的数据对机器学习模型进行微调。因而,端云协同的智能处理模式将在数据方面施展宏大上风,应用海量数据,练习出强盛的人工智能模型。
MLU100云端智能芯片采取寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在均衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典范板级功耗仅为80瓦,峰值功耗不超过110瓦。
据中科院计算所研讨员、寒武纪公司开创人兼CEO陈天石介绍,云端智能芯片是面向人工智能领域大规模数据中央和服务器提供的核心芯片。云端的智能芯片规模更大,构造更加复杂,它和终端芯片的最大区别就在于其运算能力更强。
中科曙光高级副总裁任京旸在发布会上同步推出了基于Cambricon MLU100智能处理卡的服务器产品系列“PHANERON”,它的性能更为强劲,可以支持2—10块寒武纪MLU处理卡,机动应答不同的智能应用负载。以进级版的PHANERON-10为例,单台服务器可集成10片寒武纪人工智能处理单元,为人工智能训练应用提供832T半精度浮点运算能力,为推理当用提供1.66P整数运算能力,典型场景下的能效晋升30倍以上。
不仅如斯,芯片成果还将应用于智能语音领域。“一小时的语音数据在一个传统处理器长进行智能应用途理,须要一万小时才干实现,科大讯飞始终在跟踪人工智能专用芯片的前沿进展。”上海讯飞总裁程甦先容,寒武纪的智能处理器在语音智能处理上交出了优良的答卷,能耗效带领先竞争对手的云端GPU方案达5倍以上。它的壮大处理能力使到手机本地端可以处理更加复杂的机器学习算法,使得语音本地辨认正确率相对传统处理器领先了9.8%,明显进步了用户休会。
云端智能芯片是面向人工智能领域大范围数据核心和服务器供给的中心芯片。5月3日,中国迷信院发布海内首款云端人工智能芯片,实践峰值速度达每秒128万亿次定点运算,到达世界进步程度,将普遍应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域——
“下一步,曙光与寒武纪之间的配合将不仅仅局限于整机领域,会从顶端科研一直延长到低端应用,协力打造下游应用产业,共建人工智能生态链。”任京旸流露,中科曙光还将发布人工智能治理平台SothisAI,与寒武纪的芯片及开发环境实现无缝对接和深度融会。(经济日报·中国经济网记者 郭静原)
义务编纂:陈琰 SN225