人工智慧(AI)大热,全球晶片开发商竞相发布自己的AI处理器智慧晶片。电子技术设计(EDN)中国版编辑比较了目前主流「AI处理器」的技术和市场发展,并用表格的形式列出了它们的制程、架构及应用。
寒武纪Cambricon-1A:核心的核心
中国寒武纪科技(Cambricon Technologies)的Cambricon-1A是一款深度学习专用处理器晶片(NPU),其高性能硬体架构及软体支援Caffe、Tensorflow、MXnet等主流AI开发平台。据称这是国际上首个成功商用的深度学习处理器IP产品,可广泛应用于电脑视觉、语音辨识、自然语言处理等智慧处理关键领域。专注于AI产业发展的美国媒体CB Insights最新发布全球AI 100榜单,寒武纪以其深度学习专用处理器入选,是中国唯一一家上榜的AI硬体创业公司。
寒武纪目前有三条产品线:首先是智慧终端机处理器IP授权,智慧IP指令集可授权整合到手机、安防、穿戴式设备等终端晶片中,客户包括国SoC厂商,现已开始投入市场。其次,在智慧云端伺服器晶片领域,作为PCIE加速卡插在云端伺服器上,客户主要是中国的知名伺服器厂商。第三是家用智慧服务机器人晶片:从智慧玩具、智慧助手入手,使服务机器人独立具备看听说的能力。客户是各类下游机器人厂商,产品的推出将比智慧云端伺服器晶片更晚。
华为麒麟(Kirin)970:号称全球首款AI处理器
华为声称麒麟970是全球第一款AI系统级晶片,该晶片选择了异质运算架构大幅提升AI的运算能力,内建独立的神经网路处理单元。据说这种专用硬体处理单元源自寒武纪NPU IP授权,专门用于机器学习和一般的AI应用程式。
麒麟970采用台积电(TSMC)10奈米(nm)晶片组制程技术(耗电量减少20%、体积减少40%),主要规格如下:8核心CPU(时脉最高达2.4GHz),新世代12核心GPU(Mali G72MP12)、麒麟NPU(1.92T FP16 OPS)、影像讯号处理器(Image DSP)(512bit SIMD)、双摄影镜头ISP(具备脸部、动作侦测)、Hi-Fi Audio(32bit/ 384k)、UFS 2.1、安全引擎(inSE&TEE)、全球通用4.5G数据机(1.2Gbps@LTE Cat 18)、4K影像(HDR10)、LPDDR 4X、i7感应处理器。
华为宣布将在美国上市的Huawei Mate 10 Pro会搭载麒麟970晶片,另外华为荣耀(Honor V10)也会采用。相较之下,高通(Qualcomm)骁龙(Snapdragon)845也把大部分焦点集中在AI,而普及率无疑会比麒麟970高,Snapdragon845支持众多Android 旗舰智慧型手机,当中包括三星(Samsung)、 Sony、LG 和小米的高阶产品。与华为麒麟970晶片不同的是,高通是在通用平台内做核心最佳化,它没有独立的神经网路引擎单元,而是更弹性的机器学习架构,分布在CPU、GPU、DPS等每个单元上,从而可以针对不同移动终端弹性调用各个处理单元。
对于两者方向的不同,高通认为整合更加有效。但华为认为,鉴于手机对能耗的要求,独立NPU处理单元未来一定是手机处理器的必要之路,从现在看只有苹果(Apple)和华为做了独立的NPU。
最近从微博(Wechat)流出麒麟970与Snapdragon 845跑分对比,声称前者跑分比后者还要高出7%,但麒麟970、Snapdragon845的差异其实不大,且网路还只秀出几个独立测试结果,并非完整跑分的平均值,显示差距甚至可能比表面看来还小。同样地,就算处理器的跑分很高,实地运作的绩效还是不一定,尤其在差距如此微小的情况下。话虽如此,外泄的跑分结果依旧暗示华为旗舰处理器的运算能力有可能很快会追上高通。
高通Snapdragon845:今年将在高阶Android手机中广泛应用
Snapdragon 845采用最新的八核Kryo 385定制架构,性能比Snapdragon 835的Kryo 280提升25%。 Snapdragon 845采用三星第二代10nm制程,主频最高为2.8GHz;其次Snapdragon 845整合的Adreno 630 GPU性能比Snapdragon 835的Adreno 540提升30%,功耗降低30%。另外,Snapdragon 845整合了第二代千兆级LTE Modem——X20数据机,比Snapdragon 835的X16速度提升20%,其整合的全新Hexagon 685 DSP与Spectra 280 ISP全面提升拍照功能。
从Wechat发布的Snapdragon 845和麒麟970参数规格对比看出,Snapdragon 845核心有巨大升级,采用全新高阶大核心A75与A53组合,GPU升级为Adreno 630,为三星10nm LPE制程制程。而麒麟970继续采用A73核心与A53核心,GPU型号未知,同样采用10nm制程,由台积电代工。
三星Exynos 9810:苹果A11的最强对手?
三星Exynos9810处理器采用其第三代自行研发M3架构,拥有4个2.9GHz的M3大核和4个1.9GHz的A55小核,依然是10nm FinFET制程。 10nm也是目前苹果A11、Snapdragon 845和麒麟970都在采用的制程。
GPU方面,Exynos9810采用最新的Mali-G72,采用18颗核心(MP18),预计工作频率在700MHz。 Mali-G72是Arm去年发布基于Bifrost架构的图形处理器,在更小面积与更低功耗的基础上,提供更强大的效能。采用Mali-G72的设备,整体图形性能是前一代的1.4倍,晶片整体能效提升25%、晶片面积效能提升20%、机器学习效率提升17%。
在AI方面,支持人脸检测的Bixby变得更加聪明。基于神经网路的深度学习,新的处理器能够透过快速影像搜索和分类精确识别照片中的人或物,以进行快速影像搜索或分类,或者利用深度感测,在3D中扫描使用者的脸部以进行混合式人脸检测。而利用硬体和软体,混合式人脸检测功能可以实现真实的人脸跟踪检测,从而在使用人脸进行设备解锁时候更加安全。
Nvidia DRIVE Xavier:为自动驾驶提供强劲驱动力
在CES会展上抢尽风头的Nvidia展示了DRIVE Xavier,这个AI晶片由一个特别定制的8核心CPU、一个全新的512核心Volta GPU、一个全新深度学习加速器、全新电脑视觉加速器,以及全新8K HDR视讯处理器而打造。 DRIVE Xavier可以提供更高的处理能力,运行功率更低,每秒可运行30 万亿次运算,功耗却仅为30瓦,能效比上一代架构高出15倍。
TensorCore、视讯识别和流处理、物体定位、路径规划等所有AI运算任务都能在上面飞快跑起来,据称首批样品2018年第一季就可以交付给客户。 Nvidia CEO黄仁勋表示,中国市场是全球最大市场,所有的系统在设计时都考虑到了当地语系化和中国客户的需求,比如百度的每辆自动驾驶车辆都搭载了Drive Xavier。
Intel Loihi:挑战神经拟态运算难题
为了抵御Nvidia在AI领域的强势进攻,英特尔(Intel)先后收购了FPGA晶片商Altera、AI初创公司Nervana Systems,以及以色列自动驾驶晶片公司Mobileye等。 Intel在CES上向各界展示了其自主学习神经拟态晶片「Loihi」,这是在收购以上技术公司并汇集众多研究成果后推出的神经拟态晶片。
AI晶片可以分为两类,一类为人工神经网路,而另一类为神经拟态运算。理论上来说,神经拟态运算效能更好,但晶片开发难度更大,Intel的Loihi采用神经拟态运算这条更难的道路可以看出它希望逆袭Nvidia的野心。
Loihi采用架构到晶片建模、非同步设计流程,以及基于FPGA模拟的圆形演算法验证,具有非常节能的特点,拥有128个核心+3个低功耗X86核心、可程式设计的学习规则等特点。
Intel介绍Loihi晶片拥有自主学习功能,并且可以利用资料来学习和推断,随着时间延长能变得更加智慧,可以应用于汽车和工业生产等领域。不过,虽然该晶片有这么多优点,这一切还需要在现实中应用证明它是否具有这些能力,这恰恰是Intel相较Nvidia的弱点,因为当前在全球的神经网路训练系统大多数都采用Nvidia的晶片,Intel需要加大力度推广以在市场占有率上赶上Nvidia。
瑞芯微RK3399Pro:首次采用CPU+GPU+NPU硬体结构设计
瑞芯微电子(Rockchip)在CES上发布旗下首款性能超强的AI处理器RK3399Pro,为AI领域提供一站式Turnkey解决方案。其NPU运算性能高达2.4TOPs,具高性能、低功耗、开发易等优势。
RK3399Pro AI晶片采用big.LITTLE大小核CPU架构——双核心Cortex-A72+四核心Cortex-A53,在整体性能、功耗方面具技术领先性。另外,该晶片还内建四核心Arm高阶GPU Mali-T860,整合更多频宽压缩技术,整体性能优异。 RK3399Pro具备极强的AI运算性能,是瑞芯微首次采用CPU+GPU+NPU硬体结构设计的AI晶片,其整合的NPU融合瑞芯微在机器视觉、语音处理、深度学习等领域的多年经验。相较传统晶片,典型深度神经网路Inception V3、ResNet34、VGG16等模型在RK3399Pro晶片上的运行效果表现出众。
联发科NeuroPilot:广泛用于消费性产品
联发科(MTK)在CES发布了NeuroPilot AI平台,主攻智慧型手机、智慧家庭、自动驾驶车的终端边缘运算。联发科表示,目前1年约有15亿台消费性电子产品采用联发科晶片,2018年该公司将整合AI处理器与NeuroPilot SDK软体发展套件技术,将AI带入广泛的消费性产品中。
联发科已在2018年新款Helio手机晶片中加入AI运算核心,现在已为智慧语音助理、智慧电视、自动驾驶车打造AI解决方案,并在CES中展示具体跨平台应用,包括Amazon Echo智慧语音助理、 Android O智慧电视、BelkinWemo智慧型插座、以及联发科全网覆盖家庭路由器等。
中国华夏芯「北极星」:完全自主IP的AI晶片平台
华夏芯发布全自主IP的AI晶片平台——「北极星」,这是中国首次发布的CPU、DSP和AI全部具有自主IP的平台型AI晶片。北极星是一款针对多种应用的SoC晶片,不但有负责神经网路和深度学习的AI专用处理器,还整合高性能的CPU/DSP,其能力可以延伸到多个产品领域,诸如智慧辅助驾驶、智慧安防监控、机器人、电脑视觉、车载和商用雷达探测、语音辨识等嵌入式AI应用。此外,还能延伸到工业4.0、现场控制、边缘运算、智慧硬体、智慧家居等在内的多个其他领域,是一款市场适应性极强的异质运算和AI平台型晶片。
北极星可以在单晶片上采用程式设计扩展的方法实现复杂度很高的现场控制与决策、数位讯号处理、影像讯号处理、基于神经网路的深度学习和特征提取、多执行绪平行运算等多种功能。北极星晶片采用台积电28nm制程制程,将于2018年上半年量产。
中国地平线「征程」和「旭日」:嵌入式AI视觉晶片
2017年获得Intel一亿美元投资的中国地平线推出了征程(Journey)和旭日(Sunrise)两款处理器,都属于嵌入式AI视觉晶片,分别针对智慧驾驶和智慧摄影镜头。