技术动态
发表时间:2018-08-28 16:12
过去一年,随着人工智能在各个行业的逐步落地,AI芯片的发展路径逐渐明朗。在行业走过野蛮生长,开始加速落地、加速整合的过程中,也有更多的AI芯片公司也开始走出属于自己的差异化路线。
以下为智能内参整理呈现的干货:
AI芯片投资地图
AI 芯片设计是人工智能产业链的重要一环。自 2017 年 5 月以来,各 AI 芯片厂商的新品竞相发布,经过一年多的发展,各环节分工逐渐明显。
▲AI芯片新品竞相发布(自2017年5月以来发布的 AI 芯片一览)
AI 芯片的应用场景不再局限于云端,部署于智能手机、安防摄像头、及自动驾驶汽车等终端的各项产品日趋丰富。除了追求性能提升外,AI 芯片也逐渐专注于特殊场景的优化。
目前,人工智能产业链中,包括提供 AI 加速核的 IP 授权商,各种 AI 芯片设计公司,以及晶圆代工企业。
▲AI芯片投资地图
如上图所示,按部署的位置来分,AI 芯片可以部署在数据中心(云端),和手机,安防摄像头,汽车等终端(边缘)上。
按承担的任务来分,可以被分为用于构建神经网络模型的训练芯片,与利用神经网络模型进行推断的推断芯片。训练芯片注重绝对的计算能力,而推断芯片更注重综合指标,单位能耗算力、时延、成本等都要考虑。
训练芯片受算力约束,一般只在云端部署。推断芯片按照不同应用场景,分为手机边缘推断芯片、安防边缘推断芯片、自动驾驶边缘推断芯片。为方便起见,我们也称它们为手机 AI 芯片、安防 AI 芯片和汽车 AI 芯片。
由于AI芯片对单位能耗算力要求较高,一般采用14nm/12nm/10nm等先进工艺生产。台积电目前和 Nvidia、Xilinx 等多家芯片厂商展开合作,攻坚 7nm AI 芯片。
五大场景塑造352亿美元市场
▲AI 芯片市场规模及竞争格局
根据中金公司对相关上市 AI 芯片公司的收入统计,及对 AI 在各场景中渗透率的估算,2017年 AI 芯片市场规模已达到 39.1 亿美元,具体情况如下:
1、2017 年全球数据中心 AI 芯片规模合计 23.6 亿美元,其中云端训练芯片市场规模 20.2 亿美元,云端推断芯片 3.4 亿美元。
2、2017 年全球手机 AI 芯片市场规模 3.7 亿美元。
3、2017 年全球安防摄像头 AI 芯片市场规模 3.3 亿美元。
4、2017 年全球自动驾驶 AI 芯片的市场规模在 8.5 亿美元。
庞大的市场前景和战略意义使得AI芯片赢得了巨头们的热切关注。Nvidia 在 2017 年时指出,到 2020 年,全球云端训练芯片的市场规模将达到 110 亿美元,而推断芯片(云端+边缘)的市场规模将达到 150 亿美元。
Intel 也在刚刚结束的 2018 DCI 峰会上,也重申了数据业务驱动硬件市场增长的观点。Intel 将 2022 年与用于数据中心执行 AI 加速的 FPGA 的 TAM 预测,由 70 亿美元调高至 80 亿美元。
而同时,中金公司也注意到:
1、手机 SoC 价格不断上升、AI 向中端机型渗透都将为行业创造更广阔的市场空间。
2、安防芯片受益于现有设备的智能化升级,芯片需求扩大。
3、自动驾驶方面,针对丰田公司提出的算力需求,我们看到当下芯片算力与 L5 级自动驾驶还有较大差距。(英飞凌公司给出了各自动驾驶等级中的半导体价值预测,可以为我们的 TAM 估算提供参考。)
▲历代 Apple 手机芯片成本趋势
▲自动驾驶算力需求加速芯片升级
▲英飞凌对各自动驾驶等级中半导体价值的预测
结合以上观点,及我们对 AI 在各应用场景下渗透率的分析,中金公司预测:
1、云端训练芯片市场规模在 2022 年将达到 172 亿美元,CAGR~54%。
2、云端推断芯片市场规模在 2022 年将达到 72 亿美元,CAGR~84%。
3、用于智能手机的边缘推断芯片市场规模 2022 年将达到 38 亿美元,CAGR~59%。
4、用于安防摄像头的边缘推断芯片市场规模 2022 年将达到 18 亿美元,CAGR~41%。
5、用于自动驾驶汽车的边缘推断芯片市场规模 2022 年将达到 52 亿美元,CAGR~44%。
以下是五个应用场景的详细分析。
云端训练芯片 :英伟达称霸
▲AI 芯片工作流程
训练是指通过大量的数据样本,代入神经网络模型运算并反复迭代,来获得各神经元“正确”权重参数的过程。CPU 由于计算单元少,并行计算能力较弱,不适合直接执行训练任务,因此训练一般采用“CPU+加速芯片”的异构计算模式。目前 Nvidia 的 GPU+CUDA计算平台是最成熟的 AI 训练方案,除此还有:
1、第三方异构计算平台 OpenCL + AMD GPU 或 OpenCL+Intel/Xilinx 的 FPGA。
2、云计算服务商自研加速芯片(如 Google 的 TPU)这两种方案。
各芯片厂商基于不同方案,都推出了针对于云端训练的 AI 芯片。
从整个云端训练芯片的市场竞争格局来看,目前 Nvidia GPU 的优势暂时明显,即便是 Google 的一些深度学习训练任务,同样离不开 Nvidia GPU;在 GPU 之外,云端训练的新入竞争者是谷歌的 TPU ,但目前并不对外直接销售;英特尔方面,则在积极布局 CPU+FPGA 异构计算,并持续优化 Xeon CPU 结构;同样深耕 FPGA 的还有 Xilinx ;GPU销量一直甚好的 AMD 也开始切入深度学习训练任务。
云端推断芯片:百家争鸣
推断是指借助现有神经网络模型进行运算,利用新的输入数据来一次性获得正确结论的过程。推断过程对响应速度一般有较高要求,因此会采用 AI 芯片(搭载训练完成的神经网络模型)进行加速。
相比训练芯片,推断芯片考虑的因素更加综合:单位功耗算力,时延,成本等等。初期推断也采用 GPU 进行加速,但由于应用场景的特殊性,依据具体神经网络算法优化会带来更高的效率,FPGA/ASIC 的表现可能更突出。
除了 Nvidia、Google、Xilinx、Altera(Intel)等传统芯片大厂涉足云端推断芯片以外,Wave computing、Groq 等初创公司也加入竞争。中国公司里,寒武纪、比特大陆同样积极布局云端芯片业务。未来,云端推断芯片将针对智能语音识别、智能搜索等应用场景,呈现百花齐放的态势。
手机端的推断芯片:格局稳定
手机芯片市场目前包括 (1) 苹果,三星,华为这类采用芯片+整机垂直商业模式的厂商,以及 (2) 高通,联发科,展锐等独立芯片供应商和 (3) ARM,Synopsys、Cadence 等向芯片企业提供独立 IP 授权的供应商。
采用垂直商业模式厂商的芯片不对外发售,只服务于自身品牌的整机,性能针对自身软件做出了特殊优化,靠效率取胜。独立芯片供应商以相对更强的性能指标,来获得剩余厂商的市场份额。
▲手机 AI 芯片对比
从 2017 年开始,苹果,华为海思,高通,联发科等主要芯片厂商相继发布支持 AI 加速功能的新一代芯片(如下图),AI 芯片逐渐向中端产品渗透。
由于手机空间有限,独立的AI 芯片很难被手机厂采用。在 AI 加速芯片设计能力上有先发优势的企业(如寒武纪)一般通过 IP 授权的方式切入。
▲智能手机 SoC 市占率分析( 2017 )
对这些厂商来说,中金公司认为 AI 化的主要作用是提升芯片附加价值与产品单价。根据 IHS的数据,随着硬件性能的增强及针对于 AI 的运算结构不断渗透,苹果 A11 芯片的成本已达到 27.5 美元。
芯片成本持续上涨有望带动垂直模式厂商整机售价走高,在出货量相同的情况下为现有芯片厂商贡献更多的营业收入。高通、联发科、展锐等独立芯片供应商则会受益于芯片本身 ASP 的提升。
安防边缘推断芯片:四方鼎立
视频监控行业在过去十几年主要经历了“高清化”、“网络化”的两次换代,而随着 2016年以来 AI 在视频分析领域的突破,目前视频监控行业正处于第三次重要升级周期——“智能化”的开始阶段。
前端摄像头装备终端推断芯片,可以实时对视频数据进行结构化处理,“云+ 边缘”的边缘计算解决方案逐渐渗透。中金公司预计,应用安防摄像头的推断芯片市场规模,将从 2017 年的 3.3 亿美元,增长至 2022 年的 18 亿美元,CAGR~41%。
边缘推断芯片 在安防端的主要应用,基于将视频流在本地转化为结构化数据。这样既节省云端存储空间,也提升系统工作效率。因此,积极布局智能安防的除了英伟达、Movidius(计算机视觉创企),还有传统视频解码芯片厂商。业内,海思、安霸与 Nvidia 、Movidius形成有力竞争。
▲安防 AI 芯片对比
中金公司认为 ,目前整个 安防 AI 芯片市场竞争格局稳定,现有厂商凭借与下游客户长期的合作,有望继续受益于安防智能化的升级,属于新进入者的市场空间有限。
安防 AI 芯片下游客户稳定,为海康威视、大华股份等视频监控解决方案提供商。客户与传统视频解码芯片厂商的长期合作具有粘性,同样推出新产品,初创公司的竞争优势弱一些,尤其是在安防 AI 芯片性能差异化很难做到很大的情况下。
自动驾驶边缘推断芯片:一片蓝海
除了智能手机,安防外,自动驾驶汽车也是人工智能的落地场景之一。
车用半导体强大需求已经使供给端产能开始吃紧,而用于自动驾驶的推断芯片需求,同样有望在未来 5 年内实现高速增长。中金公司预计,其市场规模将从 2017 年的 8.5 亿美元,增长至 2022 年的 52 亿美元,CAGR~44%。
▲自动驾驶算力需求加速芯片升级
若想使车辆实现真正的自动驾驶,要经历在感知-建模-决策三个阶段,每个阶段都离不开终端推断芯片的计算。不管是环境感知还是避障规划,自动驾驶都对芯片算力提出了很高的要求。而受限于时延及可靠性,有关自动驾驶的计算不能在云端进行,因此边缘推断芯片升级势在必行。
根据丰田公司的统计数据,实现 L5 级完全自动驾驶,至少需要 12TOPS 的推断算力,按现行先进的 Nvidia PX2 自动驾驶平台测算,差不多需要 15 块 PX2 车载计算机,才能满足完全自动驾驶的需求。
▲自动驾驶平台对比
近些年来,各传统车载半导体供应商纷纷涉猎自动驾驶业务,推出了各自的自动驾驶,或辅助驾驶平台;但下一代产品,中金公司预计 Mobileye 和新秀 Nvidia 有望实现领先。
自动驾驶芯片市场仍处于初期起步阶段,对比其他终端应用场景 ,自动驾驶不仅计算复杂程度最高,车规级要求也为芯片设立了更高的准入门槛, 其硬件升级落地相对缓慢。
目前各厂商下一代的自动驾驶平台最早计划于 2019 年量产,现今上市平台中,芯片大多只支持 L2/3 级。
虽然 NXP 等传统半导体厂商深耕于汽车电子多年,获得了一定的客户粘性,但在自动驾驶业务上,整个市场还未形成非常明显的竞争格局。客户也在不断测试芯片厂商的产品,来实现最优选择。
从客户的偏好来看,传统大厂愿意自行搭建平台,再采购所需芯片,而新车厂偏向于直接购买自动驾驶平台。
介于实现完全自动驾驶非常复杂,目前还在起步阶段,中金公司认为初创公司在整个行业的发展中是有机会的,并看好技术领先,能与车厂达成密切合作的初创公司。
本土新锐盘点
中国大陆目前有超 20 家企业投入 AI 芯片的研发中来 。除了像华为海思、紫光展锐这种深耕于芯片设计多年的企业之外,也有不少初创公司表现抢眼,如寒武纪、比特大陆等。
此外,台湾地区的 GUC(创意电子)是一家 IC 后端设计公司,凭借 20 年的行业经验,和投资方晶圆制造巨头台积电的鼎力支持,在 AI 芯片高速发展的大环境下也有望受益。
▲中国大陆主要 AI 芯片设计公司至少有 20 家
以下是中金公司推荐关注的AI芯片企业:
海思半导体
海思半导体(Hisilicon)成立于 2004 年 10 月,是华为集团的全资子公司。海思的芯片产品覆盖无线网络、固网及数字媒体等多个领域,其 AI 芯片为 Kirin 970 手机 SoC 及安防芯片 Hi3559AV100。Kirin 970 集成 NPU 神经处理单元,是全球第一款手机 AI 芯片,它在处理静态神经网络模型方面有得天独厚的优势。而 Hi3559A V100 是一款性能领先的支持 8k 视频的 AI芯片。
清华紫光展锐
清华紫光集团(Tsinghua UNISOC )于 2013 年、2014 年先后完成对展讯及锐迪科微电子的收购,2016 年再将二者合并,成立紫光展锐。紫光展锐是全球第三大手机基带芯片设计公司,是中国领先的 5G 通信芯片企业。
Gartner 的数据显示,紫光展锐手机基带芯片 2017 年出货量的全球占比为 11%。除此之外,展锐还拥有手机 AI 芯片业务,推出了采用 8 核 ARM A55 处理器的人工智能 SoC 芯片 SC9863,支持基于深度神经网络的人脸识别技术,AI 处理能力比上一代提升 6 倍。
GUC
GUC (台湾创意电子)是弹性客制化 IC 领导厂商(The Flexible ASIC Leader TM ),主要从事 IC 后端设计。后端设计工作以布局布线为起点,以生成可以送交晶圆厂进行流片的 GDS2 文件为终点,需要很多的经验,是芯片实现流片的重要一环。
在 AI 芯片设计发展的大环境下,加上大股东台积电的支持,GUC 有望获得大量的后端订单。公司已在台湾证券交易所挂牌上市,股票代号为 3443。
寒武纪科技
寒武纪(Cambricon Technologies )创立于 2016 年 3 月,是中科院孵化的高科技企业,主要投资人为国投创业和阿里巴巴等。
公司产品分为终端 AI 芯片及云端 AI 芯片。终端 AI 芯片采用 IP 授权模式,其产品 Cambricon-1A 是全球首个实现商用的深度学习处理器 IP。去年年底公司新发布了第三代机器学习专用 IP Cambricon-1M,采用 7nm 工艺,性能差不多高出 1A 达 10 倍。云端产品上,寒武纪开发了 MLU 100 AI 芯片,支持训练和推断,单位功耗算力表现突出。
比特大陆
比特大陆(Bitmain )成立于 2013 年 10 月,是全球第一大比特币矿机公司,目前占领了全球比特币矿机60%以上的市场。
由于AI行业发展迅速及公司发展需要,公司将业务拓展至AI领域,并于与 2017 年推出云端 AI 芯片 BM1680,支持训练和推断。目前公司已推出第二代产品BM1682,相较上一代性能提升 5 倍以上。
地平线机器人
成立于 2015 年 7 月,地平线(Horizon Robotics )是一家注重软硬件结合的 AI 初创公司,由 Intel、嘉实资本、高瓴资本领投。
公司主攻安防和自动驾驶两个应用场景,产品为征程 1.0 芯片(支持 L2自动驾驶)和旭日 1.0(用于安防智能摄像头),具有高性能(实时处理 1080P@30 帧,并对每帧中的 200 个目标进行检测、跟踪、识别)、低功耗(典型功耗在 1.5W)、和低延迟的优势(延迟小于 30 毫秒)。公司二代自动驾驶芯片将于 1Q19 流片,实现语义建模。
云天励飞
云天励飞(Intellifusion )创立于 2014 年 8 月,由山水从容传媒、松禾资本领投,主攻安防 AI 芯片。其自研 IPU 芯片是低功耗的深度学习专用处理器,内含专用图像处理加速引擎,通过级联扩展最多可处理 64 路视频。能耗比突出,超过 2Tops/Watt。
异构智能
异构智能(NovuMind )创立于 2015 年 8 月,由洪泰基金、宽带资本、真格基金和英诺天使投资。
2018年公司展示了其首款云端 AI 芯片 NovuTensor,基于 FPGA 实现,性能已达到目前最先进的桌面服务器 GPU 的一半以上,而耗电量仅有 1/20。公司即将推出的第二款 ASIC 芯片,能耗不超 5W,计算性能达 15 TOPs,将被用于安防和自动驾驶应用中。
龙加智
创立于 2017 年 7 月,龙加智(Dinoplus )是专注于云端芯片的 AI 初创公司,由挚信资本和翊翎资本领投。
公司产品 Dino-TPU在 75W功耗下,计算能力超过除最新款 Nvidia Volta 之外的所有 GPU,时延仅为 Volta V100 的 1/10。同时,Dino-TPU 提供市场上独一无二的冗余备份和数据安全保障。公司计划于 2018 年底完成第一款芯片的流片。
智东西认为 ,GPU 已经在训练芯片方面站稳脚跟,但随着人工智能场景化的逐步深入,针对性更强的 TPU 和更为灵活的 FPGA 将瓜分新市场,而边缘计算(推断)方面,多样化的场景应用给传统玩家、芯片厂商和新兴创企提供了充足的竞争平台。