(原标题:平头哥出道一年了)
2018年云栖大会期间,阿里巴巴宣告建立一家独立运营的芯片公司——“平头哥半导体有限公司”。一年曩昔,阿里的芯片战略开展怎么?
9月25日,阿里巴巴集团首席技能官兼阿里云智能总裁张建锋发布了阿里的首款AI芯片含光800,该芯片是一款云端AI芯片,归于AI推理芯片。含光800首要运用于视觉场景,现已在阿里巴巴集团内多个场景大规划运用,其他企业能够通过阿里云获得含光NPU的算力。
张建锋表明,平头哥用大约一年多的时刻完结了含光800从规划到商用。
依托阿里资源
作为一个长周期的职业,要想加快芯片的商用,在硬件和软件方面都需求有很强的实力,特别是在AI年代,软硬一体化的重要性愈加突显。
芯片厂商面临着技能途径的挑选:CPU尽管能处理单次复杂问题,但无法支撑深度学习的大规划并行核算需求。GPU开端跟着图画处理需求呈现,处理很多数据并行运算、浮点运算的才能投合了深度学习的需求,比较CPU处理速度更快、功耗更低,因而被最早引进深度学习。FPGA能够通过FPGA装备文件来界说这些门电路及存储器间的连线,然后完结特定的功用,而且能够通过装备特定的文件将FPGA改变为不同的处理器。尽管有能够屡次更改的优势,但是在AI芯片的开展上不算快。ASIC则是为了特定运用而规划的集成电路,除了不能扩展以外,在功耗、可靠性、体积方面都有优势,在云端和终端上挤满了一众蓄势待发的AI厂商。
比较之下,含光800功用打破得益于软硬件的协同立异,芯片架构方面,含光800选用立异的架构,针对深度学习中运用的很多权重参数和张量数据,在支撑稀少紧缩与量化处理的基础上,通过共同规划的数据访存与流水线处理技能,大大减低了I/O需求和数据的搬移。NPU一起深度优化了卷积、向量核算和各种激活函数,通过更有用的硬件资源调度和全并行的数据流处理,进步了AI运算的功用和能效。
平头哥借力于阿里在软硬件方面的堆集。算法方面,阿里巴巴达摩院机器智能实验室曩昔两年构建了完好的算法体系,包括语音智能、言语技能、机器视觉、决议方案智能等方向,而且获得多个国际领先水平的效果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等范畴具有多年研制经历,此外,平头哥团队在体系结构、编译技能等范畴具有深沉的技能储备。
其间,功用的进步有必要处理内存墙问题。所谓的内存墙,是指选用冯诺依曼结构的处理器,存储和运算处理别离,当进行深度神经网络处理时,算力得到了进步,但很多读写运转操作会遭到带宽约束,芯片的全体功用进步也一起遭到约束。
平头哥的做法是通过自研架构大幅削减对内存的拜访,在确保功用的情况下,把芯片功耗降到最低水平。详细而言,含光800会依据神经网络推理运算特征,规划特定的硬件、高速衔接的存储结构以及专用指令集,对内存和核算单元完结高效安排办理,完结单条指令完结多个操作,进步核算功率和内存拜访功率。
现在,含光800已运用于阿里巴巴集团内多个场景,例如视频图画识别/分类/查找、城市大脑等,未来还可运用于医疗印象、自动驾驶等范畴。
比方,拍立淘是手机淘宝上用图片查找产品的一个功用,拍立淘产品库每天新增10亿产品图片,为了让用户快速从海量图片中精准查找到产品,需求强壮的核算力支撑,运用含光800查找功率可进步12倍,时刻从传统通用GPU的1小时缩减至5分钟。
“含光800芯片的规划、封装、测试等环节已完结,流片一次通过,现在在跟事务方做适配、验证的进程,估计今年年底能够完结首要事务方适配、验证的进程。”9月25日,阿里巴巴平头哥半导体公司研究员骄旸告知榜首财经记者,尽管获得了一些成果,但要到达英伟达的水平还有一段很长的路要走。
含光800是一款云端AI芯片,后续会做PC、手机端上的芯片,用IP的方法去赋能客户。“先在云端做大芯片、技能上占据制高点,假如在云上做成了之后,客户关于公司在PC、手机等端上也会充满信心。”骄旸表明。
阿里官方表明,建立仅一年的芯片公司平头哥仅用7个月时刻完结了前端规划,之后用3个月成功流片。“和绝大多数芯片商不同的是,平头哥的意图并非卖芯片,含光800将通过阿里云对外输出AI算力,未来企业能够通过阿里云获取含光800的算力。”
别的,平头哥还将建立芯片敞开社区,为芯片工业供给敞开协作渠道。北京清微智能科技有限公司首席科学家尹首一告知榜首财经记者,这能够给终端设备供给更高算力,在与平头哥无剑芯片协作的进程中,平头哥能够在体系模块、架构等方面有一个很深的优化。“由于有了平头哥这样的渠道技能,能够使得咱们产品迭代的速度更快,更具竞争力。”
芯片出资成“重财物”游戏
依据高盛的核算,2017云核算的商场浸透率到达了8%,2021年浸透率将增加至15%。未来它将成为IT商场的主导。
在曩昔10多年里,云核算改变了IT产品的产权归属,从客户端转移到云厂商。在这个改变的进程中,整个工业链的中心环节还算安稳,依旧是英特尔、AMD、英伟达等厂商供给芯片,联想、戴尔、浪潮等厂商拼装服务器,然后卖给AWS、阿里云等这样的云核算厂商,由云厂商以服务和按需消费的方法供给给终究客户。
不过曩昔两年间,跟着人工智能的鼓起,商场的风向有了改变。
从职业看,通过数十年的快速迭代开展,高速的摩尔定律现已难以完结。
曩昔5年,通用CPU的开展遇到了许多技能瓶颈,单核功用均匀每年进步缺乏10%。想要进一步完结进步技能才能,在晶体管上打主意太难,需求寻觅其他途径。一起,现在在先进的大规划数据中心中,服务器本钱占比继续进步。以现在华为云数据中心为例,服务器本钱占比已超越60%,核算正在成为数据中心的主体。也就是说,假如华为购买其他商场上的板卡,再来供给云服务,不亏都很难到达。
职业的一致是,未来云核算必定成为全社会的基础设施或许公共服务,这时就需求云核算服务做到有规划,本钱低,而且运用便当。
这几年,在云核算上排名靠前的头部厂商纷繁开端投入芯片范畴,尤其是AI芯片,谷歌、阿里巴巴、亚马逊AWS等云厂商都在开发用于机器学习等运用场景的芯片技能。不同的技能途径“乱用渐欲迷人眼”。
有不乐意泄漏名字的分析师质疑,“含光发布的目标是IPS,一改以往算flops的习气,P4也是几年前的产品了,AI产品对标的标的有些讨巧。”
但他也坦言,半导体需求巨子不断投入,有泡沫才有时机,才有更多的人才乐意参加。尽管与英伟达、英特尔这些芯片厂商比较,云服务厂商的AI芯片方案仍处于相对初级阶段。但芯片首要是自用,为自家的AI运用量身打造,也将愈加契合本身产品的特性。
此前,华为云总裁郑叶来对记者表明,公有云未来的集中度会越来越高,今后不仅仅是玩本钱的游戏,更是一个研制出资的游戏。“做B端的生意,它必定不可能去挣快钱的。未来公有云不是长板战略,说我有一个东西特别凶猛。别人学你,不会的。未来的云服务必定是短板战略,哪个不可就没人学你。客户买的是一个服务。云服务首先是短板战略,你哪个东西不可你就麻烦了。”
换言之,关于中小AI芯片厂商来说,或许芯片职业的“血雨腥风”才仅仅个开端,特别是在云核算范畴,这是一场触及本钱与人才的全球化比赛。现在来看,这场豪赌只归于大玩家。
本文来历:榜首财经 责任编辑:乔俊婧_NBJ11279