本周一至周五,亚马逊在拉斯维加斯正式召开AWS re:Invent 2018大会。作为世界上最大的公有云厂商,AWS(亚马逊云,Amazon Web Service)每一年的re:Invent大会都会吸引来自全球的数万名开发者和业内人士参加。
去年的re:Invent 2017大会上,亚马逊云一口气发布了22款重磅产品,而今年的好戏也逐一上演。
在前天推出首款自研ARM架构云服务器CPU Graviton后,亚马逊云CEO Andy Jassy发布了其首款云端AI芯片——Inferentia。
据官方介绍,Inferentia定位于一款低成本、高性能、低延迟的机器学习推理(inference)芯片,将于2019年下半年正式上市。
关于芯片的详细参数官方公布不多,只公布了一些核心卖点,比如其计算力将会高达几百TOPS,多芯片组合后算力可达数千TOPS。此外,Inferentia支持FP16、INT8精度,并支持TensorFlow、Caffe2、ONNX等流行机器学习框架。
由此,亚马逊云也成为谷歌、华为之后,第三家推出云端AI芯片的云服务厂商。
今年10月份, 华为发布了自研云端AI芯片“昇腾(Ascend )”系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。
其中,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。昇腾910半精度(FP16)运算能力为256TFLOPS,整数精度(INT8)512TOPS。
作为云计算市场的一哥,亚马逊今年第三季度云业务营收高达66.8亿美元,同比增长46%。但在谷歌、微软的紧逼下,其市场份额已经从2017年最高的54.1%下降到32%,压力开始凸显。
此次,亚马逊云推出的云端AI芯片,目的想必也是进一步巩固其市场领导者地位,重新收回失去的市场份额。但接下来云计算这款大蛋糕的分配如何,还是未知数。