据官方介绍,Inferentia定位于一款低成本、高性能、低延迟的机器学习推理(inference)芯片,支持TensorFlow、Apache MXNet和PyTorch深度学习框架,以及使用ONNX格式的模型。将于2019年下半年正式上市。
Andy Jassy表示,“我们认为可以通过Elastic Inference节省75%的运营成本,所以这是一个改变游戏的重大规则。”
根据官网介绍,每个Inferentia芯片提供高达几百TOPS的算力,使复杂的模型能够做出快速的预测。多个AWS Inferentia芯片可以一起使用来驱动,形成成千上万的TOPS算力。
由此,亚马逊云也成为谷歌、华为之后,第三家推出云端AI芯片的云服务厂商。
在云计算这条赛道上,亚马逊AWS的市场份额一直遥遥领先,今年第三季度云业务营收高达66.8亿美元,同比增长46%。亚马逊云推出的云端AI芯片势必会让云服务市场竞争更为激烈。