在计算机制造商推出最新和最佳实施的英特尔CPU的大型展会Computex前夕,移动竞争对手ARM通过推出新一代ARM CPU和GPU宣布了自己的重大新闻。今天官方称,ARM Cortex-A75是新的旗舰级移动处理器设计,其性能比现有的A73提高了22%。它与新款Cortex-A55相结合,后者具有所有中档CPU ARM设计的最高功效,以及Mali-G72图形处理器,与前代G71相比,效率提高了25%。
效率提升具有革命性和可预测性,但这一新阵容的革命性方面与人工智能相关:这是第一套专为应对机载AI和机器学习挑战而设计的处理组件。此外,去年更新以提高增强和虚拟现实的力量拥抱任务的性能正在进行扩展和详细阐述。
在我们深入了解今年变化的细节之前,值得重新讨论ARM的作用以及它的重要性。这家英国公司现在由日本的SoftBank所有,负责设计几乎所有移动设备的处理器架构 - 您将听说过Qualcomm的Snapdragon,三星的Exynos和Apple的A系列移动芯片,所有这些都是使用ARM的指令集并基于ARM的设计蓝图。当我们谈论即将到来的移动人工智能,移动VR和智能手机的浪潮时,可以执行机器学习任务而无需将它们发送到云中的处理器场,从而开始为这些任务开发功能。
新的Cortex-A75和A55是ARM 的第一款Dynamiq CPU。Dynamiq是为高通公司等芯片供应商描述更灵活的设计选项而选择的品牌。以前ARM允许设计配对所谓的大CPU(来自其A7x类)和匹配数量的小CPU(来自A5x系列)的设计,新设计使得可以规定单个混合由大CPU和小CPU组成的集群,最多为8个。因此,芯片制造商现在可以拥有七个小A55内核和一个大A75内核:在需要时,可以实现长电池寿命,成本效率和单线程性能上限的良好组合。
“未来三到五年人工智能性能提高50倍”
ARM营销主管John Ronco表示,由于更好的架构,微架构和软件优化,他预计未来三到五年内人工智能性能将提高50倍。ARM的Dynamiq更改包括重新设计的内存子系统和对CPU缓存工作方式的调整 - 这导致A55相对于之前的A53的内存流性能翻了一番。鉴于A53在过去三年中已售出17亿台设备,真正的A55将成为实现Ronco雄心勃勃预测的最大差异。在大多数应用中,新的中端内核比以前提高了10%到30%,功率效率提高了15%,单线程性能提高了18%。
有趣的是,ARM不仅仅是通过其新芯片为机器学习提供动力,它也将受益于ML。新设计受益于改进的分支预测器,该预测器使用神经网络算法来改善数据预取和整体性能。
Cortex-A75全面提升了两位数的性能,ARM声称其平均比A73好22%,内存吞吐量提高16%,Geekbench得分提高34%。据ARM公司的Ronco称,单线程性能提高了20%,纯粹是通过提高每时钟指令效率来实现的。A75芯片的尺寸约为A55的2.5倍,其用途主要用于基础设施,汽车和丰富的移动应用。是的,这意味着VR,AR和高保真游戏,后者ARM的研究表明,这种游戏越来越受欢迎。
A75的主要架构变化是为使用该内核的芯片打开更大的功率范围,可扩展至2W的功耗,从而在大屏幕设备上提供高达30%的额外性能。这完全是针对即将到来的基于ARM的Windows重新启动,预计在今年晚些时候。值得注意的是,在ARM的世界中,“大”屏幕基本上相当于一台笔记本电脑 - 该公司在一年半前成立了专门的大屏幕计算部门,以更积极地瞄准英特尔一直占据主导地位的翻盖设备。
Mali-G72是ARM推动提高机器学习效率的核心,ARM声称它在ML基准测试中表现出比G71高17%。公司的设计优化是为了加速推理引擎而不是训练引擎而定制的 - 也就是说ARM芯片最擅长使用累积的ML功能而不是开发它们,这对移动应用来说非常有意义。培训AI将是Nvidia和AMD显卡或Google自定义TensorFlow TPU的最佳任务。
Cortex-A75和A55设计于2016年底发布给ARM的合作伙伴,所以到目前为止,他们已经有几个月的时间来决定如何处理这些设计。ARM称,由其最新设计驱动的新移动设备的“现实时间窗口”将是2018年第一季度 - 尽管该公司也意识到一种新的现象,它称之为“中国速度”,中国手机厂商将把它放在几乎立即设计成产品。例如,华为Mate 9在ARM向合作伙伴分发Mali-G71仅八个月后发布。这种更快的中国节奏可能导致今年一些基于A75和A55的设计,但其中大部分可能会在明年初通常的智能手机更新周期到来。