Intel全新GPU Flex:转码性能5倍于NVIDIA!功耗仅一半
Intel全新的数据中心GPU Flex系列(曾用代号Arctic Sound-M),主要用于视频转码与传输、视觉AI推理、云游戏、桌面虚拟化等领域。
Intel很早就发布了面向服务器和数据中心的独立GPU,基于Xe LP低功耗架构的DG1核心,面向的就是高密度、低时延的安卓云游戏、流媒体服务。
全新的Flex系列则是基于Arc A系列独立显卡同款的Xe HPG高性能架构、DG2核心,支持H.264、H.265(HEVC)、AV1硬件编解码,VP4解码与传输。
该系列包括两款型号:
一是Flex 170,满血的32个Xe核心(512个执行单元/512个XMX引擎)、32个光追核心,基准频率1950MHz,最高加速2050MHz,搭配256-bit 16GB GDDR6显存,等效频率18GHz,带宽576GB/s。
整卡功耗150W,单插槽设计,PCIe 4.0 x16系统接口。
二是Flex 140,一半的16个Xe核心(256个执行单元/256个XMX引擎)、16个光追单元,基准频率、最高加速分别降低至1600MHz、1950MHz,搭配192-bit 12GB GDDR6显存,等效频率14GHz,带宽336GB/s。
整卡功耗也减半来到75W,系统接口同样减半至PCIe 4.0 x8。
这样的规格,应该分别对应桌面旗舰级型号Arc A770、主流型号Arc A580的水平,当然它们俩是没有视频输出接口的,频率、功耗估计也会不太一样。
Flex GPU系列集成最多四个Xe媒体引擎,相比于NVIDIA A10,可提供5倍的媒体转码吞吐性能、2倍的媒体解码吞吐量,而且只需要一半的功耗,开源的AV1硬件编码器还能节省30%以上的带宽。
它单卡即可支持多达36路视频流的1080p60转码吞吐量、8路视频流的4K60转码吞吐量。
在4U服务器中扩展到10卡配置时,可以支持多达360路视频流的H.265-H.265 1080p60转码吞吐量。
搭配Deep Link超级编码功能,Flex 140可在单卡上配备两套编解码设备,满足“一秒时延”要求,同时提供8K60实时转码,适用于AV1、H.265 HDR格式。
Intel还提供了一整套开放式、包括开源组件和工具的软件堆栈(Open Software Stack),以有效实现Flex GPU面向视觉云工作负载的功能,包括对oneAPI、OpenVINO的支持。
戴尔、慧与(HPE)、浪潮、联想、超微等将陆续推出搭载Flex GPU的系统。
应用方面,首先从媒体传输、安卓云游戏开始,随后扩展到Windows云游戏、AI、VDI(虚拟桌面基础架构)。