瀚博半导体发布首款高性能超低延时通用云端推理AI芯片

技术动态

发表时间：2021-07-09 13:09

　　高性能人工智能与视频处理芯片解决方案提供商瀚博半导体(上海)有限公司(下称“瀚博半导体”或“瀚博”)7月7日在2021世界人工智能大会期间发布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡，这款通用推理加速卡可实现深度学习应用超高性能、超低延时的推理性能，可显著降低数据中心与边缘智能应用的部署成本。据悉，SV100系列及VA1通用推理加速卡预计会上发布的两款新产品将于2021年今年四季度量产上市。

　　人工智能行业随着持续的技术演进，算法模型的精度、性能等关键指标在众多领域不断取得突破性进展，已进入算法规模化应用落地阶段。全球范围内各行业数据中心对推理算力的需求在快速增长，下游客户多样化的算力应用场景，催生了多样化的AI计算加速芯片需求，然而市面上却鲜有主流GPU厂商外的其他更优解决方案。基于对行业产品技术需求的洞察及显而易见的巨大市场机遇，经过两年多的技术论证与软硬件一体化设计，瀚博半导体重磅推出了专为云端数据中心而生的SV100系列芯片与VA1通用推理加速卡。

　　瀚博本次发布的SV100系列芯片性能强大优异，单芯片INT8峰值算力超200 TOPS，深度学习推理性能指标数倍于现有主流数据中心GPU，具有超高吞吐率、超低延时的特性。瀚博自研的通用架构，为各种深度学习推理负载极致优化。此次推出的SV100系列芯片支持FP16, BF16和INT8等数据格式，并可以实现众多主流神经网络的快速部署及计算机视觉、视频处理、自然语言处理和搜索推荐等多样化推理应用场景。同时集成高达64路以上H.264/H.265/AVS2的1080p视频解码，广泛适用于云端与边缘智能应用场景，在应用中能够提升客户的设备资产效益、降低运营成本。

　　瀚博半导体此次在这次发布会上同步推出的基于SV100系列芯片的VA1推理加速卡，为单宽半高半长75瓦PCIe x16卡，支持32GB内存和PCIe 4.0高速接口协议，无需额外供电，即可适用于所有厂商的人工智能服务器，实现数据中心高密度高算力部署。

　　瀚博半导体创始人兼CEO钱军表示：“SV100系列产品是所有瀚博人的心血结晶，我为我们的团队感到无比骄傲!我们深度了解行业客户对吞吐量、延迟、通用性和成本的需求。同时，向前兼容性非常重要，我们的软件栈具有极高灵活性与可扩展性，能够支持未来新兴算法模型和用户自定义算子扩展等。另一方面，占据过半中国AI应用市场的计算机视觉应用需要高密度的视频解码算力配合AI算力实现端到端的计算加速，在两者之间的算力配比平衡方面，我们也做了大量的工作。瀚博通过前期核心技术积累和前瞻性布局，正式发布我们性能优异的SV100系列云端通用AI推理芯片和VA1推理卡，可有效应对上述低延时、通用性和视频处理等方面的行业痛点，推进云端与边缘的智能应用落地。”

　　瀚博半导体创始人兼CTO张磊表示：“SV100系列芯片基于先进的DSA架构，相同功耗下实现数倍于数据中心GPU的最高深度学习推理性能。同时支持计算机视觉、自然语言处理、搜索推荐、智能视频处理领域的众多常用神经网络，软件栈支持灵活扩展，支持用户自定义算子。VA1推理卡采用75W单宽半高半长设计，可无缝适配各种人工智能服务器，最大化算力部署密度。我们的VastStream软件平台支持TensorFlow, PyTorch, Caffe2等常见的深度学习框架模型与ONNX格式的模型，通过高度定制的AI编译器充分优化模型在瀚博硬件上的执行效率。我们的软件栈完备，同时提供了符合行业开发者使用习惯的工具，方便使用者以极低成本向瀚博硬件平台迁移、部署现有算法应用。”

X 打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮