端侧AI爆发元年,MCU巨头革新产品迎机遇
云端AI大模型方兴未艾,端侧AI也迎来“爆发元年”。随着工业智能化以及物联网科技的不断推进,为数众多的产线设备、电子摄像头与家用电器等都将迎来AI赋能。在设备端进行AI运算,是达到高性能与低功耗的核心手段,而这将带来大量处理器(MPU)与控制器(MCU)的需求,并促成这些芯片向着更强大的方向演变。
不难发现,业界头部几家IC原厂,包括ST、ADI、瑞萨及Microchip等,近来的新品都集中于边缘运算,通过抢占视觉识别这一高地,将影响力辐射至智能工业、物联网及智能汽车等领域。从这些新品中,可以看出几个主要的技术演化趋势。算力的不断提升,增强端侧设备完成复杂任务的效率,对产业界和人们的日常生活,都会起到改变意义。
ST:MPU+MCU组合拳,扩大市场应用范围
边缘运算方面,ST现有的产品是STM32MP2系列MPU,该系列在2023年发布,其中的STM32MP25在今年上半年量产,STM32MP23将于2024年底上市,STM32MP21预计将于2025年上半年量产。
据官方介绍,STM32MP2为64位处理器,这为其算力提供了先决保障。架构方面,除了强大的ARM核心外,在STM32MP25上边还集成了浮点算力为1.35TOPS的神经元处理器(NPU)。该系列定位于机器视觉应用,具体可用在工业、智能家居、智慧城市设施等各类应用,故而所提供的接口资源也相当丰富,包括全高清视频管道与LVDS和DSI、MIPI CSI-2相机接口与Lite-ISP等接口可满足各类应用。
STM32MP25工业HMI网关示意 来源:ST
在MCU方面,ST还将带来集成NPU的STM32N6系列,其算力可达0.6TOPS,同样集成MIPI CSI摄像机、图像ISP、千兆以太网控制器等外设资源,适用于边缘计算、机器视觉等多类应用,且更低的功耗水平也适合于智能家电搭载。在处理特定的视觉边缘AI任务中,具有NPU的STM32N6甚至要远快于STM系列中的高性能STM32H7产品,足见AI化MCU的巨大潜力,而这也将会推动设备与芯片的换代。
通过MPU与MCU的组合布局,ST可满足从工业到物联网,再到智能家电的一系列设备的边缘运算需求,赋能各行各业的智能化转向。对于各类应用的快速导入,ST还提供强大的软件工具。在2021年,ST收购了边缘AI软件专业开发公司Cartesiam,后者的NanoEdge AI Studio工具已与ST的产品有机结合,能让开发人员更快解决边缘AI开发各环节中的问题,即便不具备相关背景知识,也可快速部署产品。
ADI:更新MAX7800X系列,带来更强CNN性能
近年来,ADI也在传统MCU的基础上实现了边缘AI创新,其MAX7800X系列MPU特为AI边缘应用打造,在ARM M4F与RISC-V内核的基础上,集成了卷积神经网络加速器(CNN),专用于AI计算任务。系列中MAX78002相比MAX78000,CNN的部分得以加强,加速器频率从50MHz提升到200MHz,从而能够胜任视频处理任务。
ADI两款AI处理器性能对比 来源:ADI
得益于专业AI处理核心的特性,该MPU可在超低功耗条件下获得优越的AI算力,特别适用于电池供电类设备,包含各种物联网摄像头、医疗设备,以及工厂机器人及无人机等。比起MCU+DSP的组合方案,单芯片的MAX7800X功耗更低,方案设计更便捷;而相比GPU或是FPGA的方案,ADI方案的成本更是大大降低。结合算力、功耗与成本,MAX7800X都是边缘AI应用的有力竞争者。
瑞萨:RZ/V2H大幅增强,DRP内核性能出众
瑞萨在今年早些时候发布了RZ/V2H产品线,进一步扩展了旗下RZ产品家族。RZ/V2H在通用处理器层面搭载4核ARM A55与双核R8,另有一M33子内核加入,远强于前代产品的双核架构。AI方面,DRP-AI3核心(动态可配置处理器-AI3)为RZ/V2H带来了10 TOPS/W的能效,强于前代10倍。外设方面,MIPI、图形处理器等部分都有加强,以适应工厂自动化等领域中更复杂的视觉识别任务。
RZ产品线对比 来源:瑞萨
瑞萨AI处理器的独到之处,正是自主开发的DRP-AI核心,动态可配置(DRP)是其基础特性,其原理与FPGA颇有类似,可灵活配置用于各种任务。通过与MPU的处理器核心协同运作,可兼顾高算力与低功耗。搭载DRP-AI三代核心的RZ/V2H,其常规INT8算力可达到8TOPS,稀疏算力可达80TOPS,加之10TOPS/W的优秀能效比,充分赋予智能设备更大的设计自由度,在确保性能的同时,节约散热设计与占用空间。
Microchip:推出64位MPU,拥抱RISC-V架构
前不久,Microchip发布了PIC64GX系列MPU,与其他几大原厂一样拥有了64位产品线。架构方面,PIC64GX采用具有非对称多处理(AMP)和确定性延迟的64位RISC-V四核处理器,可用于工业、汽车、通信、物联网等领域。
PIC64GX处理器框图 来源:Microchip
PIC64GX除了是64位处理器,还有一关键特性,即是使用了RISC-V内核。尽管RISC-V在打造高性能处理器方面不如ARM与x86等指令集,但其开源、简易、执行率高的特性,已经被各大IC原厂重视,用于打造AI加速相关的处理。Microchip的芯片在64位和RISC-V双方向都取得突破,也标志着端侧AI爆发元年之后,更为激烈的市场竞争近在眼前。
从新品可发现多个技术演化趋势
上述原厂新品,在算力、架构、能效等方面都体现出自身独到特质,将会成为物联网与工业智能化更快铺开的“利器”。MPU迈向64位,性能极限得以提升,未来产品的整体性能将提升至更高层次。CNN、DRP-AI等加速运算单元,能够让MPU具备专业的AI能力,兼顾高算力和低功耗。RISC-V在AI市场找到用武之地,也标志着未来原厂能够以更快的速度推广产品。
芯片原厂不断推陈出新,将加快端侧AI赋能产业链,可预见工厂、物联网、家用电器等领域,将会迎来设备更新,届时对于各类元器件的需求也将增大。机会已经在不远处等候,新周期的动能不仅体现在云端AI对GPU与HBM的大量需求,端侧AI所起到的推动力同样重要。