エンド・ポイントでのビジョンAIに強みを持つMPU RZ/V2x

エッジ/エンド・ポイントでのビジョンAIに向く
アクセラレータDRP-AIを持つMPU

RZ/V2x（ルネサスエレクトロニクス）

ルネサスエレクトロニクスは，独自のペリフェラルDRP-AIを持つRZ/Vシリーズの次世代MPUとして，RZ/V2x（仮名）のメディア発表を行った．このMPUにはさらに進化したDRP-AIが内蔵されている．

※ RZファミリはCPUコアとしてArm Cortex-Aコアを持つMPUのシリーズであり（RZ/Fiveを除く），最高動作周波数1G～1.5GHz，コア数1～8までのMPUがラインナップされている．

●CPUに加え再構成可能プロセッサを搭載

RZ/Vシリーズには，DRP-AI（Dynamic Reconfigurable Processor AI）と呼ばれる再構成可能プロセッサが搭載されており，一部の処理をCPUからオフロードして実行させられる．
DRP上で独自の回路を動作させることで，さまざまな処理を実行できるため，CPUから見るとDRPは演算アクセラレータのように動作する．RZ/Vシリーズに搭載されるDRP-AIは，DRP（再構成可能プロセッサ）に加えAI-MACと呼ばれる積和演算器を搭載している．DRP上に積和演算回路を実装することもできるが，積和演算器をハードウェアとして別途搭載することで，大量の積和演算処理を行うAIアプリケーションにより適した構成になっている．
従って，AIアプリケーションでは前処理やPooling層の処理など複雑な演算をDRPで実行し，畳み込み層や全結合層の演算をAI-MACで実行することで，CPU負荷を上げることなく一連の処理を実行できる．CPUではなくDRP-AIで実行することによって，より低消費電力かつ低発熱なシステムを実現可能である．

●無償の学習済みAIライブラリ

DRPを利用したAIアプリケーションは幾つかの専用ツールを使ってユーザが独自に作ることもできる．しかし，特にDRPの開発は専門性が強く，時間がかかることも多いため，画像を使ったアプリケーション向けに40個ほどの学習済みAIライブラリが無償で提供されており，2023年中に100個程度までライブラリを充実させる予定である．
ライブラリでは画像をもとにした人数カウントや転倒検出といったAIアプリケーションが提供されており，これらをもとに独自の拡張を行いたい場合の相談にも応じる．

●低消費電力動作

エッジ/エンド・ポイントAIアプリケーションを実行するハードウェアとして，次世代DRP-AIを搭載するRZ/V2xとJetson Nanoとの比較を行っている．カメラ画像を使った物体認識による比較では，Jetson Nanoに対して2倍ほどのフレーム・レートで動作し，かつ1/14の消費電力となっている．動作時の温度比較では，冷却ファン付きのJetson Nanoに対して，ファンレスでありながらより低い表面温度を保つことができている．
現在，AI活用において熱問題は大きな課題となっており，産業用アプリケーションのようにファンレス動作を求められる用途や，バッテリ駆動を強いられるシステムに向けて，性能と電力効率を両立できるシステムの構築が可能である．
GPUベースのエッジAI用ハードウェアは多くの場所で使われているため，開発や運用の知見も十分である．それらに比べて，実装難易度の問題はあるが，AIアプリケーションの推論処理を想定した場合，実行時の性能については，ほぼどのようなアプリケーションにおいてもDRPが有利だとしている．

●低負荷な処理をCPU上で行うためのソフトウェア・ライブラリ：Reality AI

モータ制御やHVAC，音ベースのADAS（Advanced Driving Assistant System）など比較的低負荷な処理をCPU上で行うためのソフトウェア・ライブラリReality AIが提供されている．
そのため，画像処理のような高負荷な処理はDRP-AIで行い，低負荷な処理はCPU側で行うようなシステム設計において，開発の工数を大幅に削減可能となっている．

●次世代DRP-AIはハードウェアで枝刈りに対応

汎用的なアーキテクチャを持つGPUに比べて，AI-MACは積和演算に特化したハードウェアであり，より低消費電力での動作を実現できる．それに加え次世代DRP-AIでは，枝刈りした学習済みモデルに対応しており，枝刈りを行ったモデルを用いるとGPUベースのAIアクセラレータに比べ18倍のAI性能，30倍の電力効率を実現できるとしている．
AIの処理において，大量の積和演算の中で処理結果に寄与しない部分を省くことを枝刈りと呼ぶ．枝刈りを行った学習済みモデルは，枝刈りによってモデル・サイズを縮小できる．しかし，処理の一部を省いても，実行速度を向上することは難しい．これは処理を実行するハードウェアの特性によるものである．
次世代DRP-AIにおいては，枝刈りを行ったモデルの処理にハードウェアで対応したことで，実行速度が大幅に向上するようになった．モデルの枝刈りを自動で行うツールも提供する．

●画像AIアプリケーションのデモ

メディア向けの発表が行われたRenesas AI Tech Dayでは，ルネサスのパートナ企業によるデモンストレーションも行われた．DRPによる処理を活かして，カメラ画像による骨格推定や弁当の具材のエラー検出，自動車のナンバー認識などといったエッジ/エンド・ポイントAIアプリケーションが披露された．