Interface編集部

ルネサス エッジAI向け高性能マイコンRA8P1を発売開始
ルネサスエレクトロニクスはエッジAI用のマイコンとしてRA8P1の発売を開始しました.
エッジAIへの市場の要求として,Cortex-Aを搭載するMPU(SBCなど)以外に,MCU+RTOS環境が求められており,RAファミリのフラッグシップとしてこれに対応させた製品になります.
Cortex-Mの動作周波数を1GHzまで向上させたことにより,従来Cortex-Aを必要とした一部のAI処理(画像系AIなど)にも対応可能となっています.

RA8D1では「ドライバID」処理まで可能だったが,RA8P1では「電話使用検知」まで可能になった
●エッジAI向けの1GHz動作+NPU付きマイコン
RAファミリのマイコンとして最上位に位置づけられる32ビット・マイコンです.RAマイコンはCPUコアとしてCortex-Mを搭載します.新製品は最高1GHz動作のCortex-M85(Arm)と250MHz動作のCortex-M33コア(オプション)を搭載している他,AIアクセラレータとしてEthos-U55を搭載しており,これらによりCPU性能はCoreMark7,300を,AI演算性能は256GOPS(Giga Operations Per Second)を実現しています.
▲ニューラル・プロセッシング・ユニット搭載
AIアプリケーションやリアルタイム解析を主なターゲットとしており,CNN※1やRNN※2の処理をCPUからNPU※3にオフロードできます.NPUとしては500MHzで動作するEthos-U55(Arm)を搭載しています.
1サイクルで最大256の積和演算ができるので,500MHz動作時には256GOPSの性能を持ちます.実行する推論処理によって変わるものの,Cortex-M85コア単体で実行した場合に比べ,最大で35倍の推論性能を発揮します.
Ethos-U55は,DS-CNN,ResNet,MobileNet,TinyYoloなど主要なニューラルネットワークに対応しています.
※1:CNNは畳み込みニューラル・ネットワークの意味であり,AIアプリケーションでよく使われるネットワーク・モデルです.
※2:RNNはリカレントニューラルネットワークの意味であり,AIアプリケーションで使われるネットワーク・モデルです.
※3:ニューラル・プロセッシング・ユニット

Cortex-M85+Ethos-U55による画像AIの例. 居眠り/わき見/電話使用 を検出するデモ
●ハードウェアの特徴
RA8P1は,TSMCの22nm ULL(Ultra-low Leakage)プロセスで製造され,オンチップ・メモリとしてMRAM(磁気抵抗メモリ)を搭載しています.
MRAMはフラッシュ・メモリに比べ,書き込み速度が速く,耐久性とデータ保持性も向上します.MRAMの用途として,アプリケーション・コードに加え,学習済みモデルの重みやグラフィック・アセットの格納を想定しています.
パッケージは224ピンBGAもしくは289ピンBGAとなっています.
●AIに最適化した周辺機能
AI推論処理で必要になる大容量メモリ,高度なセキュリティ機能に加えて次の周辺機能を搭載しています.
▲ビジョンAIアプリケーション向けのペリフェラル
・最大500万画素のカメラに対応する16ビットのカメラ・インタフェース(CEU)
・各レーン最高720Mbps(Mビット/秒)の高速転送に対応するMIPI CSI-2インターフェース(2レーン)
▲音声アプリケーション向けのペリフェラル
・I2SやPDMなどの入力ポート
●柔軟なメモリ構成が可能
内蔵メモリや外付けメモリを使用した柔軟なメモリ構成が可能です.内蔵メモリとして,MRAMを1Mバイト(または512Kバイト),SRAMを2Mバイト搭載しています.
SRAMは,ニューラル・ネットワーク処理における中間層の活性値や,グラフィック・フレーム・バッファを格納するために使用できます.
内蔵メモリに加えて,高速メモリ・インターフェース(OctalSPI)を利用して外部メモリの接続もできます.さらにオプションとして,4Mバイトまたは8Mバイトの外部フラッシュ・メモリをSiP(System in Package)によりチップ内に搭載できます.
●AI開発用の新フレームワーク
推論処理をマイコンに実装するための開発フレームワークとしてRUHMI(Renesas Unified Heterogenous Model Integration;ルミ)が提供されます.RUHMIは,統合開発環境e2 studioに統合されています.
TensorFlow Lite,PyTorchなどの主要な機械学習フレームワークに加え,ONNXフォーマットにも対応しており,特定の機械学習フレームワークに依存することなく,学習済みモデルの最適化や量子化,グラフ・コンパイルおよび変換が可能です.
変換することで,Ethos-U55とCortex-Mに処理が振り分けられ,マイコンに最適化された効率的なソースコードが自動生成されます(Ethos-U55で実行可能な部分は,基本的にEthos-U55側で実行される).
RA8P1に最適化されたアプリケーション・ソフトウェアや,学習済みモデルを実装するのに必要なツールやライブラリも提供されます.
今後はMCU(マイコン)に加え,MPU(RZファミリなどのマイクロ・プロセッサ・ユニット)もRUHMIに対応させる予定です.
●高度なセキュリティ機能
RA8P1のセキュリティIP(RSIP-E50D)は,次の暗号アルゴリズム用アクセラレータを備えています.
・CHACHA20
・Ed25519
・最大521ビットのNIST ECC曲線
・最大4Kビット対応の拡張RSA
・SHA2およびSHA3
ハードウェア・ベースの強固なRoot-of-Trust(信頼の基点)に加え,イミュータブル・ストレージ内のファースト・ステージ・ブートローダ(FSBL)によるセキュア・ブート機能も提供します.
DOTF(Decryption-On-The-Fly)に対応したXSPIインターフェースを搭載しており,外部フラッシュ・メモリに格納された暗号化コード・イメージを,安全に転送しながらリアルタイムで復号し実行できます.
参考文献
(1)リリース