Implementați rapid AI și învățare automată puternice și eficiente folosind MCU-urile RA8M1 de la Renesas
Contributed By DigiKey's North American Editors
2024-03-20
Dezvoltarea inteligenței artificiale (AI), a învățării automate (ML) și a altor sarcini de lucru care necesită putere mare de calcul la periferia rețelei pentru Internetul lucrurilor (IoT) adaugă o sarcină de procesare suplimentară la microcontrolere (MCU). Gestionarea acestor noi sarcini de lucru crește consumul de energie, chiar în timp ce proiectanților li se cere să minimizeze consumul de energie și să accelereze timpul de lansare pe piață.
Proiectanții au nevoie de o opțiune de calcul care să păstreze eficiența unui MCU, adăugând în același timp caracteristici de înaltă performanță adaptate special pentru cazurile de utilizare cu consum redus de energie. De asemenea, această opțiune ar trebui să păstreze modelele simple de implementare asociate cu MCU-urile tradiționale, adăugând în același timp suficiente caracteristici pentru a sprijini aplicațiile sofisticate permise de AI și ML, cum ar fi controlul vocal și întreținerea predictivă.
Acest articol analizează factorii care determină cererea de AI și ML și explică de ce sunt necesare noi arhitecturi de procesor pentru a oferi aceste capacități într-un mod eficient. Apoi, prezintă familia de MCU-uri RA8M1 de la Renesas și arată cum poate fi utilizată pentru a răspunde acestor cerințe.
Cerințele pentru AI și ML la periferie
Cererea de inteligență artificială și ML este în creștere pentru aplicațiile IoT periferice, de la automatizarea clădirilor și dispozitive industriale la aparate de uz casnic. Chiar și sistemele încorporate relativ mici, cu consum redus de energie, sunt acum prevăzute cu sarcini de lucru, precum identificarea cuvintelor cheie, controlul comenzilor vocale și procesarea imaginilor/înregistrărilor audio. Printre aplicațiile vizate se numără hub-uri de senzori, navigația și controlul dronelor, realitatea augmentată (AR), realitatea virtuală (VR) și echipamentele de comunicații.
Pentru a reduce la minimum consumul de energie, cheltuielile generale și latența, asigurând în același timp confidențialitatea, se preferă adesea procesarea datelor la periferie în locul trimiterii lor în cloud. Acest lucru reprezintă o provocare pentru proiectanți, deoarece dispozitivele periferice sunt adesea limitate în ceea ce privește resursele, în special atunci când sunt alimentate cu baterii.
MCU-uri îmbunătățite pentru edge computing
În general, sarcinile de lucru din AI și ML implică efectuarea aceleiași operații matematice în mod repetat pe un set mare de date. Aceste sarcini de lucru se pretează la accelerarea cu procesare de tip SIMD (instrucțiune unică, date multiple). SIMD efectuează mai multe operații matematice în paralel, oferind un debit considerabil mai mare și o eficiență energetică mai bună decât procesarea convențională.
Deoarece MCU-urile tradiționale nu au funcționalitatea SIMD, acestea au nevoie de ajutor pentru a executa sarcini de lucru AI și ML. O soluție este utilizarea unui procesor de semnal digital (DSP) sau a altor acceleratoare SIMD alături de MCU. Totuși, această abordare cu mai multe procesoare complică proiectarea sistemului.
O altă opțiune este trecerea la o unitate de microprocesor (MPU) mai performantă, echipată cu capacități SIMD. Acest lucru poate oferi performanța necesară într-o configurație cu un singur procesor, dar există compromisuri pentru MPU-uri în ceea ce privește consumul de energie și seturile de caracteristici. De exemplu, nu toate MPU-urile sunt concepute pentru a oferi calculul determinist și cu latență redusă necesar în aplicațiile orientate spre MCU.
Obținerea MCU-urilor cu AI și ML
Recunoscând necesitatea unei suite optimizate de MCU-uri pentru a susține sarcinile de lucru AI și ML, Renesas a introdus seria de MCU-uri RA8M1 (Figura 1). Seria se bazează pe o arhitectură Arm® Cortex®-M85 cu Helium și TrustZone și poate funcționa la 480 de megahertzi (MHz) cu un consum de energie tipic de 225 de microamperi per megahertzi (µA/MHz).
Figura 1: MCU RA8M1 de la Renesas se bazează pe un Arm Cortex-M85 și include tehnologia Helium pentru a accelera procesarea AI și ML. (Sursă imagine: Renesas)
Proiectat pentru o performanță eficientă și un consum redus de energie, MCU RA8M1 are caracteristici precum determinismul, timpul scurt de întrerupere și suportul de ultimă generație pentru managementul energiei. Procesorul atinge o eficiență a performanței de 6,39 CoreMark per megahertz (CoreMark/MHz).
Helium este o extensie SIMD M-Profile Vector Extension (MVE) care accelerează semnificativ procesarea semnalelor și ML. Acesta adaugă 150 de instrucțiuni scalare și vectoriale și permite procesarea registrelor pe 128 de biți (Figura 2). Este optimizat pentru microcontrolere cu resurse limitate și cu putere redusă. De exemplu, Helium reutilizează registrele unității în virgulă mobilă (FPU) în loc să introducă noi registre SIMD. Acest lucru ajută la scăderea consumului de energie al procesorului și la reducerea complexității proiectării.
Figura 2: Helium reutilizează banca de registre FPU pentru procesarea vectorială. (Sursa imaginii: Arm)
După cum se arată în Figura 3, Cortex-M85 al RA8M1 include tehnologia TrustZone de la Arm. TrustZone asigură o izolare hardware pentru firmware-ul critic, active și informații private. În plus, Cortex-M85 adaugă noi funcții de securitate și siguranță, cum ar fi extensia PACBTI (Pointer Authentication and Branch Target Identification). Aceste caracteristici de securitate sunt deosebit de valoroase în contextul AI, unde un dispozitiv poate interacționa cu date personale.
Figura 3: TrustZone din Cortex-M85 asigură izolarea hardware a firmware-ului critic, a activelor și a informațiilor private. (Sursa imaginii: Arm)
Caracteristici hardware pe care trebuie să le includă un MCU capabil de AI
Pentru a susține aplicațiile de inteligență artificială, un MCU ar trebui să combine performanța eficientă cu un set robust de caracteristici. RA8M1 este bine echipat pentru controlul motoarelor, controlul logic programabil (PLC), contorizarea și alte aplicații industriale și IoT.
De exemplu, algoritmii de inteligență artificială necesită o cantitate mare de memorie. Memoria de sistem RA8M1 include până la 2 megaocteți (Mbytes) de memorie flash și 1 Mbyte de SRAM. SRAM include 128 de kiloocteți (Kbytes) de memorie strâns cuplată (TCM), care permite accesul rapid la memorie pentru calcule de înaltă performanță.
Pentru a asigura o funcționare fiabilă, 384 Kbytes din SRAM pentru utilizator și întreaga cantitate de 128 Kbytes din TCM sunt configurați ca memorie cu cod de corecție a erorilor (ECC). Memoriile cache pentru instrucțiuni și date de 32 Kbyte au, de asemenea, protecție ECC.
RA8M1 încorporează mai multe caracteristici de securitate pe lângă cele incluse în nucleul Arm. Printre acestea se numără motorul criptografic Reprogrammable Secure Intellectual Property (RSIP) pentru procesarea sigură a datelor, stocarea imuabilă pentru protecția datelor critice și mecanismele de protecție împotriva manipulării neautorizate.
Pentru interfețele de comunicare, MCU este echipat cu Ethernet pentru conectivitate în rețea, Controller Area Network Flexible Data Rate (CAN FD) pentru aplicații auto și industriale și USB High-Speed/Full-Speed pentru conectivitate generală. De asemenea, încorporează o interfață pentru cameră și o interfață serială periferică (SPI) octală cu decriptare din mers pentru memoria externă.
Interfețele analogice includ convertoare analogice-digitale (ADC) pe 12 biți și convertoare digitale-analogice (DAC), comparatoare analogice de mare viteză și trei circuite de eșantionare și reținere. Pentru comunicarea serială, RA8M1 acceptă mai multe protocoale, inclusiv o interfață de comunicare serială (SCI) cu SPI, un receptor/transmițător universal asincron (UART) și moduri Inter-Integrated Circuit (I²C). În plus, MCU oferă Improved Inter-Integrated Circuit (I3C) pentru rate de transfer de date și eficiență îmbunătățite.
Dezvoltatorii care au nevoie de acces complet la aceste funcții de intrare/ieșire (I/O) pot folosi o capsulă cu matrice cu bile (BGA), precum R7FA8M1AHECBD#UC0 cu 224 de pini. Cei care caută un proces de proiectare și asamblare a plăcii de circuite imprimate mai simplificat ar putea lua în considerare utilizarea unei opțiuni cu capsulă de tip Quad Flap Package cu profil redus (LQFP), cum ar fi R7FA8M1AHECFB#AA0 cu 144 de pini.
Medii de dezvoltare pentru aplicațiile AI
Proiectanții interesați să experimenteze cu seria RA8M1 pot începe cu placa de evaluare EK-RA8M1 R7FA8M (Figura 4). Această placă include o interfață Ethernet RJ45 RMII, o interfață USB de mare viteză pentru gazdă și dispozitiv și o regletă CAN FD cu trei pini. În ceea ce privește memoria, acesta are 64 Mbytes de flash SPI octal.
Figura 4: Placa de evaluare EK-RA8M1 are un suport robust de intrare/ieșire pentru a exersa MCU RA8M1. (Sursă imagine: Renesas)
RA8M1 este susținut de Renesas Flexible Software Package (FSP), un cadru cuprinzător conceput pentru a oferi o bază software ușor de utilizat, scalabilă și de înaltă calitate pentru proiectele de sisteme integrate.
Pachetul oferă instrumente de dezvoltare, inclusiv mediul de dezvoltare integrat (IDE) e² studio, bazat pe popularul IDE Eclipse. De asemenea, acesta conține două sisteme de operare în timp real importante, libere de drepturi de autor: Azure RTOS și FreeRTOS.
Pachetul include drivere ușoare, pregătite pentru producție, care acceptă cazuri de utilizare comune în sistemele integrate. Combinate cu placa de evaluare, aceste drivere oferă dezvoltatorilor o cale rapidă de a experimenta cu intrările/ieșirile RA8M1.
Concluzie
RA8M1 oferă dezvoltatorilor o nouă opțiune pentru implementarea sarcinilor de lucru AI și ML în aplicațiile IoT periferice, opțiune care economisește energie, îmbunătățește performanța, reduce complexitatea și scurtează timpul de lansare pe piață.
Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

