Skriv ut

AI-processorn RK3399pro identifierar 50 bild­objekt per sekund om man laddar det med VGG-16, som är ett ­neuronnät från Oxford.

RK3399pro är kinesiska Rockchips första processor med ett integrerat neuronnätsblock och företaget hoppas det får användning inom intelligent förarstöd, bildigenkänning, säkerhetsövervakning, drönare och röstinmatning.

På chipet finns sex Arm Cortex-cpu:er: en A72-dubbelkärna och en A53-fyrkärna.

Här finns också en fyrkärnig Armgrafikkärna (Mali-T860), dubbla Type-C-gränssnitt, stöd för skärmar på upp till 4096x2160 punkter och en ingång för en åttakanalig mikrofonarray.

Sist men inte minst finns här vad som gör den till en AI-processor, nämligen ett block kallat Neural network processing unit (NPU). Exakt vad som finns i NPU:n ger Rockchip endast en skissartad beskrivning av i sitt pressmeddelande: teknik för ”datorseende, ljudprocessning, deep learning, et cetera”.

Vad NPU-blocket än innehåller så gör det uppenbarligen en stor skillnad, för om AI-beräkningarna skulle gjorts i en GPU skulle prestandan enligt Rockchip varit en hundradel.

Rockchip anger prestandan på RK3399pro till 2,4 Tops (biljoner operationer per sekund) vilket är den just nu vanliga metoden att ange neuronnätsprestanda.Måttet är inte särskilt informativt – det syftar bara på klassiska cpu-instruktioner.

Men Rockchip har ytterligare en angivelse, som är mer intressant. Företaget berättar exakt vad processorn levererar när den tankas med tre kända referensnät: VGG16, ResNet50 och InceptionV4. De är bildigenkänningsnät från Oxford, Microsoft Research respektive Google.

Måttet är ”ROI/s”. ROI betyder region of interest.

Indata till neuronnätem är en bild. Utdata är en lista med objekt som nätet hittar i bilden, inramade i varsin rektangulär region.

Här är RK3399pro:s prestanda:

Det här är ett utmärkt sätt att ange neuronnätsprestanda och Elektroniktidningen hoppas att det bildar skola.

Det som möjligen saknas är en angivelse av den effekt som processorn använder när den levererar ovanstående.

NPU:n stöder åttabitars- och sextonbitarsnät och kan programmeras via standardramverken OpenVX, TensorFlow Lite och AndroidNN. Den kan dessutom importera Caffe- och Tensorflowmodeller.

Referenskonstruktioner för hårdvara finns.