Razvijalec odklenil Applov M4 čip
Procesorji Apple M4 skrivajo precejšen računalniški potencial za operacije z umetno inteligenco, vendar tehnološki velikan svoje komponente tradicionalno drži pod strogim nadzorom. V praksi to pomeni, da lahko ustvarjalci programov nevronsko enoto (Neural Engine) uporabljajo samo za sklepanje oziroma poganjanje že naučenih modelov, ne morejo pa na njej neposredno razvijati in trenirati novih algoritmov od začetka.
Raziskovalec, ki na spletu deluje pod vzdevkom »0x0SojalSec«, je na platformi GitHub objavil izvorno kodo, ki podrobno prikazuje, kako izkoristiti polno zmogljivost silicija in doseči 15,8 TFLOPS skrite računske moči za namene strojnega učenja. Čeprav ta številka danes ni rekordna, je podvig izjemen zato, ker je bil izveden popolnoma zunaj Applovega uradnega razvojnega okolja.
Ker podjetje z varnostnimi nastavitvami ne dovoljuje neposredne komunikacije z nevronskim motorjem za tako napredne naloge, je moral avtor projekta najti pot brez uporabe uradnih programskih orodij, kot sta CoreML ali Metal, prav tako pa se ni mogel zanesti na grafični procesor. Namesto tega je povsem od začetka zgradil lasten vmesni jezik. Ta prilagojena programska rešitev deluje kot most, ki omogoča polno vzvratno širjenje napake in učenje transformatorskih modelov neposredno na nevronskem čipu.
Zaradi tovarniško omejene zasnove strojne opreme je bilo treba uvesti nekaj izjemno iznajdljivih trikov za ohranjanje stabilnosti operacijskega sistema. Če se proces med intenzivno fazo učenja zatakne ali zamrzne, prilagojeni programski jezik uporabi poseben ukaz za izvršitev, ki proces ponovno zažene. Sistem na ta način osveži svoje trenutno stanje in nemoteno nadaljuje z obdelavo podatkov, ne da bi ob tem povzročil sesutje celotne aplikacije.
Pomemben izziv pri zagonu tako zahtevnih obremenitev je bila tudi hitrost delovanja. Da bi celoten postopek učenja potekal čim bolj tekoče, je razvijalec sistem konfiguriral tako, da vse podatke zapisuje neposredno v sistemski delovni pomnilnik. Z zavestnim izogibanjem bistveno počasnejšemu pomnilniku bliskovnih naprav je celotna operacija ostala izjemno hitra.
Prijavi napako v članku




























