Meta lansirala dva nova modela Llama 4

Meta je objavila Llamo 4, najnovejšo zbirko modelov umetne inteligence, ki poganjajo pomočnika z umetno inteligenco Meta AI v spletu ter aplikacijah WhatsApp, Messenger in Instagram. Nova modela, ki ju je mogoče prenesti tudi z Metine spletne strani, sta Llama 4 Scout – majhen model, ki za zagon potrebuje samo en grafični procesor Nvidia H100 – in Llama 4 Maverick, ki je bolj podoben modeloma GPT-4o in Gemini 2.0 Flash. Meta pravi, da je še vedno v procesu usposabljanja modela Llama 4 Behemoth, za katerega Mark Zuckerberg pravi, da je »najzmogljivejši osnovni model na svetu«.
Po navedbah podjetja ima Llama 4 Scout kontekstno okno z 10 milijoni žetonov (delovni pomnilnik modela umetne inteligence) in premaga Googlova modela Gemma 3 in Gemini 2.0 Flash-Lite ter odprtokodni model Mistral 3.1 »v širokem razponu splošno objavljenih primerjalnih testov«. Vse to ji uspe samo z enim grafičnim procesorjem Nvidia H100. Meta navaja podobne trditve o zmogljivosti svojega večjega modela Maverick v primerjavi z GPT-4o podjetja OpenAI in Googlovim modelom Gemini 2.0 Flash ter pravi, da so rezultati pri nalogah kodiranja in sklepanja primerljivi z rezultati modela DeepSeek V3.
Llama 4 Behemoth je najmočnejši model z 288 milijardami aktivnih parametrov, skupno pa kar 2 bilijonoma parametrov. Čeprav še ni bil objavljen, Meta pravi, da lahko Behemoth pri različnih testih zmogljivosti preseže svoje konkurente (v tem primeru GPT 4.5 in Claude Sonnet 3.7).
Meta pravi, da je pri projektu Llama 4 prešla na t. i. tehniko strojnega učenja »mešanice strokovnjakov« (Mixture of Experts, MoE), ki varčuje z viri, saj uporablja le tiste dele modela, ki so potrebni za določeno nalogo. Podjetje namerava na konferenci LlamaCon, ki bo potekala 29. aprila, razpravljati o prihodnjih načrtih za modele in izdelke umetne inteligence.
Podjetje svoje modele označuje kot odprtokodne, kar je le delno res, saj je glede uporabe licenc postavilo stroge omejitve.
Prijavi napako v članku