Meta 发布了迄今为止最大、最好的开源 UI 模型
Že aprila je Meta napovedala, da dela na prvem tovrstnem umetno inteligentnem modelu: odprtokodnem modelu z zmogljivostjo, ki je primerljiva z najboljšimi zasebnimi modeli podjetij, kot je OpenAI.
Končno je napovedani model tukaj. Meta je izdala Llama 3.1, največji odprtokodni model umetne inteligence doslej, za katerega podjetje trdi, da v številnih parametrih prekaša GPT-4o in Anthropicov Claude 3.5 Sonnet. Meta po novem omogoča, da je pomočnik Meta AI, ki temelji na Llami, na voljo v več državah in jezikih, hkrati pa dodaja funkcijo, s katero je možno kreirati slike na podlagi specifičnih preferenc posameznika. Izvršni direktor Mark Zuckerberg zdaj napoveduje, da bo Meta AI do konca leta najbolj razširjen UI pomočnik, prehitel naj bi tudi ChatGPT.
Llama 3.1 je veliko bolj kompleksen model, kot Llama 3, ki je izšel pred nekaj meseci. Natreniran je na 15 bilijonih žetonov, za kar so uporabili več kot 16.000 kartic Nvidia H1000. Model sestavlja 405 milijard parametrov, torej numeričnih vrednosti v nevronski mreži. Meta pričakovano ne želi izdati stroška razvoja novega modela Llama 3.1, je pa jasno, da če sklepamo glede na ceno posameznih čipov Nvidie govorimo o stotinah milijonov dolarjev.
Torej, glede na stroške, zakaj Meta še naprej podarja Llamo z licenco in zahteva samo odobritev podjetij z več sto milijoni uporabnikov? V pismu objavljenem na blogu podjetja Meta Zuckerberg trdi, da bodo odprtokodni modeli umetne inteligence prehiteli – in se že izboljšujejo hitreje kot – lastniške modele, podobno kot je Linux postal odprtokodni operacijski sistem, ki danes poganja večino telefonov, strežnikov in naprav. “Verjamem, da bo model Llama 3.1 v panogi prelomna točka, kjer bo večina razvijalcev začela uporabljati predvsem odprto kodo,” pravi Zuckerberg.
Meta sodeluje z več kot dvema ducatoma podjetij, vključno z Microsoftom, Amazonom, Googlom, Nvidio in podjetjem Databricks, da bi Llamo 3.1 karseda izpopolnila in razvijalcem pomagala pri uvajanju lastnih različic. Meta trdi, da delovanje v fazi produkcije Llama 3.1 stane približno polovico cene GPT-4o. Meta je javno objavila tudi uteži modela, tako da ga lahko podjetja učijo na svojih podatkih in ga prilagodijo svojim željam.
Meta ne govori prav veliko o podatkih, ki jih je uporabila za treniranje Llame 3.1. Ljudje, ki delajo v podjetjih z umetno inteligenco, pravijo, da teh informacij ne razkrivajo, ker so poslovna skrivnost, medtem ko kritiki pravijo, da je to taktika za odložitev neizogibnega napada tožb zaradi avtorskih pravic, ki prihajajo.
Metina lastna izvedba Llame je njen UI pomočnik, ki je splošni klepetalni robot, kot je ChatGPT in ga je mogoče najti v skoraj vseh delih Instagrama, Facebooka in WhatsAppa. Od tega tedna bo Llama 3.1 najprej dostopna prek WhatsAppa in v ZDA spletnega mesta Meta AI. V prihodnjih tednih mu bosta sledila Instagram in Facebook.
Medtem ko je najnaprednejši model Llama 3.1 s 405 milijardami parametrov brezplačen za uporabo v Meta AI, vas bo pomočnik preklopil na zmanjšan model s 70 milijardami, ko preseže nedoločeno število pozivov v danem tednu. To nakazuje, da je 405-milijardni model predrag, da bi Meta delovala v polnem obsegu.