MAI-Image-1: Microsoftov prvi lastni generator slik
Microsoft je uradno predstavil svoj prvi interni model za ustvarjanje slik z umetno inteligenco, MAI-Image-1, ki je zdaj na voljo v dveh storitvah: Bing Image Creator in Copilot Audio Expressions. Podjetje je model prvič napovedalo oktobra, zdaj pa je Microsoftov vodja oddelka za umetno inteligenco, Mustafa Suleyman, na platformi X zapisal, da bo model »kmalu na voljo tudi v Evropski uniji«.
Suleyman je dodal, da se MAI-Image-1 odlično izkaže pri ustvarjanju slik hrane, naravnih prizorov, umetniške svetlobe in fotorealističnih detajlov.
Na Microsoftovem blogu so objavili še dodatne podrobnosti.
»MAI-Image-1 blesti pri ustvarjanju fotorealističnih podob, zlasti pri osvetlitvi (odbita svetloba, odboji), krajinskih motivih in številnih drugih elementih. V primerjavi z mnogimi večjimi, a počasnejšimi modeli, ponuja kombinacijo visoke hitrosti in kakovosti, kar uporabnikom omogoča, da svoje ideje hitro vizualizirajo, jih večkrat preoblikujejo in nato nadaljujejo delo v drugih orodjih.«
Novi model MAI-Image-1 bo uporabljen tudi za ustvarjanje UI umetnosti, ki spremlja z umetno inteligenco generirane zvočne zgodbe v t. i. story mode funkciji Microsoftove platforme Copilot Audio Expressions.
Microsoft je že avgusta letos predstavil svoje prve lastne UI modele: MAI-Voice-1 (za govor) in MAI-1-preview (za besedilne naloge). Takrat je podjetje napovedalo, da bo MAI-1-preview delno integriran v pomočnika Copilot, kar je nakazovalo postopni premik podjetja od odvisnosti od OpenAI-jevih modelov.
Danes Microsoft uradno navaja, da Copilot prehaja na najnovejši model GPT-5 podjetja OpenAI, pri čemer uporabnikom ponuja tudi Claude modele podjetja Anthropic kot alternativno možnost.
Model MAI-Image-1 je na Microsoftovi strani in v aplikaciji Bing Image Creator naveden kot eden od treh razpoložljivih modelov za ustvarjanje slik. Preostala dva sta DALL-E 3 in GPT-4o, oba sta produkt podjetja OpenAI.
Prijavi napako v članku





























