OpenAI 推出全新 DALL-E 3 照片生成器
DALL-E 3 naj bi ponujal večjo zaščito za umetnike in oblikovalce, ki trdijo, da tovrstni AI (umetno inteligentni) generatorji slik uporabljajo tuja dela za usposabljanje algoritma in posledično ustvarjanje fotografij in posnetkov.
Razvijalec OpenAI je v središče postavil nove sposobnosti AI generatorja slik, ki naj bi v primerjavi s predhodnikom (DALL-E 2) lahko upošteval in ustvaril veliko več podrobnosti in kompleksnih konceptov.
»Sodobni sistemi za pretvorbo besedila v slike pogosto ignorirajo besede ali opise, kar prisili uporabnike, da se naučijo inženiringa pozivov,« pravijo pri OpenAI. »DALL-E 3 predstavlja velik korak naprej v naši sposobnosti ustvarjanja slik, ki natančno ustrezajo besedilu, ki ga vpišete.«
To vključuje ustvarjanje upodobitev celo najmanjših podrobnosti besedilnega poziva in ustrezno razporejanje elementov prizora, kot je luna nad ulico na sliki spodaj.
DALL-E 3 obljublja, da bo bolj natančno upodobil človeške roke, kar je naloga, ki je za mnoge generatorje slik pretežka. Najbližji rival Midjourney je podobno nadgradnjo napovedal prejšnji mesec, in sicer z novo funkcijo, ki uporabnikom omogoča, da zahtevajo urejanje zgolj dela slike (npr. »odstrani en prst«).
OpenAI je prav tako napovedal načrte za integracijo DALL-E 3 s ChatGPT Plus v prihajajočih tednih. Z združitvijo jezikovnih sposobnosti klepetalnika z generatorjem slik želi ustvariti še bolj natančne slike z možnostmi prilagajanja.
»Ko bo podan poziv z neko idejo, bo ChatGPT samodejno ustvaril prilagojene, podrobne pozive za DALL-E 3, ki bodo spremenili vašo idejo v nekaj oprijemljivega,« pravijo pri OpenAI. »Če vam je določena slika všeč, vendar ni povsem pravilna, lahko ChatGPT z nekaj besedami prosite, naj naredi prilagoditve.«
DALL-E 2 trenutno ni brezplačen. OpenAI zahteva majhno pristojbino za »kredite« slik. ChatGPT Plus pa trenutno stane 20 evrov na mesec. Edini večji AI klepetalnik, ki trenutno ponuja generiranje slik brezplačno, je Microsoftov Bing Chat AI.
Bing Chat prav tako deluje na jezikovnem modelu OpenAI GPT-4. V obvestilu o DALL-E 3 OpenAI priznava naraščajoče skrbi glede avtorstva fotografij, ustvarjenih z umetno inteligenco. »Prav tako raziskujemo najboljše načine, kako ljudem pomagati prepoznati, kdaj je bila slika ustvarjena z umetno inteligenco,« pravijo pri OpenAI.
Podjetje dela na notranjem orodju za razločevanje med umetnostjo, ustvarjeno z AI, in tisto, ki jo je ustvaril človek. Še vedno pa čakamo, da OpenAI ponovno obudi svoje orodje za zaznavanje besedila, ustvarjenega s pomočjo umetne inteligence, ki ga je julija onemogočil zaradi slabe zmogljivosti.
Dotaknili so se tudi številnih tožb umetnikov, ki trdijo, da so generatorji slik AI usposobljeni na njihovih delih. V ta namen je OpenAI predstavil novo orodje, ki umetnikom omogoča, da se odločijo za izključitev svojih del iz baze.
OpenAI prav tako pravi, da lahko DALL-E 3 zavrne ukazne pozive, ki bodo zahtevali, da je slika ustvarjena v slogu živega umetnika. Nov in izboljšan AI generator slik postavlja temelje, da bodo slike, ustvarjene z umetno inteligenco, v prihodnosti postale nekaj čisto vsakdanjega. Ker glede na nedavno sodno odločitev niso zaščitene z avtorskimi pravicami, jih je mogoče ustvariti, objaviti in prodati brez omejitev. »Ne potrebujete našega dovoljenja za ponatis, prodajo ali trženje,« pravijo pri OpenAI.