Runway predstavil model Gen-4.5
Runway trdi, da njegova najnovejša različica modela za pretvorbo besedila v video ustvarja občutno natančnejše in vizualno prepričljivejše prizore kot prejšnja generacija. V objavi na blogu je podjetje zapisalo, da model Gen-4.5 omogoča kinematografske in izjemno realistične rezultate, kar dodatno otežuje razlikovanje med resničnim videom in tistim, ki ga ustvari umetna inteligenca.
V napovedi je Runway poudaril, da Gen-4.5 dosega raven fizične in vizualne natančnosti, kakršne njihovi prejšnji modeli še niso imeli. Novi sistem se bolje drži navodil uporabnika, zato lahko generira podrobne in kompleksne prizore, ne da bi pri tem trpela kakovost videa. Predmeti v posnetkih se premikajo z bolj prepričljivo težo, gibanjem in vztrajnostjo, tekočine pa imajo dinamične lastnosti, ki so bližje resničnim.
Model Gen-4.5 uvajajo postopoma in naj bi ohranil hitrost ter učinkovitost svojega predhodnika. Kljub temu Runway opozarja, da obstajajo omejitve, med drugim težave z obstojnostjo predmetov in vzročnostjo, zaradi česar se lahko zgodi, da se nek učinek pojavi pred dejanjem, ki bi ga moralo povzročiti – vrata se lahko na primer odprejo, še preden nekdo prime kljuko.
Runway ni edini, ki pospešeno razvija vizualno prepričljive UI videe. OpenAI je septembra predstavil drugo generacijo svojega modela Sora, ki je prinesla opazne izboljšave na področju simulacije fizikalnih lastnosti. Vodja projekta Bill Peebles je takrat poudaril, da lahko model zdaj natančno ponazarja zahtevne gibe, kot je salto nazaj na deski za surfanje, pri čemer so dinamika tekočin in vzgonske sile realistično izračunane.
Poleg natančnejših fizikalnih simulacij Runway izpostavlja tudi boljšo obravnavo različnih vizualnih slogov. Model Gen-4.5 naj bi dosledneje ustvarjal fotorealistične, stilizirane in filmsko obdelane posnetke, pri čemer podjetje trdi, da fotorealistične rezultate pogosto ne moremo ločiti od dejanskega video posnetka.
Prijavi napako v članku



























