Domov Računalništvo, telefonija Programska oprema ChatGPT odslej razume tudi slike in glasovne ukaze

Programska oprema

26.09.2023 17:48

Posodobljeno 3 leta nazaj.

Deli z drugimi:

Dodajte nas kot prednostni vir novic na Googlu.

Sledite nam na Google News

ChatGPT odslej razume tudi slike in glasovne ukaze

Podjetje OpenAI nenehno izboljšuje klepetalnega robota ChatGPT. Nova različica uporabnikom omogoča, da ChatGPT aktivirajo tudi z glasom in slikami, s tem pa se pojavljajo tudi nova vprašanja in skrbi. Kaj torej prinaša nova različica in kdaj?

Večina sprememb, ki jih OpenAI uvaja v ChatGPT, se nanaša na to, kaj bot, ki ga poganja umetna inteligenca, zmore: na kakšna vprašanja lahko odgovarja, do katerih informacij lahko dostopa in podobno. Tokrat pa spreminja tudi način, kako lahko sami uporabljate ChatGPT. Podjetje uvaja novo različico storitve, ki vam omogoča, da z umetno inteligentnim AI botom komunicirate ne samo s pisanjem stavkov v besedilno polje, temveč tudi tako, da z njim govorite ali pa samo naložite sliko. Nove funkcije bodo tistim, ki plačujejo naročnino Plus, na voljo v naslednjih tednih, ostali pa bodo nove funkcionalnosti prejeli “kmalu zatem”.

Del z glasovnimi ukazi ni nič pretresljivo novega: tapnete gumb in izgovorite svoje vprašanje, ChatGPT ga pretvori v besedilo in ga posreduje velikemu jezikovnemu modelu, pridobi odgovor in ga pretvori nazaj v govor ter vam odgovori glasovno. To bi moralo spominjati na pogovor z Alexo ali Googlovim asistentom, le da – tako upa OpenAI – bodo odgovori boljši zaradi izboljšane osnovne tehnologije. Zdi se, da se večina virtualnih pomočnikov prenavlja in vključuje velike jezikovne modele – OpenAI pa je za zdaj korak pred vsemi.

Odličen OpenAI-jev model Whisper opravlja velik del pretvorbe govora v besedilo, podjetje pa uvaja tudi nov model pretvorbe besedila v govor, ki naj bi znal ustvariti “zvok, podoben človeškemu, in to samo iz besedila in nekaj sekund vzorčnega govora.” Izmed petih možnosti boste lahko izbrali glas za ChatGPT, vendar se zdi, da OpenAI meni, da ima model veliko večji potencial. OpenAI na primer sodeluje s Spotifyjem pri prevajanju podkastov v druge jezike, pri čemer ohranja zvok glasu osebe, ki vodi podkast. Obstaja veliko zanimivih načinov uporabe sintetičnih glasov in OpenAI bi lahko bil velik del te industrije.

Ne glede na vse pa dejstvo, da lahko ustvarite spodoben sintetični glas samo z nekaj sekundami zvočnega posnetka, odpira vrata za vse vrste potencialno problematičnih primerov uporabe. “Te zmogljivosti predstavljajo nove nevarnosti, kot je možnost, da bi zlonamerni akterji posnemali javne osebnosti in podobno,” je zapisano v blogu podjetja, ki napoveduje nove funkcije. Model ravno zaradi tega ni na voljo za širšo uporabo in bo veliko bolj nadzorovan in omejen na določene primere uporabe ter partnerstva.

Funkcija iskanja po slikah je nekoliko podobna storitvi Google Lens. Posnamete fotografijo, ChatGPT pa bo poskušal razbrati, kaj sprašujete, in ustrezno odgovoriti. V aplikaciji lahko uporabite tudi orodje za risanje, da bi čim bolj jasno postavili vprašanje, ali pa govorite ali tipkate vprašanja, ki se nanašajo na sliko. Tu se kot posebej koristna izkaže narava ChatGPT-ja: namesto da bi izvedli iskanje, dobili napačen odgovor in nato izvedli novo iskanje, lahko bota spodbudite in izboljšate odgovor med samim postopkom. To je zelo podobno temu, kar počne Google z večmodalnim iskanjem.

Očitno ima vključitev slik v ChatGPT tudi svoje slabosti. Ena od njih je, ko uporabite ChatGPT “na osebi”: OpenAI pravi, da je zavestno omejil “sposobnost ChatGPT-ja, da analizira in daje neposredne izjave o ljudeh”. Tako zaradi natančnosti, kot tudi zaradi zasebnosti. To pomeni, da ena najbolj znanstvenofantastičnih predstav o umetni inteligenci – sposobnost, da nekoga pogleda in pove, kdo je – ne bo kmalu uresničena. Kar je verjetno dobra stvar.

Skoraj leto dni po razcvetu ChatGPT-ja se zdi, da OpenAI še vedno skuša ugotoviti, kako svojemu modelu dati več funkcij in sposobnosti, ne da bi ustvaril nove težave in negativne plati uporabe. Z novimi izdajami je podjetje poskušalo hoditi po tej tanki črti z zavestnim omejevanjem tega, kar njegovi novi modeli lahko počnejo. Toda dejstvo je, da ta pristop ne bo deloval vedno. Ko bo vedno več ljudi uporabljalo glasovni nadzor in iskanje po slikah, in ko se bo ChatGPT bližal temu, da postane resnično večmodalen, uporaben virtualni pomočnik, bo vse težje ohranjati vsa ta varovala.

Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Prijavi napako v članku

Vas zanima več iz te teme?

umetna inteligenca ChatGPT

Sorodne novice

Konec samostojne mobilne aplikacije Google AI Studio ...

AI zna prebrati dokument. Ali ga je treba za vsak nov ...

Evropski plačilni sistem Wero prihaja v spletne trgovine ...

Več privilegiranih računov, manj tveganja?

Odprtokodna orodja, ki lahko zamenjajo znane in drage ...

Microsoft bo v poslovnih okoljih onemogočil potrjevanje ...

Kaj berejo drugi?

Vse več podjetij ima virtualnega CISO-ja. Razlog ni le zakonodaja

Kdaj je čas za prehod na industrijski tiskalnik nalepk?

Znanje, ki gradi zaupanje v digitalni dobi

Vas varnost stane strank?

Tehnologija je popolnoma spremenila poslovne prostore in učilnice

Test De’Longhi Magnifica Evo Next: kavomat, ki je ravno prav pameten za večino uporabnikov

Izpostavljeno

MOZA vstopa v Gran Turismo World Series in razkriva ...

Odprtokodna orodja, ki lahko zamenjajo znane in drage ...

Test Khadas Tea Pro: žične slušalke so se vrnile ...

Test ASUS ProArt PX13 GoPro Edition – vrti se mi ...

Samsung Galaxy Z Fold8: telefon, ki sem ga odprl iz ...

Najbolj brano

Polnjenje električnih avtomobilov se zdaj meri v sekundah, ...

Prva kazenska ovadba zaradi uporabe kode za izbris ...

Znanstveniki odkrili, kako iz umazane mešane plastike ...

Najnovejši mali oglasi

Microsoft Surface pro 4, core i5, 128gb ssd, 4gb ram, Win 11

169,00 €

Kranj

Microsoft Surface pro 4, core i5, 128gb ssd, 4gb ram, Win 11

Delujoč Vintage Prenosnik Toshiba Satellite SA10 - prvenstveno namenjen zbirateljem

25,00 €

Ljubljana - Dobrunje

Delujoč Vintage Prenosnik Toshiba Satellite SA10 - prvenstveno namenjen zbirateljem

D Systems DAVE 8 Roadie – kot nov | Original embalaža | TOP stanje

330,00 €

Maribor

D Systems DAVE 8 Roadie – kot nov | Original embalaža | TOP stanje

Noži za robotske kosilnice (komplet 15x)

15,00 €

Ljubljana

Noži za robotske kosilnice (komplet 15x)

45,00 €

Podgorci

SSD SAMSUNG 860 PRO 256 GB SATA3 (NOVO)

Huawei P40 lite E GSM telefon, 64 GB, moder

80,00 €

Pesnica pri Mariboru

Huawei P40 lite E GSM telefon, 64 GB, moder

Dogodki

Avg

ČAROBNI DAN

Sep

INFOSEK 2026

Vsi dogodki

Dražbe / Licitacije Prikaži vse

Trenutna cena 45,⁰⁰€

Ženska pametna ura Forever Bloomdust SB-380 – IZKLICNA CENA 1 €!

Trenutna cena 14,⁰⁰€

Bluetooth zvočnik SBOX BT-60 TANGO – BEL – IZKLICNA CENA 1 €!

Trenutna cena 270,⁰⁰€

E-bralnik / tablični računalnik BOOX Go 10.3 Gen II – IZKLICNA CENA 1 €!

Trenutna cena 8,⁰⁰€

Družinska vstopnica (2 + 2) za Pustolovski park Geoss – IZKLICNA CENA 1 €!

Partnerji Računalniških novic Prikaži vse

SINERGISE d.o.o.

Cvetkova ulica 29, 1000 Ljubljana, Tel: 01 320 61 50

Sinergise razvija geografske informacijske sisteme Slovensko podjetje Sinergise je inovativno visokotehnološko podjetje. Ukvarja se z razvojem geografskih informacijskih sistemov ... Več

Zlati partner

KONICA MINOLTA SLOVENIJA

Dunajska cesta 167, 1000 Ljubljana, Tel: 01 568 05 00

Konica Minolta je inovativno podjetje z “all-in-one” strategijo, ki stremi k ustvarjanju prepričljivih rešitev in storitev na področju upravljanja dokumentov ter povezanih naprednih ... Več

Diamantni partner