Računalništvo, telefonija
24.11.2016 10:00
Posodobljeno 9 let nazaj.

Deli z drugimi:

Share

Umetna inteligenca obvlada branje z ustnic

Umetna inteligenca obvlada branje z ustnic
screen-shot-2016-11-06-at-9-31-11-pm

“Mini-gibi” ustnic so med govorjenjem zelo težko zaznavni in razumljeni, še posebej, če branje z njih poteka na določeni razdalji ali človek morda nekoliko nerazločno govori. Branje z ustnic ni neka znanstvena fantastika, temveč je ključno orodje za razumevanje sveta v primeru takšne ali drugačne okvare sluha. Ob morebitni avtomatizaciji, bi to pomagalo milijonom ljudi po vsem svetu.

Pred kratkim je University of Oxford objavila poročilo (raziskava je bila podprta s strani Alphabetovega DeepMinda) o sistemu umetne inteligence LipNet, ki spremlja video govora osebe in preko branja z ustnic ugotavlja povedano – s 93,4-odstotno natančnostjo.

Prejšnji podoben sistem je deloval na principu “word-by-word” in je imel 79,6-odstotno natančnost. Raziskovalci na University of Oxford pravijo, da je glavna razlika med starim in novim pristopom ta, da so začeli drugače razmišljati o problemu. Namesto učenja umetne inteligence vsakega giba ustnic, pri čemer so uporabljali sistem vizualnih fonemov, so sedaj v sistem vgradili celotne stavke. To je umetni inteligenci omogočilo, da se nauči katera črka spada k še tako majhnemu premiku ustnic.

Za to, da so raziskovalci natrenirali sistem, so sistemu LipNet pokazali preko 29.000 videov s pravilnim tekstom, vsak video pa je bil dolg le tri sekunde. Za primerjavo so raziskovalci vključili človeške bralce z ustnic, ki so imeli kar 47,7-odstotno stopnjo napak, medtem ko je imel sistem zgolj 6,6-odstotno.

Kljub uspešni izvedbi projekta, je ta pokazal na nekatere pomanjkljivosti modernega raziskovanja umetne inteligence. Videi so bili močno standardizirani, vsi sodelujoči so gledali naprej, imeli mirno držo in govorili jasno in brez mašil. Vprašanje je kako bi umetna inteligenca reagirala na bolj naravno okolje in dejavnike, ki vplivajo na človeški govor v vsakdanjem življenju.

Na primer: “Place blue in m 1 soon”. To je bila ena standardnih trisekundnih fraz, ki je bila uporabljena med testiranjem sistema. Barva, predlog, črka, številka in pridevnik, vsak stavek je sledil temu vzorcu. Umetna inteligenca je bila preizkušena v nenavadnih pogojih in zato je dala tudi nenavadno natančne rezultate. Če bi LipNet bral z ustnic naključnim ljudem na naključnih YouTube videih, bi rezultati oz. natančnost sistema brez dvoma padla.

Po mnenju Jacka Clarka iz neprofitnega podjetja OpenAI, je uresničitev takšnega sistema na ravni vsakdanje rabe možna pod tremi pogoji: ogromna količina videov, kjer ljudje govorijo v povsem naravnih situacijah; izboljšanje umetne inteligence do ravni, kjer bi ta bila sposobna branja z ustnic iz različnih kotov; povečanje vrst fraz, ki jih umetna inteligenca lahko predvidi. Tovrstna tehnologija branja z ustnic bi ljudem, ki ne slišijo ali slabše slišijo pomenila ogromno, saj bi lahko bila uporabljena v nešteto situacijah. Razumevanje pogovorov, predstavljanje sveta itd.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

OPTIPRINT d.o.o.

Kranjčeva ulica 20, 1000 Ljubljana, Tel: 05 902 58 12
Podjetje Optiprint je leta 2009 uspešno predstavilo poslovni model nudenja cenovno dostopnega in brezskrbnega najema barvnih tiskalnikov in multifunkcijskih naprav. Uspešno poslovanje ... Več
Zlati partner

GS1 Slovenija

Dimičeva ulica 9, 1000 Ljubljana, Tel: +386 1 5898 320
GS1 Slovenija je neodvisna in nepridobitna organizacija na področju mednarodnih standardov GS1 za identifikacijo, zajem in elektronsko izmenjavo podatkov v Sloveniji. Ima preko ... Več
Zlati partner

RITTAL d.o.o.

Letališka cesta 16, 1000 Ljubljana, Tel: 01 546 63 70
Rittal spodbuja inovacije in živi svoje vrednote To je Rittal. Globalni igralec, vodilni inovator, družinsko podjetje in zgleden delodajalec. Rittal zgodba Prihodnost Rittala se je ... Več

eTAROK, MIROSLAV CIGAN s.p.

Ulica Štefana Kovača 2, 9231 Beltinci, Tel: 041 519 443
Računalniška igra za ljubitelje taroka Življenje se je v zadnjem letu preselilo v naše domove, kjer poleg dela iščemo različne vrste razvedrila. Za ljubitelje igre s tarok ... Več