Računalništvo, telefonija
24.11.2016 10:00
Posodobljeno 9 let nazaj.

Deli z drugimi:

Share

Umetna inteligenca obvlada branje z ustnic

Umetna inteligenca obvlada branje z ustnic
Umetna inteligenca obvlada branje z ustnic

“Mini-gibi” ustnic so med govorjenjem zelo težko zaznavni in razumljeni, še posebej, če branje z njih poteka na določeni razdalji ali človek morda nekoliko nerazločno govori. Branje z ustnic ni neka znanstvena fantastika, temveč je ključno orodje za razumevanje sveta v primeru takšne ali drugačne okvare sluha. Ob morebitni avtomatizaciji, bi to pomagalo milijonom ljudi po vsem svetu.

Pred kratkim je University of Oxford objavila poročilo (raziskava je bila podprta s strani Alphabetovega DeepMinda) o sistemu umetne inteligence LipNet, ki spremlja video govora osebe in preko branja z ustnic ugotavlja povedano – s 93,4-odstotno natančnostjo.

Prejšnji podoben sistem je deloval na principu “word-by-word” in je imel 79,6-odstotno natančnost. Raziskovalci na University of Oxford pravijo, da je glavna razlika med starim in novim pristopom ta, da so začeli drugače razmišljati o problemu. Namesto učenja umetne inteligence vsakega giba ustnic, pri čemer so uporabljali sistem vizualnih fonemov, so sedaj v sistem vgradili celotne stavke. To je umetni inteligenci omogočilo, da se nauči katera črka spada k še tako majhnemu premiku ustnic.

Za to, da so raziskovalci natrenirali sistem, so sistemu LipNet pokazali preko 29.000 videov s pravilnim tekstom, vsak video pa je bil dolg le tri sekunde. Za primerjavo so raziskovalci vključili človeške bralce z ustnic, ki so imeli kar 47,7-odstotno stopnjo napak, medtem ko je imel sistem zgolj 6,6-odstotno.

Kljub uspešni izvedbi projekta, je ta pokazal na nekatere pomanjkljivosti modernega raziskovanja umetne inteligence. Videi so bili močno standardizirani, vsi sodelujoči so gledali naprej, imeli mirno držo in govorili jasno in brez mašil. Vprašanje je kako bi umetna inteligenca reagirala na bolj naravno okolje in dejavnike, ki vplivajo na človeški govor v vsakdanjem življenju.

Na primer: “Place blue in m 1 soon”. To je bila ena standardnih trisekundnih fraz, ki je bila uporabljena med testiranjem sistema. Barva, predlog, črka, številka in pridevnik, vsak stavek je sledil temu vzorcu. Umetna inteligenca je bila preizkušena v nenavadnih pogojih in zato je dala tudi nenavadno natančne rezultate. Če bi LipNet bral z ustnic naključnim ljudem na naključnih YouTube videih, bi rezultati oz. natančnost sistema brez dvoma padla.

Po mnenju Jacka Clarka iz neprofitnega podjetja OpenAI, je uresničitev takšnega sistema na ravni vsakdanje rabe možna pod tremi pogoji: ogromna količina videov, kjer ljudje govorijo v povsem naravnih situacijah; izboljšanje umetne inteligence do ravni, kjer bi ta bila sposobna branja z ustnic iz različnih kotov; povečanje vrst fraz, ki jih umetna inteligenca lahko predvidi. Tovrstna tehnologija branja z ustnic bi ljudem, ki ne slišijo ali slabše slišijo pomenila ogromno, saj bi lahko bila uporabljena v nešteto situacijah. Razumevanje pogovorov, predstavljanje sveta itd.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

NCOM d.o.o.

Bičevje 5, 1000 Ljubljana, Tel: 040 855 519
Mobilne aplikacije so korenito spremenila način delovanja podjetij. Več kot 3 milijarde ljudi ima dostop do pametnega telefona. Mobilne aplikacije trenutno predstavljajo najučinkovitejši, ... Več
Zlati partner

ADVANT d.o.o.

Cesta na Brdo 119a, 1000 Ljubljana, Tel: 01 470 00 00
Podjetje ADVANT d.o.o. je z vami že od leta 1998. Naše osnovno poslanstvo je biti vodilni graditelj informacijsko komunikacijske infrastrukture. Aktivnosti, ki jih povezujemo ... Več

STUDIO GRAFFIT d.o.o.

Podutiška cesta 92, 1000 Ljubljana, Tel: 01 510 35 70
Studio Graffit Uspešno promocijo podjetja lahko izvedemo na več načinov, preko medijev, spletne strani ali s širjenjem blagovne znamke. Obstaja tudi lažji in bolj praktični ... Več
Bronasti partner

openIT d.o.o.

Dimičeva ulica 13, 1000 Ljubljana, Tel: 01 589 81 89
OpenIT od leta 2012 izvaja poslovna izobraževanja s področja digitalnega marketinga, računovodstva, upravljanja s človeškimi viri (HR), prodaje, prava, financ, time managementa ... Več