Računalnik bere z ustnic
Intel je konec aprila izdal novo programsko opremo, ki pomaga prepoznavati človeški govor. Kot vemo, se človeštvo z Microsoftom na čelu že leta in leta trudi prepričati računalnike v to, da bi prepoznavali človekovo govorico. To pa je, izgleda, zelo trd oreh, saj so so na tej poti številne ovire, med katerimi je največja večjezičnost in pa različne barve oz. višine posameznikovega glasu. Tako pridemo do 95- in več odstotne pravilnosti prepoznave govorjene angleščine, kar pa še vedno ni dovolj za resno uporabo, kjer potrebujemo zanesljivost prepoznanih besed.
No, in ravno pri zanesljivosti je sedaj svoje rekel tudi Intel, ko je izdal programsko opremo Audio Visual Speech Recognition. Program pomaga obstoječim programom za prepoznavo govora na tak način, da “gleda” govorčeve ustnice. S pomočjo naprednih algoritmov, ki jih uporablja, na podlagi potez na ustnicah pripomore k končni pravilni odločitvi računalnika, za katero besedo gre.
Včasih so tovrstni programi imeli tehnološko oviro, saj so bile kamere premalo natančne in predrage, pa tudi procesorji niso bili kos zahtevnim računanskim nalogam v realnem času. Danes so digitalne web kamere že zelo poceni, imajo visoke ločljivosti in prepustnosti (USB 2.0), vse skupaj pa povezujejo hitri procesorji, ki lahko premeljejo še več odločitvene logike na poti k res kakovostnemu prepoznavanju človekovega govora.
Omenjeni Intelov program AVSR je del knjižnice OpenCV, ki vsebuje algoritme za prepoznavanje mimike. OpenCV je odprta koda, ki si jo je k sebi pretočilo že pol milijona uporabnikov.
Prijavi napako v članku