Kaj je CAPTCHA in zakaj je vedno težja?
Jaz nisem robot.
Ampak zagotovo vas vaš računalnik ali pametni telefon kar naprej obtožujeta, da ste robot in zahtevata, da rešite “preprosto” uganko, preden uspete oddati obrazec, se prijaviti,…
Najbolj zoprno pri vsem tem pa je, ker vedno ne uspete rešiti uganke pravilno, ker niste našli vseh hidrantov, avtomobilov, gorovja,…
Zdi se, da te uganke postajajo vedno težje – in tudi zares so. V ozadju pa se dogaja veliko več, kot le to, da dokažete, da niste robot.
Sama beseda CAPTCHA pomeni Completely Automated Public Turing test to tell Computers and Humans Apart (popolnoma avtomatski javni test, ki loči računalnik od človeka).
Kako je CAPTCHA nastala?
CAPTCHO je izumil Luis Von Ahn. V letu 2000 je bil študent na Carnegie Mellon univerzi v ZDA, kjer se je udeležil predavanja glavnega znanstvenika pri takrat najbolj popularnem podjetju Yahoo!. Predavanje je bilo o 10-ih problemih, ki jih ne znajo rešiti. Za Yahoo! je največjo težavo predstavljal avtomatski program, ki je lahko samo v enem dnevu ustvaril več milijonov fiktivnih uporabniških računov. Potrebovali so zanesljiv način, kako razločiti med računalnikom in človekom.
Test je moral biti narejen tako, da ga je lahko rešil vsak človek, ne glede na starost, spol, izobrazbo ali jezik. Moral pa je biti tudi takšen, da ga računalnik nikakor ne bi mogel rešiti. Kaj kmalu so odkrili, da so ljudje zelo sposobni pri optičnem prepoznavanju oziroma branju.
Ljudje prepoznamo tekst v vseh mogočih položajih, pod različno osvetlitvijo, upognjenostjo (kot v knjigi) ali celo zapisano v čudni (doktorski) pisavi. Najboljše od tega pa je, da smo se branja učili že od malih nog.
Programerji so zato ustvarili test, pri katerem so računalniku predstavili tekst v obliki, ki ga je razumel, ter v obliki slike za uporabnika in ga združili v eno. Črke in številke so povečali, zmanjšali, odebelili, stanjšali, raztegnili, zožili, ukrivili … vse, samo da bi vsebino prepoznal le človek. Računalnik je lahko nato vpisan tekst od uporabnika primerjal in ocenil z besedilom, ki ga je imel že vpisanega za določeno sliko.
V prvih dneh implementacije pri Yahooju! je bila CAPTCHA uporabljena več milijonkrat v enem dnevu. Ampak v ozadju so vse črke in številke, ki so jih ljudje vpisovali, imele višji cilj.
Potem je prišla reCaptcha
Leta 2005 se je pojavila nova različica, imenovana reCaptcha, ki je bila sestavljena iz dveh besed. Pri tem je bila ena od teh generirana, da je računalnik že vedel, kaj pomeni, druga pa je bila izvzeta iz knjige ali starega časopisnega članka priznane novinarske združbe New York Times, za katero pa računalnik ni vedel, kaj pravzaprav pomeni, in se je zanašal izključno na človeka, da jo prepozna.
Kako bo računalnik vedel, ali je človek pravilno prepoznal drugo besedo? Preprosto je obe besedi prikazal več stotim uporabnikom, in če so ti prvo besedo rešili pravilno, je računalnik predvideval, da so pravilno rešili tudi drugo.
V času delovanje reCaptche je bilo opravljenih toliko testov, da so lahko za eno leto časopisnih člankov digitalizirali v samo 4 dnevih.
Ko so testi za računalnik postali mala malica, so prišle slike
Nato je Google kupil reCaptcho v letu 2009 in s pomočjo te tehnologije digitaliziral svoje knjige in članke. Hkrati pa je gigant gradil bazo podatkov iz vseh teh neprepoznavnih črk, številk in znakov. Posledica tega je bilo, da je računalnik postal tako pameten, da je lahko že sam reševal te teste.
V Googlovi raziskavi iz leta 2014 je mogoče razbrati, da je človek najbolj zapletene besede bil zmožen prepoznati z 33% natančnostjo, medtem ko je računalnik te prepoznal z kar 99,8% natančnostjo.
In ko je test postal lažji za umetno kot naravno inteligenco, so ga morali programerji spremeniti. Tako je leta 2014 luč sveta ugledala reCaptcha V2 (verizija 2), katera je črke, številke in znake zamenjala s slikami.
Vendar je tokrat začel Google avtomatično učiti umetno inteligenco prepoznavanja različnih objektov. Takrat so se pojavile slike iz sveta avtomobilizma. Te podatke so nato uporabili tako za svoj samovozeči avtomobil, da je lahko prepoznal različne objekte v realnem življenju, kot tudi za Google Zemljevide.
Ampak, tako kot so se računalniki naučili prepoznavati besedilo bolje od človeka, so sedaj računalniki zmožni vedno bolje prepoznati slike.
Prepoznavanje na podlagi vedenja
Tako se je pojavila reCaptcha V3 (verzija 3), ki ne uporablja več znakov ali slik. Sedaj program loči med robotom in človekom le na podlagi vedenja.
Kako pa deluje? V ozadju na spletnih straneh se izvaja skrivni test, kar naredi CAPTCHO popolnoma nevidno. Ta analizira premike in klike miške. Če npr. prehitro premikate miško, klikate preveč okoli in prehitro tipkate, potem vas bo CAPTCHA pozvala, da rešite test s slikami.
V bistvu vam sledi po vsem svetovnem spletu. Sedaj računalnik ve, ali ste robot ali ne, samo glede na to, kdo ste in kaj počnete. S strani uporabnosti je to veliko boljše, kot prepoznavanje slik; medtem ko je s strani zasebnosti to velik vprašaj.
Za sedaj še ni znano, kaj pravzaprav kliki in premiki mišk učijo računalnik in kdaj bodo tudi to računalniki bili zmožni opravljati enako kot človek. Morda pa v prihodnosti ne bo več načina, s katerim bomo lahko ločili robota od človeka.
Prijavi napako v članku