Naučil překládat Google, teď pracuje na umělé inteligenci pro Facebook

Článek převzat z: IDNES.cz

Tomáš Mikolov prošel Microsoftem i Googlem, aby ho nakonec „přetáhl“ do Facebooku sám Mark Zuckerberg. Stojí za tím věděcká práce, kde Mikolov dokázal, že jazyk a matematika od sebe nejsou tak vzdálené, jak se zdá. Všimli jste si, že Google Translator už nepřekládá do češtiny jednotlivá slova, ale smysl vět? To je i jeho zásluha.
Tomáš Mikolov, vědec v oblasti umělé inteligence

Vy jste přední odborník na umělou inteligenci. Jak vypadá její vývoj, jsou vědci blízko cíli?
Podle mě jsme blíž spíš k začátku, než k cíli. Než se dostaneme k té pravé umělé inteligenci, tak to bude trvat ještě hodně dlouho. Momentálně jde více o trik. A ještě lépe řečeno – o jakousi iluzi umělé inteligence.

Jak to myslíte, že jde o iluzi?
Klasickým příkladem jsou třeba chatboti jako je Siri od Applu, kteří s uživateli zdánlivě vedou nějakou konverzaci. Ale k takové, jakou spolu vedeme my dva, se to ani neblíží. Není inteligentní, ale předepsaná. Já nevím, na co se mě teď zeptáte a vy nevíte, co na to odpovím.

To je přece stejný princip jako u chatbota. Můžu se ho zeptat, na co chci.
To je sice pravda, ale on má naprogramovaný nějaký scénář, podle kterého postupuje a drží se ho. Chatbot má velkou databázi konverzačních formulí, obratů, informací, ale sám nemyslí, jen ty formule kopíruje. A když z vymezených kolejí uživatel vyjede, program se ho v lepším případě snaží dostat nenápadně zpátky do scénáře, v horším odpoví nesmysl.

Tomáš Mikolov, (36)

Doktorát získal na VUT Brno a je ve světě uznávaným odborníkem na umělou inteligenci. Jeho výzkum strojového učení razantně vylepšil matematické modely jazyka a tímto následně mnoho aplikaci jako je třeba překladač Google.

Prošel stážemi ve firmách Microsoft Research i Google, nyní pracuje ve výzkumném týmu společnosti Facebook.

„Král – muž + žena = královna“ – tento vzoreček Tomáše Mikolova proslavil a demonstruje možnosti vektorové reprezentace slov.

Je čerstvým laureátem ceny NF Neuron za Významný objev v oblasti Computer science.

Ve Facebooku se snaží získat peníze i pro českou vědu. Část jich má od společnosti už přislíbenou a pokud půjde všechno podle plánu, mohly by se finance ke studentům dostat už během příštího roku.

Nezáleží to tedy jen na velikosti databáze?
Zdánlivě ano, aby konverzace byla relativně smysluplná. Jenže bude jen naprogramovaná. Co v programu nebude, nebude ani v konverzaci. Chatbot sám nic nevymyslí.

Takže k okamžiku, kdy budou počítače chytré jako lidé, máme ještě daleko.
Přesně tak, aspoň podle mého názoru.

A co lidé chytří jako počítače?
No, to je zajímavá otázka, ale spíš filozofická. Kdo ví. Ale já si myslím, že jestli jednou dojde ke spojení umělé a lidské inteligence, tak potom ano, mohli bychom mít individuální počítač v hlavě, který by byl spíše asistent. Věděl by všechno, co by věděl uživatel a pomáhal nám s běžnou denní agendou nebo vykonávat úlohy, které jsou pro nás v současnosti nemožné. Například v krátkodobé paměti podle výzkumů můžeme udržet nějaký šest a sedm věcí, což by s optimální pamětí odpadlo a ten limit by vůbec nemusel být konečný. Krásným příkladem jsou výjimečné osobnosti z minulosti, které dokázaly vypočítat odmocninu šestimístných čísel z hlavy.

Krásným příkladem v čem?
Někteří lidé mají tu „pracovní paměť“ lepší. Řekněme že se vás zeptám, kolik je 147×253. Tak to mi asi z hlavy výsledek neřeknete, že?

Ne.
Ale když vám dám papír, tužku, čas a začnete si to propočítávat pod sebe, k výsledku se časem dopracujete. A kdyby byla vaše paměť přesnější a dovolila vám si čísla představit stejně jako na papíře, tak to ve výsledku není vůbec složité, jak se nám to na první pohled zdá.

A nezakrní nám s vylepšováním počítačů mozek? Přece jen nám dost usnadňují život.
Samozřejmě i na to existují různé teorie, že dlouhodobá paměť zakrňuje kvůli jednoduchému přístupu k různým databázím, informacím na internetu a snadnému vyhledávání. Nemusíme si pamatovat spousty faktů, ale stačí si zapamatovat jak a kde je najít. Z tohoto hlediska nám možná paměť zakrňuje, ale je to špatně nebo dobře? Nakonec se kapacita mozku díky tomu může soustředit na zajímavější problémy než data, místa a další. Naopak můžeme vymýšlet, jak ta fakta efektivněji kombinovat a vyhledávat. Já bych řekl, že je to přirozená evoluce, které bych se nebránil.

Jak tedy vypadá ideální svět podle Tomáše Mikolova?
To se podle mě dá odhadnout z časové trajektorie toho, co se dělo v posledních padesáti letech. V nich můžeme vidět, že se k sobě lidé a počítače neustále přibližují. Nejen fyzicky – tedy tak, že máme pořád mobil v kapse. Ale i tak, že si náš mozek stále více zvyká na používání počítačů. Moje vize je, že to bude neustále pokračovat a počítač jako nástroj bude stále blíž našemu vědomí, až nakonec budeme více integrovaní.

O jak velké integraci tady mluvíme?
Například když jsem byl ještě v Googlu, pracovali jsme na Google Glass, což byl trochu kontroverzní projekt. V brýlích měl člověk malou obrazovku, na kterou si mohl člověk promítat třeba dodatečné informace o tom, co viděl před sebou. Tehdy to byl trochu sci-fi projekt, který se zrušil s tím, že to hodně lidem z různých důvodů vadilo. A podle mě to byl až moc velký skok. Velký skok z toho, na co jsme byli v té době zvyklí. Ale za dvacet, třicet let může být taková technologie běžná. Bude nám rozšiřovat realitu, ze které stejně lidé vidí jen nějaký výřez.

Myslíte oproti zvířatům například?
Ano. Třeba ptáci vidí daleko větší spektrum barev než my, takže jsou schopní vidět svět úplně jinak. A to by nám mohla umožnit technologie. Rozšíří nám svět, který bude daleko zajímavější a teď je zbytečně malý.

Počítače mohou být inteligentní asistenti, podobní těm lidským

A jak vidíte svět vy? Máte rozšířené vidění toho, co se dá všechno udělat?
Co se týká počtu barev, rozšířené vidění tedy určitě nemám. I když by to bylo strašně zajímavé. Ale přemýšlím o různých nápadech, kterých mám spousty. Jsou spíše sci-fi, ale jsou to ve výsledku myšlenky, které mě vedly k výzkumu, a některé se nakonec zrealizovaly.

Ve vašem podání všechno zní, že jste všechno vymyslel mimoděk u snídaně, je to všechno logické a jasné. Nemám však pocit, že bych u snídaně něco takového jen tak vymyslela…
Třeba i vymyslela, ale jedna věc nápad mít a druhá zrealizovat. Což často není vůbec jednoduché a může to trvat několik let. Navíc pokud půjde o něco převratného, přijde s tím i resistence od vědecké společnosti. Hlavně od těch, jejichž předchozí práci budete vyvracet. Je to trochu boj, prosazovat nové věci. Není jednoduché nápad dostat do praxe, jak se na první pohled může zdát, a to ani tehdy, když hmatatelně funguje.

To byl i váš případ? Musel jste bojovat za svůj objev?
Musel. V případě rekurentních neuronových sítí trvalo několik let, než začaly fungovat první modely. Dalších několik let trvalo, než jsem přesvědčil ostatní vědce, že tady ten potenciál je a výsledky jsou opravdu tak dobré. Navíc je ten model opravdu velmi jednoduchý, takže všichni tvrdili, že „takhle jednoduché to přece být nemůže“.

Takže u kolegů převládala určitá skepse. Jak jste je nakonec přesvědčil?
Vydal jsem program jako open source a mohli si to všichni vyzkoušet sami. Ale i tak dalších několik let trvalo, než se nápady dostaly do online verze překladače a internetu, než se to implementovalo do aplikace. Na tom už pak samozřejmě pracovala řada dalších lidí, to jsem nedělal sám. Byl to takový dlouhý řetězec od prvního nápadu k realizaci.

Pomohlo vám k objevu ještě něco? Kdy přišla první myšlenka?
Často jsem jezdil za rodinou do Polska, protože máma z Polska pochází. Tam jsem také poprvé viděl počítač. Když se člověk pohybuje v bilingvní společnosti už od dětství, tak mu spousta věcí vyplyne samovolně a jeví se jako samozřejmé a jednoduché.

Google skokově vylepšil překlad. Umělá inteligence se zakousla do češtiny

Váš rodný jazyk není světový. Je pro vás čeština výhodou nebo ne?
Řekl bych, že ano. To, že se slova skládají z nějakých částí, faktorů, nezní pro někoho, kdo mluví česky jako něco zvláštního, nýbrž jako samozřejmá věc. Že máme nějaké předpony, přípony, pády, to je nám vcelku jasné. I proto mě napadlo, jak využít matematiku. Modely, které popisují jazyk, by si informaci o předponách a příponách měly spočítat samy. To ale rodilý angličtinář nevidí, a nápad že slova by měla sdílet parametry pokud si jsou podobna tak zjevný není. No a právě to sdílení parametrů umožňuje natrénovat mnohem přesnější modely, které produkují například při tom překladu mnohem smysluplnější věty.

Ale pes a kočka opravdu nejsou stejní přece. A do té doby, než jste na ty vzorce přišel, se překládalo jak?
Modely, které jsem já překonával, naopak braly slovo jako jednotku, která je naprosto rozdílná od všech ostatních. Takzvaně ortogonální, což znamená, že nemají nic společného a jsou jedinečné. Například pes a kočka byla dvě naprosto rozdílná slova, která neměla žádnou podobnost. Měla jen přidělené číslo, které bylo odkazem do slovníku. Takže dříve bylo potřeba zbytečně mnoho trénovacích příkladů, dnešní systémy naopak generalizují mnohem lépe.

Jde o pozici ve větě. Tady máme podstatné jméno, které se nějak chová, má ve větné skladbě místo. Navíc ta slova neměla žádnou kategorii typu zvíře, savec, domácí mazlíček a tak podobně. To překlad strašně ztěžovalo a dělalo ho ve výsledku nepřesným a nesmyslným. Jde o slova, která sdílí spoustu vlastností jako například bílá, zelená, modrá, červená. Všechno jsou to barvy, ale starší systémy to nedokázaly reprezentovat. Nyní jsou však založené na umělých neuronových sítích, což zní strašně složitě, ale složité to není. Jsou to jednoduché matematické modely pro které se vymyslelo zajímavé jméno, aby upoutaly pozornost.

V Silicon Valley občas vládne zlatá horečka, každý chce kousek

A jací jsou vědci? Trvalo vám poměrně dlouho, než jste vědeckou komunitu dokázal o svém výzkumu přesvědčit.
Vědecké prostředí je složité popsat, každý z vědec je jiný. Jedni si budou chránit svoje teorie a druzí člověka vyslechnou. Já jsem vyvracel jejich dosavadní teorie, jejich práci. Logicky se bránili, i když to nebyla pravda a uznali to až po letech. Někdo chce na výsluní zůstat co nejdéle. Což podle mě není úplně dobře.

Co ti druzí vědci?
To jsou lidé, kteří se opravdu zajímají o problém a chtějí znát řešení. Ti jsou naopak nadšení ze všeho nového, co se objeví. Rozhodně se to nedá generalizovat na vědeckou komunitu dobrou a špatnou. Ale celkově vzato, pokud přijdete s nějakým nápadem, který je mimo mainstream nebo je neobvyklý, bude většina lidí skeptická a bude trvat, než je přesvědčíte. Třeba i rok, dva, i když jsou ty výsledky použitelné. Ale vyžadujete po nich, aby změnili svoje dosavadní myšlení a to rozhodně není jednoduché.

Každý chce mít svůj objev a úspěch. Vědecké prostředí na mě působí velmi konkurenčně.
„Problém“ je na vědeckých konferencích. Když na ní přijdete, třeba zrovna na konferenci ke strojovému učení, po skončení to vypadá, že je všechno vyřešené. Je to až komické – máme tisíce publikací za rok a de facto všechny slibují, že došlo ke zlepšení nejlepších výsledků v oboru. Což vám už z pozice lajka musí znít neuvěřitelně. Pokud mají pravdu všichni, je obor vyřešený a všichni máme hotovo. Samozřejmě, že to pravda není. Nakonec zjistíte, že 99 procent vědců má nereprodukovatelné výsledky. Že si něco přikrášlili, případně základní výsledek, který měl být v oboru nejlepší zrovna nejlepší nebyl, že srovnávali větší model s menším, zapomněli ocitovat nějaké dřívější výsledky, objeví se omyly…

A zapomněli nebo „zapomněli“?
No, opravdu je to občas našizené, abych řekl pravdu. Když se zeptáte autorů osobně, tak to i přiznají a řeknou na rovinu „kdybych tam to srovnání dal, můj výsledek bude vypadat hůř, recenzenti mi pak napíšou, že můj výsledek není dostatečně dobrý, na konferenci se nedostanu, studium nedokončím, nedostanu práci, tak jsem to napsal takhle“. To mi řekla spousta lidí. Mě se to samozřejmě nelíbí. Já jsem se vždycky snažil všechno dělat poctivě, mít to ověřené a podložené. Proto mi také trvalo asi tři roky studia, než jsem vydal svůj první článek.

Tři roky je dlouhá doba na vydání článku?
Je. Často je třeba v Americe vidět, že doktorandům je dvacet tři let a během prvního roku mají hotové čtyři články na mezinárodních konferencích. Opravdu mohou mít tak skvělé výsledky okamžitě potom, co zahájí studium? No, a tady jsou to často právě ty přikrášlené výsledky. Je to samozřejmě velmi konkurenční prostředí, řada lidí si na to stěžuje, ale tak to prostě je. Navíc když chcete dokončit doktorandské studium, musíte ty články mít. Jenže pak se z vědců stávají spíš prodavači líbivých nápadů, které často nikam nevedou. Často jsou takové publikované články spíš lepší domácí úkoly.

NF Neuron

Nadační fond Neuron letos ocenil deset nejlepších českých vědců. Kategorie jsou rozdělené na:

  • Ceny pro mladé vědce,
  • Celoživotní přínos vědě
  • Významný vědecký objev

Právě v poslední jmenované kategorii uspěl i Tomáš Mikolov díky svému výzkumu strojového učení, který stojí za výrazným vylepšením aplikací jako je třeba překladač Google.

Vědec Tomáš Mikolov na předávání cen NF Neuron (19.12.2018)

Takže do toho zasahuje marketing?
Řekl bych, že ano a poměrně hodně. Mě občas prostředí v Silicon Valley připomíná zlatou horečku na Klondajku, každý si chce urvat kousek. Jsou tady všechny ty bohaté firmy jako Facebook, Google, Twitter, Amazon, Apple, Microsoft a tak dál. Firmy se pak přetahují o zaměstnance, ti chtějí být zase co nejvíc vidět, aby byli co nejzajímavější a měli milionové platy. Spousta lidí se tam vrhla s vidinou rychlého zbohatnutí a nakonec se každoročně objevují mraky různých start upů, které slibují hory doly, výsledky vlastně nemají, ale stejně se prodají za miliony dolarů.

Štve vás, že dostávají peníze projekty, které nemají šanci uspět?
Já vám popíšu jednu takovou reálnou situaci. Přišli lidé s jedním projektem, měl být něco mezi Facebookem a Googlem. Zhruba třicet lidí dělalo nějakou databázi znalostí, ale chyběl tomu business plan. Měli ovšem schopné investory a prodali se do Googlu za miliony dolarů. A když se potom zeptáte, na co ty peníze využili, tak zjistíte, že koupit třicet lidí za desítky milionů dolarů není nic neobvyklého. Ty peníze se podle mě nevyužívají efektivně, ale spíš vyhazují. Ve výzkumu umělé inteligence existují období, kterým se říká „AI winter“, a ty právě přichází po dobách přehnaných slibů. Z toho mají momentálně někteří vědci obavy.

A co velcí vizionáři technologií jako je Steve Jobs nebo hodně medializovaný Elon Musk, jsou to podle vás vědci?
Tak zrovna Elon Musk podle mě vědec není, ale umí vědu dobře prodávat. Hodně straší technologiemi. Řekl, že rozvíjení umělé inteligence je jako vyvolávání démona, nebo něco takového. Což tvrdil asi půl roku předtím, než založil start up na vývoj umělé inteligence. Je těžko čitelné, co těmi výroky sleduje. Často to vypadá, že má jen rád mediální pozornost a není za nimi žádný jiný záměr. Podle mě je to jeho jediný cíl, aby byl ve zprávách. Elon Musk i Bill Gates jsou bezpochyby chytří lidé, ale jejich průpovídky o umělé inteligenci se opírají spíše o knihy, které bych označil za science fiction, než za relevantní zdroj.

Už jste prošel řadou firem, procestoval kus světa. Jak je na tom česká věda ve srovnání se ostatními zeměmi?
Máme dobré nápady a výsledky, které si však neumíme uhájit. Existuje jeden klasický nešvar mezi vědci, i mezi těmi hodně známými. Místo výzkumu se zaměříte na čtení článků a objevy svých kolegů. Pak uděláte k nim svůj sekundární výzkum a vydáte rozšíření nějakého cizího článku. A pokračujete v práci, ale odkazovat se už budete jenom na vlastní článek. Původní text tím prakticky zanikne.

To je trochu podraz, ne?
Nemám nic proti rozšiřování výsledků, ale musejí se odkazovat na zdroj, nesmí si přisvojovat výzkum jiných lidí. To je nefér. Google si například můj objev ochránil skvěle. Když jsem já v Googlu vydal Word2Vec, druhý den se o tom mluvilo v americké celostátní televizi. Pak už ten objev byl prakticky neukradnutelný. Když se něco udělá v Česku, tak jsou všichni skeptičtí a ani sami sobě navzájem nechtějí dávat kredit. Což je podle mě škoda. Jsou tady také „žabomyší“ války i mezi ústavy – třeba kdo dostane více peněz z rozpočtu. Češi více bojují mezi sebou, i když by místo toho mohli táhnout za jeden provaz a společně se v zahraničí prosadit. Nápady tady jsou, ale nakonec přijde zahraniční firma, nápad koupí, v zahraničí dodělá a s velkou parádou nám ho zase za miliony prodá. Mě osobně hodně pomohlo, že jsem odešel do zahraničí i k tomu, že jsem si svůj výzkum dokázal obhájit a nikdo mi ho nesebral. To se například stalo kolegovi Františkovi Grézlovi, který měl skvělé výsledky s neuronovými sítěmi pro rozpoznávání řeči už v roce 2007, ale poněkud zapadly. To samé pak udělali Kanaďané v roce 2010 a dnes všichni citují kanadskou práci. Díky skvělému PR. Je hrozná škoda, že lidé podcení prezentační část a neudrží si kredit za svou práci.

Takže výsledky prostě neumíme prodat.
Přesně tak.

Bude to jednou fungovat tak, že si dám do ucha nějaké sluchátko, vy budete mluvit francouzsky, já česky a budeme si rozumět?
Takové aplikace už částečně existují a spousta lidí se toho, o čem mluvíte, snaží dosáhnout. Firmy dokonce spousty let. V poslední době jsem to nezkoušel, ale výzkum pokročil hodně dopředu. Ale nesleduji to. Mě vždycky zajímal hlavně ten základní výzkum a umělá inteligence, které se momentálně věnuji naplno.

Ale fungovat to bude na vašem výzkumu, že?
Dneska všechny strojové překlady dělají pomocí neuronových sítí, které jsem v této oblasti prosadil. Samozřejmě jsem na tom ale nedělal sám, nebyl jsem jediný. Byl jsem jenom ten, kdo na něm pracoval v době, kdy skoro neexistoval. Umělé neuronové sítě jsou tady od osmdesátých let, ale to ještě nebyly výsledky.

A jak vypadá vaše „vědecké bádání a laboratorní práce“?
My většinou máme open…

avatar
2000