Oamenii Bitdefender: Florin Gogianu

0 Flares Filament.io 0 Flares ×

O nouă săptămână, un nou interviu #OameniiBD. Astăzi vorbim cu Florin, Machine Learning Researcher, ce ar prefera oricând câteva săptămâni de lucru intens în cadrul echipelor de cercetare sau de studiu pe care Juergen Schmidhuber sau Demis Hassabis le-au format, în locul unui prânz cu aceștia ori cu Nabokov sau Borges (eroii săi literari).

florin_0

1.Pentru inceput, povesteste-ne ce face un cercetator intr-o echipa de theoretical research?

Misiunea echipei este aceea de a aduna și sintetiza cercetarea din câteva sub-domenii ale învățării automate în care fiecare dintre noi s-a specializat. Sunt două scopuri pe care le urmărim cu această activitate: generarea de rezultate științifice noi în domeniile noastre și diseminarea cercetării în cadrul Bitdefender și în comunitatea de cercetare din București, prin intermediul unor proiecte comune și prezentări.

În consecință, ne petrecem mai toată ziua citind și discutând cele mai noi articole, programând și rulând experimente cu care căutăm să reproducem rezultate sau să (in)validăm unele idei.

 2. Imi poti descrie o zi obisnuita la birou?

Cred că primul lucru pe care-l face oricare dintre noi când ajunge la birou, mai ales dacă este în preajma unui termen limită pentru vreun articol sau concurs, este să verifice ce s-a întâmplat cu experimentele lăsate peste noapte (bine, recunosc, eu probabil îmi fac mai întâi o cafea pentru că nu funcționez altfel). În acest moment AI-ul este un domeniu mai degrabă experimental și asta tinde să se vadă și în activitatea noastră: muncim mult pentru a reproduce rezultatele publicate în articolele foarte recente – scriind programe, rulând experimente – și  căutăm apoi să depășim acele rezultate prin contribuții proprii. Cred că cea mai mare parte a unei zile trece astfel.

Apoi sunt întâlnirile și discuțiile dintre noi, multe în grupuri mici, de doi sau trei, în funcție de sub-domeniile din ML/AI care ne preocupă, fie pentru a discuta împreună un rezultat bazat pe o demonstrație mai tehnică, fie pentru a ne valida ideile sau pur și simplu pentru a rezolva o problemă – fie ea teoretică sau practică – căreia nu-i dăm de cap.

Deseori întâlnirile astea sunt ceva mai programatice, de exemplu ne putem propunem să parcurgem o carte de matematică sau de ML și atunci ne întâlnim periodic pentru a discuta capitolele prin care am trecut în zilele precedente.

Și mai sunt desigur și discuțiile cu întreaga echipă de cercetare (care numără în prezent șapte colegi), pentru un brain-storming pe marginea unui proiect mai mare, pentru a comenta prezentarea pe care vreunul dintre noi trebuie să o suțină la o conferință sau la grupul de lectură pe teme de Deep Learning de la Universitate, grup din care facem parte.

3.Ai absolvit filosofia la Universitatea Bucuresti. Cum se imbina activitatea academica cu ceea ce faci la job?

În perioada studiilor de filosofie m-au preocupat cu precădere probleme de teoria cunoașterii științifice, dar având o formație predominant umanistă am simțit tot timpul lipsa unei pregătiri formale într-un domeniu mai tehnic. Începând din această toamnă voi urma cursurile Universității Politehnice din București și în următorii ani mă voi concentra pe învățarea automată/ inteligență artificială. Mi-e greu să spun în ce măsură un domeniu îl va informa pe celălalt.

Însă în multe feluri am găsit la Bitdefender mediul pe care speram să-l întâlnesc la facultatea de filosofie: unul cu o cultură a performanței, cu oameni care să urmărească cu încăpățânare obținerea unor contribuții științifice în domeniul pe care-l cercetează, capabili să atragă resursele necesare pentru a face această activitate și pentru a întoarce apoi în societate aceste rezultate sub diferite forme: articole, prelegeri și discuții la conferințe, grupuri de lectură, cursuri.

4.Când ne gândim la AI/ Machine Learning, asociem conceptele cu viitorul îndepărtat sau cu operele SF. Cum sunt applicate ele in tehnologiile pe care le folosim astazi?

E o distincție care cred că merită făcută atunci când se discută despre ML/AI: cea dintre strong (sau general) și weak AI. De regulă prin filme și romane SF vedem ipostaze ale primei categorii, agenți cu capacitatea de a învăța continuu din aproape orice situație într-un mod autonom și eficient, de a transfera cunoștințele învățate dintr-un domeniu într-altul altul ajungând în cele din urmă la o performanță supra-umană în orice activitate fizică sau cognitivă.

Deși scopul declarat al multor echipe de cercetare din mediul academic sau privat este de a se apropia de acest tip de inteligență, trebuie spus că toate rezultatele din ultima perioadă cad mai degrabă în a doua categorie: cea a sistemelor care au capacitatea de a învăța dintr-un sub-set al realității și care optimizează de regulă performanța pentru o anumită abilitate restrânsă (de exemplu cea de a clasifica obiecte din imagini, de a traduce dintr-o limbă în alta etc.).

Dar chiar și așa, în ultimii cinci ani AI/ML a migrat dintr-un domeniu strict academic într-unul care  întrepătrunde aproape orice experiență digitală a fiecăruia dintre noi: aranjarea postărilor în feed-ul tău de facebook sau de twitter e făcută cu un algoritm de machine-learning, propunerile de „tăguire” ale persoanelor dintr-o poză sunt probabil realizate de o rețea convoluțională, toate serviciile de traducere ale Google, Microsoft sau Baidu sunt realizate cu rețele recurente, fiecare recomadare de articol, știre sau restaurant făcută de o aplicație sau alta probabil e realizată de un algoritm care învață din urmele tale digitale. Iar dacă ai un telefon mai nou acesta aproape sigur expune pentru dezvoltatorii de aplicații interfețe de programare pentru ML.

Dar aplicarea ML-ului nu se reduce doar la experiența noastră digitală. Sisteme de diagnoză în domeniul medical bazate pe ML încep să fie aprobate în unele țări, iar cantitatea uriașă de date generate de ieftinirea procesului de secvenționare a ADN-ului sugerează că  acești algoritmi vor avea un impact important în genetică și tratamente personalizate. În mod similar pot fi găsite exemple în transporturi, comerț, producție.

5.Cum e sa lucrezi in echipa in munca de researcher si cat de mult conteaza “chimia” in cadrul echipei?

Sunt puține domenii care se mai pretează la cercetare individuală. Cu atât mai puțin e cazul în ML, unde se publică atât de mult și unde nu poți, de unul singur, să fii la curent cu toată literatura de specialitate. Apoi e importantă validarea ideilor pe care le explorăm și mă bucur că am colegi care nu au rețineri în a le critica, în a indica presupunerile greșite și în a sugera eventuale alternative.

6.Stiu ca ai participat alaturi de Tudor (Berariu) la concursul Malmo Collaborative AI Challenge unde ati obtinut rezultate foarte bune. Cum a fost concursul pentru tine si ce ai descoperit acolo?

Am învățat de la Andrei Nica, cel de-al treilea membru al echipei, doctorand UPB, că poate are noimă să fii (și) optimist. Au fost destule momente când ne-a părut imposibil să terminăm în timp util și să dăm un algoritm performant, iar optimismul și tenacitatea lui Andrei chiar m-au făcut să-mi reevaluez felul în care abordez unele situații.

7.Cum ati abordat tema si ce v-a ajutat sa gasiti cea mai buna solutie in cadrul concursului? (Pentru cei pasionati am adaugat si linkul solutiei gasite de voi: https://github.com/village-people/flying-pig#malmo-challenge-overview.)

Am ales încă de la început să abordăm problema prin metode de învățare prin recompensă cu rețele neurale pentru că acesta este subiectul de cercetare de care ne-am ocupat toți trei în ultimul an și despre care credem că are un potențial mare în învățarea automată. Pe scurt, ce vrem este ca lăsând un program ce interacționează cu mediul primind observații (imagini) din acesta și luând acțiuni (pentru deplasare, schimbare de direcție, ridicarea de obiecte, etc.) acesta să învețe un comportament prin care să-și atingă obiectivele primind doar câte o recompensă (deci o mică cantitate de informație explicită) pe parcursul sau la finalul interacțiunilor sale cu mediul.

Mai mult, vrem ca același algoritm să poată învăța un comportament bun în orice mediu, dat fiind orice obiectiv, iar aici intervin rețelele neurale care au dat dovada unei bune capacități de extragere a factorilor relevanți pentru învățare în medii și contexte diferite. Însă antrenarea acestor modele este de multe ori destul de dificilă.

În mod interesant, dintre metodele câștigătoare a noastră a fost singura cu o abordare bazată pe rețele neurale, poate pentru că acestea pot fi destul de greu de antrenat. Cred că motivul pentru care nouă ne-a reușit a fost decizia de a efectua aproape întreaga antrenare pe un mediu programat de noi care doar aproximat dinamica mediului de concurs, dar care rula mult mai rapid și ne-a permis efectuarea mult mai multor experimente. În esență ce-am făcut a fost să producem o replică imperfectă dar mult mai rapidă a condițiilor de concurs care să faciliteze un proces de învățare mai stabil pentru modelul nostru.

Intuiția noastră a fost că metoda propusă de noi va fi suficient de generală pentru a performa bine în mediul de concurs deși a fost antrenată într-un mediu cu o dinamică diferită, dovedind astfel calități de transferabilitate și generalizare pe care ni le dorim de la astfel de algoritmi.

Această decizie, împreună cu câteva „tricks” (șmenuri?) de ordin tehnic pentru stabilizarea unor algoritmi de învățare de altfel clasici cred că ne-au permis să dăm o soluție bună.

8.Daca n-ai fi Machine Learning Researcher, ai fi…?

Presupun că oricum nu „ceea ce am crezut la terminarea liceului că o să fac”, acesta pare să fie un răspuns valabil în orice istorie contrafactuală. Altfel, sper că tot ceva care implică muncă de cercetare teoretică.

Pentru că #OameniBD au și povești personale faine, vom continua cu câteva întrebări pentru Florin – omul.

florin_1

1.Daca ai putea sa inviti pe cineva la un pranz, poate fi oricine din intreaga lume si sa fi trait in orice timpuri, care ar fi acea persoana?

Nu cred foarte mult în astfel de întâlniri, parcă niciodată nu sunt „așa cum te-ai așteptat”; sunt tot timpul prea scurte, niciodată nu apuci să întrebi tot ce aveai de întrebat. Așa că în locul unui prânz cu Juergen Schmidhuber sau Demis Hassabis (doi dintre oamenii care au mișcat cel mai mult domeniul pe care-l cercetez) ori cu Nabokov sau Borges (eroii mei literari), aș prefera oricând câteva săptămâni de lucru intens în cadrul echipelor de cercetare sau de studiu pe care aceștia le-au format.

2.Cuvintele tale preferate sunt?

Când nu este „curiozitate”, atunci probabil „consecvență”.

3.Care e cea mai frumoasa destinatie din lume in care ai fost sau ai vrea sa ajungi?

Prefer geografiile imaginare oricărei destinații: Lima lui Llosa, Antiterra lui Nabokov, Macondo-ul lui Marques, Orbis Tertius-ul lui Borges. Altfel, pentru că întrebarea ta e despre lume, mi-a plăcut mult Cambridge și cred că m-aș simți bine în orice oraș academic.

4.Ce verb te defineste?

„A cunoaște”.

5.Nu poti trai fara….? (nu se pun raspunsuri gen aer, apa :)) )

O minimă atitudine rezonabilă a celor din jurul meu.

6.Care este cea mai mare reusita a vietii tale?

Poate faptul că în anumite momente m-am desprins de domeniul în care lucram pentru a încerca lucruri complet diferite, cu tot riscul ridicolului pe care acest lucru îl presupune.

7.Daca ar fi sa castigi maine o super putere, pe care ti-ai dori sa o ai?

În copilărie mi-a plăcut mult un serial în care personajul principal avea capacitatea de a îndeplini orice rol: într-un episod putea să fie matematician, în altul filosof, critic literar, pilot sau detectiv. Toate într-o continuă căutare a propriei identități. Îmi place să cred că nu e nevoie de o super-putere pentru a face bine lucrurile care-ți provoacă curiozitatea.

8.De astazi poti face orice, oricand. Care e primul lucru de care te ocupi? Ce te preocupa prima data?

Aș verifica dacă experimentul pe care l-am lăsat azi noapte pe servere dă semne că agentul pe care l-am scris începe să învețe ceva. Apoi mi-aș face un espresso.

About Andreea

Om de comunicare, trecuta prin agentii, mi-am revendicat felia de tort ce-mi place cel mai mult: crearea de continut. Mai multe informaţii aici.

Leave a Reply

Your email address will not be published. Required fields are marked *