Rosetta: întelegerea textului din imagini și video-uri cu ajutorul inteligenței artificiale

0
28
Publicitate Iasi

Dezvoltatorii rețelei de socializare Facebook au postat pe blogul oficial că au început să folosească inteligența artificială pentru a depista în fotografiile și video-urile postate mesajele inadecvate sau cu un conținut dăunător.

Un număr semnificativ de fotografii distribuite pe Facebook și Instagram conțin varii forme de text scris. Textul poate fi acoperit de imagine, poate fi regăsit într-un meme sau inserat într-o fotografie ca semn de circulație, în reclama unui magazin sau în meniul unui restaurant. Ținând cont de volumul imens de fotografii încărcat și distribuit pe zi pe Facebook și Instagram, de numărul de limbi utilizate, de platforma globală și de varietatea textelor, problema înțelegerii acestora este total diferită de aceea rezolvată de tradiționalul sistem de  recunoaștere optică a caracterelor (OCR). OCR-ul recunoaște caracterele, dar nu înțelege conținutul imaginilor asociate.

Pentru a răspunde acestor nevoilor specifice, Facebook a construit și dezvoltat o mașină de scară largă de învățare numită Rosetta. Rosetta extrage text din mai mult de un milion de miliarde de fotografii și video-uri publice de pe Facebook și Instagram, zilnic și în timp real, transformându-l într-un model de text recunoscut, care a fost deprins să înțeleagă conținutul textului și a imaginii împreună.

Extragerea textului dintr-o imagine se face în doi pași independenți: detectarea și recunoașterea. În prima fază se vor detecta regiunile rectangulare care conțin text. În al doilea pas se face recunoașterea, unde pentru fiecare regiune detectată se utilizează CNN (Convolutional Neural Network) pentru a recunoaște și transcrie cuvântul din regiune.

Rosetta încearcă să răspundă nevoii de control al conținutului postat prin intermediul fotografiilor și al video-urilor care incită la ură sau care promovează terorismul. Ea continuă să fie extinsă la toate limbile folosite pe Facebook și încearcă să găsească o punte între un motor sintetic și distribuția textelor și a imaginilor la nivel mondial.

LĂSAȚI UN MESAJ

Please enter your comment!
Please enter your name here