American National Standards Institute Inc.

Una delle attività più complesse da svolgere per un algoritmo di IA è quella di generare sottotitoli.

La complessità dell’algoritmo sta nelle diverse applicazioni a cui esso viene sottoposto e alla quantità di dati che deve saper elaborare in un breve lasso di tempo.

Microsoft ha detto che l’algoritmo creato è il numero uno nella generazione di sottotitoli ed è due volte più affidabile del suo predecessore.

Perchè un algoritmo di IA per i sottotitoli è uno dei più complessi?

Immaginate alla quantità di azioni che un algoritmo di IA deve riuscire a risolvere:

Riconoscere la scena, quindi gli oggetti, l’ambiente e la situazione in cui essa si svolge.

Saper descrivere anche solo un’immagine richiede di conoscere la lingua, le grammatica e avere un intento nella comunicazione.

Tutto questo deve accadere in poco tempo e, ovviamente, senza errori.

algoritmo IA sottotitoli
L’algoritmo GPT-3, ideato da OpenAI, permette di generare testi scritti interamente da un’Intelligenza Artificiale. Leggi il nostro articolo su questo algoritmo

Come tutto questo è possibile

In genere, questi tipi di modelli vengono addestrati con immagini e didascalie complete, il che rende più difficile per i modelli apprendere come interagiscono oggetti specifici.

“Questa pre-formazione del vocabolario visivo è essenzialmente l’istruzione necessaria per addestrare il sistema; stiamo cercando di educare questa memoria motoria

Le parole di Xuedong Huang, CTO per i servizi di Intelligenza Artificiale su Azure, spiegano perché questo algoritmo è capolavoro del settore.

Ecco spiegato il vantaggio dell’algoritmo nel benchmark nocaps, che si concentra sul determinare quanto bene l’intelligenza artificiale possa sottotitolare immagini mai viste.

Un risvolto sociale da sottolineare

La tecnologia deve essere accessibile, ora come non mai, a tutti, quindi anche a persone affette da disabilità.

Questo algoritmo sancisce un passo in avanti decisivo nella riduzione del gap tra disabilità e tecnologia.

Pensate ad un utente ipovedente che finalmente può fruire della descrizione di un contenuto che sta cercando in maniera semplice e veloce.

Ecco il video di presentazione dell’IA sviluppata da Microsoft.(clicca qui)

Condividi su facebook
Condividi su twitter
Condividi su linkedin
Condividi su whatsapp
Condividi su telegram
Valerio Cattedra

Valerio Cattedra

Ciao! Il mio nome è Valerio e sono un inguaribile curioso. Nella vita mi sono sempre dedicato a conoscere, per questo la mia più grande passione è scoprire nuovi luoghi e nuove tecnologie. Il mio obiettivo? Far conoscere questo stile di vita proprio a te.