di Roberto Mancin – E’ normale oggi parlare con una macchina. Diamo ordini a telefoni, computer, automobili, televisori e robot usando un linguaggio sempre più vario e complesso. I sistemi di riconoscimento vocale funzionano ormai con qualsiasi voce (adulto raffreddato, bambino…) e le tecnologie “touchless” stanno rendendo inutile toccare cavi, microfoni, pulsanti e oggetti contaminati; è importante però, nel caso della voce, usare un buon microfono ambientale in una stanza silenziosa; questo purtroppo non sempre è possibile e, quando il rumore di fondo rende mediocre il riconoscimento e l’interpretazione dei comandi vocali, diventa necessario leggere il labiale (visual speech recognition). Purtroppo la natura della labiolettura è intrinsecamente ambigua: diversi movimenti delle labbra, apparentemente identici, possono produrre diverse parole, rendendo estremamente difficile riconoscere automaticamente il parlato.
Per una macchina, per un software, vedere solamente le labbra di chi parla, ma non poter elaborare anche la voce non è sufficiente, però è utile; la somma delle due tecnologie (vocal & visual speech recognition) permette la realizzazione di sistemi estremamente “abili e intelligenti” (cfr 29 novembre 2019 – Ya Zhao et all “Hearing Lips: Improving Lip Reading by Distilling Speech Recognizers“.
Funziona così anche l’uomo da almeno 200.000 anni ovvero da quando apparvero le prime forme di Homo Sapiens (Paleolitico medio); per comunicare, infatti, è importante non solo sentire i suoni ma anche leggere gli occhi, le labbra, la postura dell’interlocutore.
Le labbra però vengono da qualche settimana nascoste da mascherine opache, anche da chi parla e la labiolettura, necessaria per ascoltare, sta diventando impossibile. Fino a poco fa le riunioni di lavoro avvenivano fra colleghi connessi da una stanza silenziosa o dall’ufficio attraverso una connessione telematica (smart work); eravamo soli, senza mascherina, ma estremamente inclusivi. Attualmente invece è obbligatorio usare la mascherina anche in ufficio ed è diventato impossibile vedere le labbra di chi parla. Anche negli studi televisivi, oppure durante consigli comunali trasmessi in diretta streaming è sempre più frequente vedere persone nascondere le labbra con una mascherina. Disastro!
C’è però una soluzione sostenibile, inclusiva ed economica: anche l’Università di Padova, assai attenta alla tematica “inclusione delle persone con disabilità”, ha messo a disposizione del personale docente, tecnico e amministrativo centinaia e presto migliaia di mascherine, omologate CE, con una finestrella trasparente in poliuretano lavabili almeno 30 volte. Tali mascherine, dette “inclusive” verranno date a tutte le strutture in cui lavora qualcuno con esigenze uditive speciali e la speranza è quella di poter presto estendere a tutto l’Ateneo (più di 4000 dipendenti tra personale docente, tecnico e amministrativo) tale soluzione. E’ chiaro infatti che in un contesto inclusivo si cerca di facilitare la labiolettura permettendo alle persone che ascoltano di vedere le labbra di chi parla.
L’AUTORE
Roberto Mancin: informatico pediatrico, laureato in informatica e specializzato in “inclusione e innovazione sociale”; cofondatore del centro d’ateneo patavino per la disabilità; grazie a numerosi incarichi di docenza di Informatica Medica, non ha mai smesso di fare didattica e ricerca nell’ambito della Robotica Sociale e delle Tecnologie per l’Inclusione. Nel blog più volte si è occupato di neuro-robotica e di tecnologie per l’inclusione:
13/3/2018:
www.beppegrillo.it/andare-a-scuola-con-la-mente-da-un-letto-in-ospedale/
7/12/2018:
www.beppegrillo.it/robot-beyond-humanity/
21/10/2019:
www.beppegrillo.it/il-primo-robot-controllato-dai-bambini-con-il-pensiero-e-italiano/
12/12/2019:
www.beppegrillo.it/ho-visto-cose-che-voi-umani-sani/