Nonostante il parlato diventi sempre più uno dei modi principali in cui le persone interagiscono con i dispositivi digitali, la tecnologia vocale rimane in gran parte offlimits alle lingue dell’Africa, che ne ha più di 1000. Gli assistenti vocali più famosi al mondo, Siri, Alexa e Google Assistant, non supportano ancora nessuna lingua africana.
Common Voice, un progetto di crowdsourcing avviato dalla Mozilla Foundation nel 2017, ha affrontato questo problema invitando coloro che parlano lingue africane a donare la propria voce a un set di dati gratuito e disponibile al pubblico che ricercatori e sviluppatori possano utilizzare per addestrare app, prodotti, e servizi.
“L’idea era di diversificare la tecnologia vocale e democratizzare lo spazio attraverso un’iniziativa open source”, ha dichiarato a Chenai Chair, consulente speciale per l’innovazione in Africa presso la Fondazione Mozilla.
Finora Common Voice ha registrato più di 9.000 ore di voce in 90 lingue da tutto il mondo, di cui 3 dall’Africa: Luganda (Uganda), Kabyle (Algeria) e Kinyarwanda (Ruanda). In queste settimane ha annunciato un’espansione del progetto allo swahili, una lingua dell’Africa orientale parlata da circa 100 milioni di persone, con l’aiuto di un investimento di 3,4 milioni di dollari da parte di quattro organizzazioni.
Mozilla afferma che uno degli obiettivi principali del progetto è valutare la possibilità di sviluppare il riconoscimento vocale per le lingue delle comunità svantaggiate. La natura open source dei dati potrebbe consentire agli innovatori locali di sviluppare prodotti e servizi per le comunità emarginate.
Il set di dati Kinyarwanda, che ha 1.800 ore di voce, è già utilizzato da una startup chiamata Digital Umuganda per sviluppare un chatbot AI, Mbaza, con funzionalità di sintesi vocale che fornisce informazioni sul Covid-19. Il progetto Kinyarwanda di Common Voice è significativo ora perché c’è una spinta alla digitalizzazione dei servizi pubblici nel paese, afferma Remy Muhire, responsabile della comunità del progetto.
Sebbene l’Africa non sia un importante mercato di vendita per le aziende tecnologiche dietro i popolari assistenti vocali, come Apple, Amazon e Google, un’altra sfida è che molti dei dati vocali utilizzati per addestrare gli algoritmi di apprendimento automatico sono detenuti da poche grandi aziende, rendendo difficile ad altri lo sviluppo di tecnologie di riconoscimento vocale di alta qualità.
Ancora molto c’è da fare.