In occasione del Global Accessibility Awareness Day che ricorre oggi, 19 maggio, Xiaomi presenta il progetto sostenibile “Own My Voice”. Attraverso l’applicazione di algoritmi avanzati e della tecnologia vocale dai toni naturali Text-to-Speech, sviluppata internamente da Xiaomi AI Lab, il leader della tecnologia mette a disposizione degli utenti affetti da disturbi del linguaggio voci uniche e personalizzate.
In questo modo, gli utenti con difficoltà vocali hanno la possibilità di comunicare con gli altri usando una voce ‘personalizzata’, invece di quella elettronica standardizzata e dai toni monotoni a cui erano abituati. Il progetto “Own My Voice”, guidato dal Comitato Tecnico di Xiaomi nell’ambito della ricerca “Tech For Good”, sottolinea l’impegno dell’azienda a migliorare la vita di tutti nel mondo grazie alle proprie tecnologie innovative.
Xiaomi si prende cura delle persone e si impegna a soddisfare le loro esigenze mettendo a disposizione di tutti la propria tecnologia innovativa. Il progetto “Own My Voice” incontra l’esigenza di molti utenti affetti da disturbi del linguaggio di utilizzare la propria voce per la comunicazione quotidiana.
“Siamo entusiasti di sperimentare l’innovazione tecnologica e portare i suoi vantaggi nella vita delle persone. Poter soddisfare le richieste di ogni utente, per come è nella propria sfera personale, è una responsabilità davvero importante” – dichiara Zhu Xi, coordinatore del comitato tecnologico Tech for Good di Xiaomi.
Per poter generare la voce più adatta e personalizzata per ciascuno, il team del progetto ha reclutato più di 200 volontari per “donare” la propria voce. In questa fase, è stato utilizzato l’algoritmo di corrispondenza dell’impronta vocale per abbinare le caratteristiche delle voci dei volontari con quelle delle voci dell’utente. Con questa tecnica, è stato possibile identificare la voce più adatta ed utilizzarla come suono di riferimento vocale per ciascun destinatario. Per una corretta tutela della privacy del donatore, la voce reale scelta è stata in seguito manipolata con complesse modifiche acustiche per elaborare un suono nuovo e originale.
Successivamente, è stata utilizzata la tecnologia Text-To-Speech basata sull’intelligenza artificiale che ha permesso alla nuova voce di acquisire gradualmente un ritmo e un’intonazione spontanei in grado di esprimere fedelmente l’emozione e il tono di un essere umano. Il progetto “Own My Voice” combina una varietà di algoritmi avanzati con la tecnologia vocale sviluppata da Xiaomi per garantire la personalizzazione, la sicurezza e un’elevata spontaneità della voce sintetizzata, creando così un nuovo punto di riferimento nell’ambito della sintesi vocale personalizzata per gli utenti affetti da disturbi del linguaggio.
L’anima del progetto è un gruppo di esperti di tecnologia vocale di Xiaomi AI Lab, che, dal 2017, hanno pubblicato ben 37 articoli sul tema partecipando alle principali conferenze internazionali, come l’International Conference on Acoustics, Speech and Signal Processing. Il successo di “Own My Voice” è il risultato dell’applicazione della tecnologia proprietaria Text-To-Speech, chesimula essenzialmente la voce di un vero essere umano nelle sue caratteristiche primarie, come intonazione, pause, velocità e molto altro, sostituendo così quella sensazione monotona e innaturale della voce elettronica con una più naturale.
Attualmente, questa tecnologia si applica a molti dispositivi intelligenti dotati di Xiaoai, l’assistente vocale AI di Xiaomi. Il progetto “Own My Voice” è la chiara dimostrazione di come la tecnologia Text-To-Speech può essere anche ampiamente adottata in ambito di accessibilità e capace di migliorare l’esperienza dell’utente.
“Se sappiamo ascoltare e soddisfare velocemente le esigenze particolari di piccoli gruppi di persone, la tecnologia con i suoi vantaggi sarà in grado di diffondersi più rapidamente, raggiungendo tutte le persone che ne hanno bisogno” conclude Zhu Xi, coordinatore del comitato tecnologico Tech for Good di Xiaomi.
In futuro, Xiaomi sarà a supporto dei beneficiari della tecnologia vocale e studierà ulteriormente l’applicabilità di questo progetto a una più ampia gamma di persone. L’azienda continuerà, inoltre, a potenziare l’accessibilità tramite soluzioni all’avanguardia, impegnandosi costantemente nel soddisfare le diverse esigenze delle persone attraverso l’innovazione tecnologica.