Présentation
Méthodes de rehaussement de la parole basée sur de l’intelligence artificielle en temps réel pour l’amélioration de l’appareillage auditif
Les personnes souffrant de Troubles du Spectre de la Neuropathie Auditive (TSNA) représentant 1 à 10 % des adultes atteints de pertes auditives. Elles ne bénéficient peu ou pas des aides auditives actuelles. Les TSNA constituent un continuum de déficiences auditives dues à un dysfonctionnement synaptique ou neuronal dans les parties périphériques et centrales des voies auditives. Contrairement aux pertes auditives conventionnelles, les TSNA altèrent le traitement de l’information temporelle sans nécessairement affecter la sensibilité auditive. Les indices temporels sont essentiels, non seulement pour intégrer des informations liées à la parole dans différentes bandes de fréquences, mais aussi pour séparer les sources dans des situations de type « cocktail party » avec des sources de parole concurrentes distribuées dans l’espace. Ainsi, le principal besoin des sujets TSNA, partagé par les sujets vieillissants qui éprouvent des difficultés de traitement auditif central, n’est pas de restaurer l’audibilité mais d’améliorer leur perception de la parole, en particulier dans les environnements bruyants, en compensant la détérioration des indices acoustiques qui reposent sur la précision temporelle. Les aides auditives conventionnelles reposent principalement sur l’amplification du son et se concentrent sur le rehaussement spectral pour améliorer l’analyse de la parole.
Pour améliorer la détection des caractéristiques temporelles fines du son, trois stratégies possibles émergent :
- La détérioration de l’information temporelle empêche ces sujets de regrouper correctement les éléments qui appartiennent à une même source de parole et de les séparer des autres sources, y compris le bruit. Il est nécessaire de trouver des méthodes de séparation et de débruitage des sources pour le traitement des sources de bruit autres que celles ayant des caractéristiques spectrales ou temporelles simplistes, comme c’est le cas actuellement.
- Dans les TSNA, les distorsions supraliminaires couvrent un large spectre de conséquences perceptives néfastes affectant l’intensité sonore, le suivi de la hauteur et du rythme, la localisation de la source sonore, de différentes manières d’une oreille à l’autre. La stratégie d’aide auditive qui s’ensuit nécessite des méthodes de débruitage pour un apprentissage rapide des besoins d’un sujet donné, en fonction de l’endroit où il utilise ses aides auditives et de la déficience spécifique qu’il éprouve.
- Les personnes malentendantes ont développé des stratégies alternatives pour utiliser des indices temporels saillants : beaucoup d’entre elles, par exemple, peuvent exploiter des indices multisensoriels (spatiaux, visuels et tactiles) pour compléter les informations auditives déformées. Ce processus a été mis en évidence par la crise sanitaire actuelle qui a été préjudiciable aux personnes malentendantes parce que l’utilisation de masques chirurgicaux a non seulement dégradé le signal de la parole, mais a également empêché la lecture labiale, particulièrement utile pour les personnes atteintes de TSNA. De tels indices multisensoriels sont mal pris en compte dans les stratégies actuelles d’aides auditives.
Comment mettre en œuvre ces stratégies ? Le développement en plein essor de l’intelligence artificielle (IA) au cours de la dernière décennie fait de cette technologie un candidat idéal pour atteindre cet objectif. L’IA fait référence à la simulation de l’intelligence humaine dans des machines programmées pour penser et agir comme des humains : c’est une façon d’imiter le comportement du cerveau avec un ordinateur. Selon H.A. Simon, l’un des pionniers du domaine, l’IA est le « domaine d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés ». Bien que les toutes premières études remontent à la fin des années 50, ce n’est que depuis 2012 que l’IA a connu une croissance exponentielle, en particulier avec les applications de reconnaissance et de classification d’images. Sur la base des premiers travaux de Yann LeCun sur les réseaux de neurones convolutifs en 1998, un grand nombre d’études a appliqué divers types de réseaux de neurones profonds dans plusieurs domaines d’application, allant de l’analyse d’images au traitement du langage naturel pour un nombre croissant de domaines d’application de la finance aux médias sociaux, en passant par la maintenance prédictive, la santé, etc. Plusieurs outils logiciels de développement de l’IA sont maintenant accessibles au public, soutenus par de grandes entreprises internationales (Google, Facebook, Microsoft), et de plus en plus d’industries appliquent l’IA dans leurs processus. Cependant, toutes les pathologies ne sont pas traitées de manière égale par ces dispositifs. En particulier, les TSNA ne sont pas bien pris en compte.
OBJECTIFS
L’objectif principal de l’étude REFINED est d’identifier les méthodes de rehaussement de la parole, issues de l’intelligence artificielle et compatibles avec un équipement portatif d’aide auditive, qui sont les plus adaptées aux participants TSNA. Ces méthodes seront implémentées au préalable (c’est-à-dire en dehors des visites) sur des scènes sonores qui seront ensuite diffusées au participant à l’aide d’un casque.
Si vous souhaitez participer ou si vous avez des questions sur l’étude : ceriah-refined@pasteur.fr
Cette page est destinée aux participants des études, afin d’y retrouver :
- la notice d’information (incluant la protection des données à caractère personnel) et l’affiche de REFINED
- la synthèse des résultats des études auxquelles ils ont participé
- Les nouvelles recherches utilisant les échantillons et données des participants à l’étude REFINED
- dernière actualisation : 15/02/2023
Résultats de l’étude REFINED et documents d’information des nouvelles recherches :
non applicable à ce jour