Ignorer et passer au contenu

Casques AI : Révolutionner l'Annulation de Bruit et le Ciblage de la Parole

28 May 2024

Casques AI : Révolutionner l'Annulation de Bruit et le Ciblage de la Parole

Des chercheurs de l'Université de Washington ont mis au point des casques révolutionnaires alimentés par l'IA, permettant aux utilisateurs d'isoler et de se concentrer sur un seul interlocuteur dans des environnements bruyants. En regardant simplement l'interlocuteur pendant trois à cinq secondes, le système, connu sous le nom de "Target Speech Hearing", enregistre la voix de l'interlocuteur et filtre tous les autres sons. Cette technologie innovante, présentée à la conférence ACM CHI, promet des applications dans les aides auditives et les écouteurs, améliorant considérablement les expériences auditives dans des contextes difficiles.

Ce système exploite l'IA pour personnaliser la perception auditive selon les préférences de l'utilisateur. Lorsqu'il est activé, le casque utilise des microphones intégrés pour capturer la voix de l'interlocuteur souhaité, qui est ensuite traitée par un ordinateur embarqué. Au fur et à mesure que l'utilisateur se déplace, l'IA affine continuellement sa compréhension des motifs vocaux de l'interlocuteur, maintenant la clarté même en présence de bruit de fond. Ce projet, financé par plusieurs subventions, représente une avancée significative dans la technologie auditive personnalisée.

Les tests initiaux avec 21 sujets ont montré que la clarté de la voix de l'interlocuteur enregistré était évaluée comme étant presque deux fois plus claire que l'audio non filtré. L'équipe vise à développer davantage cette technologie, en élargissant ses capacités pour enregistrer plusieurs interlocuteurs et en améliorant sa fonctionnalité dans divers environnements. Le code de preuve de concept est disponible pour la recherche et le développement futurs.

Les futures itérations de cette technologie pourraient révolutionner la communication personnelle et professionnelle, en particulier dans des environnements bruyants tels que les rues animées, les événements bondés ou les lieux de travail. À mesure que la technologie progresse, elle pourrait devenir une fonctionnalité standard dans les dispositifs audio grand public, améliorant l'accessibilité et la commodité pour les utilisateurs du monde entier.

Pour plus de détails, visitez UW News.

Source

Les plus populaires

Toutes les recommandations
Cursor
Underlord par Descript
€0,00
€0,00
Eleven Labs
€0,00
€0,00
Looka
€0,00
€0,00
Murf AI
€0,00
€0,00
AdCreative.ai
€0,00
€0,00
Photo AI
€0,00
€0,00
Reply.io
€0,00
€0,00
MagicSlides
€0,00
€0,00
Pika Labs
€0,00
€0,00
LogoAI
€0,00
€0,00
Deepbrain AI
€0,00
€0,00
Mixo
€0,00
€0,00
FineShare FineCam
€0,00
€0,00
Taplio
€0,00
€0,00
Article Fiesta
€0,00
€0,00
Descript
€0,00
€0,00
AI Lawyer
€0,00
€0,00
Humata AI
€0,00
€0,00
Ask Your PDF
€0,00
€0,00
Audioread.com
€0,00
€0,00

Merci de votre inscription

Cet e-mail a été enregistré !

Shop the look

Choose Options

Edit Option
Back In Stock Notification
this is just a warning
Connexion