Forscher der University of Washington haben ein KI-basiertes Headset entwickelt, das es ermöglicht, gezielt einer Person in einer Menschenmenge zuzuhören.
Das neue Headset, vorgestellt in der Studie „Look Once to Hear: Target Speech Hearing with Noisy Examples“ und veröffentlicht in den Proceedings of the CHI Conference on Human Factors in Computing Systems, nutzt ein innovatives System namens Target Speech Hearing (TSH). Dieses System ermöglicht es dem Träger, die Stimme einer ausgewählten Person zu registrieren und alle anderen Umgebungsgeräusche auszublenden.
Shyam Gollakota, Professor an der Paul G. Allen School of Computer Science & Engineering, erklärt: „Mit unseren Geräten kann man nun einen einzelnen Sprecher klar und deutlich hören, auch wenn man sich in einer lauten Umgebung befindet, in der viele andere Menschen sprechen.“
Die Funktionsweise des Headsets ist bemerkenswert einfach und effektiv. Der Nutzer richtet seinen Kopf auf die sprechende Person aus und drückt einen Knopf. Das System erfasst die Schallwellen der Stimme, die die Mikrofone auf beiden Seiten des Headsets erreichen, und analysiert diese mittels maschinellen Lernens. Innerhalb von drei bis fünf Sekunden ist die Stimme registriert und das System blendet alle anderen Geräusche aus.
Das Headset wurde bereits mit 21 Probanden getestet und die Ergebnisse sind vielversprechend. Die Klarheit der registrierten Stimmen war durchschnittlich doppelt so gut wie bei ungefilterten Audiodaten. Trotz einiger noch bestehender Herausforderungen, wie die Registrierung eines einzigen Sprechers und mögliche Störungen durch laute Stimmen aus derselben Richtung, bietet das System erhebliche Vorteile.
Das Forschungsteam plant, diese Technologie weiterzuentwickeln und auf Hörgeräte anzuwenden. Dies könnte insbesondere Menschen mit Hörbeeinträchtigungen helfen, gezielter einzelnen Sprechern zu folgen und ihre Lebensqualität erheblich zu verbessern.