,

Gesprochene Sprache durchsuchen

audioclipping betaTextdateien lassen sich problemlos durchsuchen und indizieren, während Multimedia-Inhalte wie Videos und Soundfiles bloss anhand des Dateinamens und allfälliger Metadaten auffindbar sind. Daran hat sich seit der Web-Steinzeit allen neuen Technologie zum Trotz nicht viel geändert. Doch bevor sich alle User endgültig an die Textwüste gewöhnt haben, präsentiert eine kleine deutsche Firma die Technologie für den großen Lauschangriff.

Spracherkennung stellt Algorithmen vor große Herausforderungen. Der umgekehrte Weg, die Sprachsynthese, kommt bereits seit Jahren zum Einsatz, etwa in automatisierten Telefon-Auskunftssystemen. Will man jedoch gesprochenen Text erkennen, so muss die Software mit einem breiten Spektrum von verschiedenen Tonlagen, Sprechgeschwindigkeiten, verschiedenen Hintergrundgeräusch und anderen Paramentern umgehen können – ganz zu schweigen von verschiedenen Sprachen.

Die Texterkennung von Songs gestaltet sich äußerst schwierig – muss der Computer doch erst einmal Musik- und Stimmanteile unterscheiden. Podcasts und Nachrichten jedoch bestehen meistens vorwiegend aus gesprochenem Content, und genau hier tritt die Audioclipping-Technologie der Firma Com Vision aus Mecklenburg-Vorpommern auf den Plan. Bis zu 85% Erkennungsrate erreicht das System nach Auskunft des Herstellers:

Zwar könne der Computer auch heutzutage kein druckreifes Protokoll schreiben wie ein Stenograf, räumt Mainka ein. Selbst die moderne Software verstehe nur 85 Prozent der gesprochenen Sprache korrekt. Ein Kunstgriff führe aber zum richtigen Ergebnis: „Wir suchen auch nach ähnlichen Wörtern“, erklärt der Cheftechniker. „Damit sind wir in der Lage, jede Textstelle wiederzufinden. [Spiegel online]

Die Analyse von 60 Minuten Sprache dauert dabei derzeit rund 8 Minuten. Auf Audioclipping.de indiziert Com Vision monatlich rund 15.000 Radiostunden und bietet eine Stichwortsuche mit kostenloser Trefferliste. Anwendungsmöglichkeiten gibt es viele: neben PR-Heinis professionellen Medienbeobachtern und Suchmaschinenbetreibern interessieren sich auch bereits Archivare und natürlich stets von der Flut der mitgeschnittenen Telefonate schier erschlagene Geheimdienste. [via Ohr kauft mit]

5 comments
ritchie
ritchie

Muss ich mir gleich mal anschauen... solche Suchmaschinen wären ja eine echter Segen, um den Überblick in der Masse der vielen Podcasts zu behalten.

elka
elka

www.spactor.com neue Suchmaschine die in Echt-Zeit die Inhalte von Radio und TV durchsucht. Funktioniert super, sehr empfehlenswert.

ritchie
ritchie

Sehr interessant imho, Audio und Videos zu digitalisieren. Mit den kurzen Snippets halt nur begrenztem praktischen Wert - zeigt aber durchaus, wie gut sowas schon funktionieren kann.

Frank Hubner
Frank Hubner

Auch nicht schlecht: www.spactor.com Dort geht es nicht nur um Sprache, sondern auch um Videos. Sehr spannend!

Trackbacks

  1. Audio Google für Tonarchive (2 Kommentare) Letzter Beitrag von: datenschmutz.net » Gesprochene Sprache durchsuchen on 2006-11-28 13:23:36 Haltestelle „Menschliche Stimme“ – Das Cluetrain Manifest (1 Kommentar) Letzter Beitrag von: