datenschmutz - Social Marketing, Pro-Blogging und medien.kultur.technik
G1 Android Phone Barcamp Vienna 2009 Shoe-Gallery Meral Akin Hecke, digitalks, und Dr. Gerhard Laga, Organisator des eDay DJ Spooky Rodney Hunter
datenschmutz RSS Feed
3,582 zufriedene Leser
RSS jetzt abonnieren
Twitter
48,598 Followers
auf Twitter folgen

Gesprochene Sprache durchsuchen

audioclipping betaTextdateien lassen sich problemlos durchsuchen und indizieren, während Multimedia-Inhalte wie Videos und Soundfiles bloss anhand des Dateinamens und allfälliger Metadaten auffindbar sind. Daran hat sich seit der Web-Steinzeit allen neuen Technologie zum Trotz nicht viel geändert. Doch bevor sich alle User endgültig an die Textwüste gewöhnt haben, präsentiert eine kleine deutsche Firma die Technologie für den großen Lauschangriff.

Spracherkennung stellt Algorithmen vor große Herausforderungen. Der umgekehrte Weg, die Sprachsynthese, kommt bereits seit Jahren zum Einsatz, etwa in automatisierten Telefon-Auskunftssystemen. Will man jedoch gesprochenen Text erkennen, so muss die Software mit einem breiten Spektrum von verschiedenen Tonlagen, Sprechgeschwindigkeiten, verschiedenen Hintergrundgeräusch und anderen Paramentern umgehen können - ganz zu schweigen von verschiedenen Sprachen.

Die Texterkennung von Songs gestaltet sich äußerst schwierig - muss der Computer doch erst einmal Musik- und Stimmanteile unterscheiden. Podcasts und Nachrichten jedoch bestehen meistens vorwiegend aus gesprochenem Content, und genau hier tritt die Audioclipping-Technologie der Firma Com Vision aus Mecklenburg-Vorpommern auf den Plan. Bis zu 85% Erkennungsrate erreicht das System nach Auskunft des Herstellers:

Zwar könne der Computer auch heutzutage kein druckreifes Protokoll schreiben wie ein Stenograf, räumt Mainka ein. Selbst die moderne Software verstehe nur 85 Prozent der gesprochenen Sprache korrekt. Ein Kunstgriff führe aber zum richtigen Ergebnis: "Wir suchen auch nach ähnlichen Wörtern", erklärt der Cheftechniker. "Damit sind wir in der Lage, jede Textstelle wiederzufinden. [Spiegel online]

Die Analyse von 60 Minuten Sprache dauert dabei derzeit rund 8 Minuten. Auf Audioclipping.de indiziert Com Vision monatlich rund 15.000 Radiostunden und bietet eine Stichwortsuche mit kostenloser Trefferliste. Anwendungsmöglichkeiten gibt es viele: neben PR-Heinis professionellen Medienbeobachtern und Suchmaschinenbetreibern interessieren sich auch bereits Archivare und natürlich stets von der Flut der mitgeschnittenen Telefonate schier erschlagene Geheimdienste. [via Ohr kauft mit]

 

5 Kommentare zu „Gesprochene Sprache durchsuchen“

Kommentieren

:frog: :frog2: :frog3: :frog5: :frog6: :frog4: :frog7: :white: :mrt: :smoking666: :borg: :ninja: :satan: :saint: :elvis: :king: :pimp: :pirat: :mrdj: :elk: :cool: :geek: :weird: :mad: :sad: :-? :shock: :anonym: :poke: :angel: :kiss: :love2: :coffee2: :white2: :dog: :cat: :ccocktail: :beer: :thumbdown: :thumbup:

1 Track- und Pingbacks zu diesem Beitrag

  • O h r... k a u f t... m i t ! (14. Dezember 2006)
    Audio Google für Tonarchive (2 Kommentare) Letzter Beitrag von: datenschmutz.net » Gesprochene Sprache durchsuchen on 2006-11-28 13:23:36 Haltestelle "Menschliche Stimme" - Das Cluetrain Manifest (1 Kommentar) Letzter Beitrag von:
  • Ping me, please! Einfach /trackback/ an die URL anhängen.
?
datenschmutz.tribe
         Login | Registrieren
Updates via E-mail abonnieren:
Updates via E-mail abonnieren:
Email:  
Name:  
aweber
datenschmutz Kommentarfeed (RSS) Lifestream - Ritchie im Social Web
Stellen Sie mir eine Frage?
Partner
DasDenkfabrik.at
Roboform - your ultimate password and identity manager
Werbung auf datenschmutz buchen
PrettyLinkPro - the perfect URL shortener for WordPress
Neueste Beiträge