datenschmutz - Social Marketing, Pro-Blogging und medien.kultur.technik
 
Mobile Monday Vienna fadi3.jpg Tripwolf Sebastian Heinzel bcv08 - Barcamp Vienna 2008 web204.jpg
datenschmutz RSS Feed
873 zufriedene Leser
RSS jetzt abonnieren
Twitter
38011 Followers
auf Twitter folgen
datenschmutz Adventkalender: jeden Tag 1 Stofftier zu gewinnen!

Gesprochene Sprache durchsuchen

28.11.2006, geschrieben von , 5 Kommentare

audioclipping Gesprochene Sprache durchsuchenTextdateien las­sen sich pro­blem­los durch­su­chen und indi­zie­ren, wäh­rend Multimedia-Inhalte wie Videos und Soundfiles bloss anhand des Dateinamens und all­fäl­li­ger Metadaten auf­find­bar sind. Daran hat sich seit der Web-Steinzeit allen neuen Technologie zum Trotz nicht viel geän­dert. Doch bevor sich alle User end­gül­tig an die Textwüste gewöhnt haben, prä­sen­tiert eine kleine deut­sche Firma die Technologie für den gro­ßen Lauschangriff.

Spracherkennung stellt Algorithmen vor große Herausforderungen. Der umge­kehrte Weg, die Sprachsynthese, kommt bereits seit Jahren zum Einsatz, etwa in auto­ma­ti­sier­ten Telefon-Auskunftssystemen. Will man jedoch gespro­che­nen Text erken­nen, so muss die Software mit einem brei­ten Spektrum von ver­schie­de­nen Tonlagen, Sprechgeschwindigkeiten, ver­schie­de­nen Hintergrundgeräusch und ande­ren Paramentern umge­hen kön­nen — ganz zu schwei­gen von ver­schie­de­nen Sprachen.

Die Texterkennung von Songs gestal­tet sich äußerst schwie­rig — muss der Computer doch erst ein­mal Musik– und Stimmanteile unter­schei­den. Podcasts und Nachrichten jedoch beste­hen meis­tens vor­wie­gend aus gespro­che­nem Content, und genau hier tritt die Audioclipping-Technologie der Firma Com Vision aus Mecklenburg-Vorpommern auf den Plan. Bis zu 85% Erkennungsrate erreicht das System nach Auskunft des Herstellers:

Zwar könne der Computer auch heut­zu­tage kein druck­rei­fes Protokoll schrei­ben wie ein Stenograf, räumt Mainka ein. Selbst die moderne Software ver­stehe nur 85 Prozent der gespro­che­nen Sprache kor­rekt. Ein Kunstgriff führe aber zum rich­ti­gen Ergebnis: “Wir suchen auch nach ähnli­chen Wörtern”, erklärt der Cheftechniker. “Damit sind wir in der Lage, jede Textstelle wie­der­zu­fin­den. [Spiegel online]

Die Analyse von 60 Minuten Sprache dau­ert dabei der­zeit rund 8 Minuten. Auf Audioclipping.de indi­ziert Com Vision monat­lich rund 15.000 Radiostunden und bie­tet eine Stichwortsuche mit kos­ten­lo­ser Trefferliste. Anwendungsmöglichkeiten gibt es viele: neben PR-Heinis pro­fes­sio­nel­len Medienbeobachtern und Suchmaschinenbetreibern inter­es­sie­ren sich auch bereits Archivare und natür­lich stets von der Flut der mit­ge­schnit­te­nen Telefonate schier erschla­gene Geheimdienste. [via Ohr kauft mit]

Keine ähnli­chen Beiträge.


Bisher haben meine Lieblingsleser 5 Kommentare zu "Gesprochene Sprache durchsuchen" geschrieben.

Wie ist Ihre Meinung?
Kommentar schreiben

:frog: :frog2: :frog3: :frog5: :frog6: :dirtfrog: :frog4: :frog4o: :frog7: :artfrog: :darkfrog: :elkfrog: :frogface: :frogonleaf: :leefrog: :littlefrog: :princefrog: :coolfrog: :coolfrogjump: :mrt: :smoking666: :borg: :ninja: :satan: :saint: :elvis: :king: :pimp: :pirat: :mrdj: :elk: :cool: :geek: :weird: :mad: :sad: :-? :shock: :anonym: :angel: :kiss: :love2: :coffee2: :white2: :dog: :cat: :ccocktail: :beer: :thumbdown: :thumbup:

1 Track- und Pingbacks zu diesem Beitrag

  • O h r... k a u f t... m i t ! (14. Dezember 2006)
    Audio Google für Tonarchive (2 Kommentare) Letzter Beitrag von: datenschmutz.net » Gesprochene Sprache durchsuchen on 2006-11-28 13:23:36 Haltestelle "Menschliche Stimme" - Das Cluetrain Manifest (1 Kommentar) Letzter Beitrag von:
  • Ping me, please! Einfach /trackback/ an die URL anhängen.
?
datenschmutz.tribe
         Login | Registrieren
via RSS Feed datenschmutz RSS Feed
als Newsletter
aweber
AlbanianArabicBasqueBelarusianBulgarianCatalanChinese (Simplified)CroatianCzechDanishDutchEnglishFrenchGermanItalianPortugueseRussianSpanish
datenschmutz q+a
Stellen Sie mir Ihre Frage zu Social Marketing, Blogging und Co. — ich ant­worte dem­nächst hier am Blog.
Neueste Beiträge