Interessiert an , Medientechnik, Bloggig und Popkultur? Dann abonnieren Sie doch einfach datenschmutz News bequem via RSS Feed oder E-Mail! Danke für Ihren Besuch und viel Spaß auf meinem Blog.

Den instruktivsten Einstiegs-Artikel zum Thema “”, den ich bislang das Vergnügen hatte zu lesen, veröffentlichte Dr. Cai Ziegler in der aktuellen Ausgabe der c’t. In Sinn oder nicht Sinn - Vom Suchen und Finden der Semantik im Web [c't - Magazin für Computertechnik. Nr. 21, 1.10.2007, Heise Verlag, S. 172-179] erklärt der Autor konzise und verständlich die Grundlagen von Tim Berners-Lee’s Entwurf eines maschinenlesbaren World Wide Web und zeigt, in welcher Relation unser geliebtes mit einer derzeit sehr akademischen Disziplin steht.

Die Problematik, die Berners-Lee mit seinem semantischen Modell zu lösen versucht, klingt zunächst trivial: Webseiten sollen maschinenlesbar werden. Das können Scripts wie der Googlebot doch schon längst, mag man einwenden. In der Tat allerdings beschränken sich die “Lesefähigkeit” von Algorithmen derzeit fast ausschließlich auf die bloße Worterfassung und statistische Verfahren: Sinnzusammenhänge bleiben den nicht-menschlichen Interpretatoren völlig verschlossen. Denn um, abstrakt gesprochen, aus einer Gruppe von Wörter sinnvolle Zusammenhänge entnehmen zu können, muss a priori bekannt sein, in welchen Beziehungen die bezeichneten Konzepte stehen. Sogenannte “Ontologien” strukturieren semantische Relationen, indem sie im wesentlichen Gruppen- und Untergruppenzugehörigkeiten definieren: eine Frau etwa ist stets ein Unterelement der Gruppe Mensch, eine Studentin wiederum Unterelement beider vorher genannter Gruppen - nicht jede Frau allerdings gehört der Gruppe Studentin an. Durch ausgefeilte Relationssysteme werden Algorithmen in die Lage versetzt, nicht bloß Häufigkeitsanalysen zu betreiben, sondern dem, was wir menschlichen Leser unter “Sinngehalt” eines Textes verstehen, ein ganzes Stück näher zu kommen.

Die beschriebenen Gruppenrelationen reichen allerdings längst nicht aus: transaktionale Parameter erweitern den Beziehungsfundus und machen jene Medien, die schon längst als Computerdateien und ASCII-Codes auf Festplatten liegen, wesentlich besser “verständlich”. Resultieren könnten daraus wesentlich effektivere Suchmöglichkeiten sowie bislang ungekannte automatische Recherche- und Aggregationsfähigkeiten. Obgleich seit Jahren diverse Beschreibungsstandards existieren, konnten sich semantische Modelle in der Praxis aber bislang nicht breitenwirksam durchsetzen: was sich in der machbar anhört, artet dank der Komplexität von Welt und Sprache schnell in Sisyphusarbeit aus: selbst die Erfassung einer abgeschlossenen “Domäne” wie Arbeitswelt stößt auf zahlreiche Probleme, ganz zu schweigen von der Fluidität und Veränderbarkeit unserer Sprache.

Spannenderweise führt in jenem Konglomerat aus Techniken und Use-Cases, das uns gemeinhin als bekannt ist, exakt die gegenteiligen Strategien zu derzeit wesentlich mehr praktischem Erfolg: anstatt zuerst eine vollständige Ontologie zu erstellen, taggen (=beschlagworten) die Benutzer von Services wie FlickR oder del.icio.us, größter Online-Bookmark-Verwalter der Welt, erst einmal fröhlich drauf los. Aus der schieren Zahl der Anwender kristallisieren sich relevante Kategorien heraus: allen Ungenauigkeiten und Missverständnissen wie etwa verschiedenen Schreibweisen zum Trotz haben sich solche kollektiven Beschlagwortungssysteme als eine der “Killerapplikationen” des neuen Netzes erwiesen. Dr. Ziegler schreibt dazu in dem eingangs zitierten Artikel über die Zukunft des :

Unverhoffte Schützenhilfe mag hierbei vom kommen. Dabei unterscheidet sich dessen Tao zunächst nahezu diametral von dem des Semantischen Webs: Das “Mitmach-Web” rückt den Menschen in den Vordergrund, sein semantischer Konterpart hingegen die Maschine.
Den Anknüpfungspunkt zwischen den beiden stellen Folksonomies dar, ein Eckpfeiler des . Diese sind das Produkt eines als Social bekannten Prozesses: User klicken sich durch das Web und annotieren dabei Webseiten, Blogs und andere Medienobjekte, die sie besonders gerne mögen. Solche textuellen, lesezeichenähnlichen Annotationen sind völlig willkürlich und entbehren der normativen Starrheit einer Ontologie.
Doch gilt im der Leitspruch “Klasse durch Masse”: Dank der Vielzahl taggender Surfer kristallisieren sich schnell die gängigsten Bezeichner für ein Medienobjekt heraus, was der Einigung auf einen eindeutigen Identifikator schon sehr nahe kommt. Struktur entsteht im Mitmach-Web also von unten (bottom-up), nicht top-down wie im Semantischen Web.

Etliche Trendforscher prognostizieren mit Horx’scher Gewissheit die “Ankunft eines neuen Informations-Heilands” in Form einer Verschmelzung der Graswurzel-Strategien des mit seinem akademischen Counterpart - zu einem neuen, gloriosen Informations-Bastard namens Web 3.0. Man vermeint sofort Großvater Hegel aus dem feuchten Grabe uns Bewohnern des 3. Jahrtausend christlicher Zeitrechnung “These, Antithese!” nachhusten zu hören… was dann allerdings in der dialektischen Logik die Antithese zu Web 3.0 wäre, wird wohl in 10 Jahren eine neue Generation von Semblos (Semantic Bloggers) faszinieren.


Kommentare zu "Web 3.0 = Semantik + Folksonomy?":

 


Kommentar verfassen






Dieses Blog erlaubt Keywords als Backlinks. Wenn Sie ins Namensfeld username@keyword eingeben, so wird Ihr Keyword anstatt des Usernamens verlinkt. [ia KeywordLuv]


Bei Antworten am laufenden bleiben: klicken Sie die Checkbox an, um via E-Mail über weitere Antworten informiert zu werden..
Erlaubte XHTML-Tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>
verzögerte Veröffentlichung von Beiträgen: Möglicherweise erscheint Ihr Beitrag aufgrund eines unberechtigen Spamverdachts nicht sofort. Er wird später manuell moderiert und freigegeben - ich bitte um ein wenig Geduld.
Werbliche Einträge und Spam-Kommentare sind zu unterlassen. Wenn Sie auf meinem Blog werben möchten, so können Sie mich bezüglich Bannereinschaltungen direkt kontaktieren.