,

Web 3.0 = Semantik + Folksonomy?

Den instruktivsten Einstiegs-Artikel zum Thema „Semantic Web“, den ich bislang das Vergnügen hatte zu lesen, veröffentlichte Dr. Cai Ziegler in der aktuellen Ausgabe der c’t. In Sinn oder nicht Sinn – Vom Suchen und Finden der Semantik im Web [c’t – Magazin für Computertechnik. Nr. 21, 1.10.2007, Heise Verlag, S. 172-179] erklärt der Autor konzise und verständlich die Grundlagen von Tim Berners-Lee’s Entwurf eines maschinenlesbaren World Wide Web und zeigt, in welcher Relation unser geliebtes Web 2.0 mit einer derzeit sehr akademischen Disziplin steht.

Die Problematik, die Berners-Lee mit seinem semantischen Modell zu lösen versucht, klingt zunächst trivial: Webseiten sollen maschinenlesbar werden. Das können Scripts wie der Googlebot doch schon längst, mag man einwenden. In der Tat allerdings beschränken sich die „Lesefähigkeit“ von Algorithmen derzeit fast ausschließlich auf die bloße Worterfassung und statistische Verfahren: Sinnzusammenhänge bleiben den nicht-menschlichen Interpretatoren völlig verschlossen. Denn um, abstrakt gesprochen, aus einer Gruppe von Wörter sinnvolle Zusammenhänge entnehmen zu können, muss a priori bekannt sein, in welchen Beziehungen die bezeichneten Konzepte stehen. Sogenannte „Ontologien“ strukturieren semantische Relationen, indem sie im wesentlichen Gruppen- und Untergruppenzugehörigkeiten definieren: eine Frau etwa ist stets ein Unterelement der Gruppe Mensch, eine Studentin wiederum Unterelement beider vorher genannter Gruppen – nicht jede Frau allerdings gehört der Gruppe Studentin an. Durch ausgefeilte Relationssysteme werden Algorithmen in die Lage versetzt, nicht bloß Häufigkeitsanalysen zu betreiben, sondern dem, was wir menschlichen Leser unter „Sinngehalt“ eines Textes verstehen, ein ganzes Stück näher zu kommen.

Die beschriebenen Gruppenrelationen reichen allerdings längst nicht aus: transaktionale Parameter erweitern den Beziehungsfundus und machen jene Medien, die schon längst als Computerdateien und ASCII-Codes auf Festplatten liegen, wesentlich besser „verständlich“. Resultieren könnten daraus wesentlich effektivere Suchmöglichkeiten sowie bislang ungekannte automatische Recherche- und Aggregationsfähigkeiten. Obgleich seit Jahren diverse Beschreibungsstandards existieren, konnten sich semantische Modelle in der Praxis aber bislang nicht breitenwirksam durchsetzen: was sich in der Theorie machbar anhört, artet dank der Komplexität von Welt und Sprache schnell in Sisyphusarbeit aus: selbst die Erfassung einer abgeschlossenen „Domäne“ wie Arbeitswelt stößt auf zahlreiche Probleme, ganz zu schweigen von der Fluidität und Veränderbarkeit unserer Sprache.

Spannenderweise führt in jenem Konglomerat aus Techniken und Use-Cases, das uns gemeinhin als Web 2.0 bekannt ist, exakt die gegenteiligen Strategien zu derzeit wesentlich mehr praktischem Erfolg: anstatt zuerst eine vollständige Ontologie zu erstellen, taggen (=beschlagworten) die Benutzer von Social Media Services wie FlickR oder del.icio.us, größter Online-Bookmark-Verwalter der Welt, erst einmal fröhlich drauf los. Aus der schieren Zahl der Anwender kristallisieren sich relevante Kategorien heraus: allen Ungenauigkeiten und Missverständnissen wie etwa verschiedenen Schreibweisen zum Trotz haben sich solche kollektiven Beschlagwortungssysteme als eine der „Killerapplikationen“ des neuen Netzes erwiesen. Dr. Ziegler schreibt dazu in dem eingangs zitierten Artikel über die Zukunft des Semantic Web:

Unverhoffte Schützenhilfe mag hierbei vom Web 2.0 kommen. Dabei unterscheidet sich dessen Tao zunächst nahezu diametral von dem des Semantischen Webs: Das „Mitmach-Web“ rückt den Menschen in den Vordergrund, sein semantischer Konterpart hingegen die Maschine.
Den Anknüpfungspunkt zwischen den beiden stellen Folksonomies dar, ein Eckpfeiler des Web 2.0. Diese sind das Produkt eines als Social Tagging bekannten Prozesses: User klicken sich durch das Web und annotieren dabei Webseiten, Blogs und andere Medienobjekte, die sie besonders gerne mögen. Solche textuellen, lesezeichenähnlichen Annotationen sind völlig willkürlich und entbehren der normativen Starrheit einer Ontologie.
Doch gilt im Web 2.0 der Leitspruch „Klasse durch Masse“: Dank der Vielzahl taggender Surfer kristallisieren sich schnell die gängigsten Bezeichner für ein Medienobjekt heraus, was der Einigung auf einen eindeutigen Identifikator schon sehr nahe kommt. Struktur entsteht im Mitmach-Web also von unten (bottom-up), nicht top-down wie im Semantischen Web.

Etliche Trendforscher prognostizieren mit Horx’scher Gewissheit die „Ankunft eines neuen Informations-Heilands“ in Form einer Verschmelzung der Graswurzel-Strategien des Web 2.0 mit seinem akademischen Counterpart Semantic Web – zu einem neuen, gloriosen Informations-Bastard namens Web 3.0. Man vermeint sofort Großvater Hegel aus dem feuchten Grabe uns Bewohnern des 3. Jahrtausend christlicher Zeitrechnung „These, Antithese!“ nachhusten zu hören… was dann allerdings in der dialektischen Logik die Antithese zu Web 3.0 wäre, wird wohl in 10 Jahren eine neue Generation von Semblos (Semantic Bloggers) faszinieren.

0 comments