datenschmutz - Social Marketing, Pro-Blogging und medien.kultur.technik
 
bcklu2010-18 andalusien-2009-101 Meral Berlin 2007 Bike Kick-Off 2009
datenschmutz RSS Feed
0 zufriedene Leser
RSS jetzt abonnieren
Twitter
48.237 Followers
auf Twitter folgen

Das Semantic Web nutzen — Interview mit Andreas Blumauer

28.10.2008, geschrieben von Ritchie Blogfried Pettauer, 4 Kommentare

Andreas BlumauerVergangene Woche hatte ich die Ehre und Freude, mei­nen ers­ten Beitrag für die Blogpiloten zu ver­fas­sen — und zwar ein Interview zum Themenspecial “”. Mein Interviewpartner ist Geschäftsführer der Semantic Web Company: das Unternehmen bie­tet Firmen und öffentlich-rechtlichen Institutionen Dienstleistungen rund um das Thema , seman­ti­sche Technologien und Social Software, von Schulung und Consulting bis hin zur Implementation kon­kre­ter Projekte. Gemeinsam mit Tassilo Pellegrini stellte er das Text-Kompendium “Social ” für den Springer Verlag zusam­men — Informationen rund um den Sammelband fin­det man im zuge­hö­ri­gen Wiki.

daten­schmutz: Die Company befasst sich mit Wissenstransfer und mit dem Einsatz neuer Webtechnologien. In den letz­ten Jahren gab es zahl­rei­che Konferenzen und wis­sen­schaft­li­che Papers zum Thema “” — wel­che Technologien sind bereits kon­kret im Einsatz?

: RDF als Basis des ist bereits im “Großeinsatz”, bei­spiels­weise stützt sich das Metadatenmodell der eben ver­öf­fent­lich­ten OpenOffice Suite 3.0 auf RDF. Damit erhöht sich das Volumen an Daten wei­ter dramatisch.

Im Kern des steckt die so genannte “Linking Open Data Cloud”, kurz: LOD-Cloud, die nun schon aus über zwei Billion Triples besteht und eine Reihe inter­es­san­ter Anwendungen her­vor­ge­bracht hat wie z.B. Mobile DBpedia.
Gerade eben hat das W3C nun RDFa, quasi die Microformate des , als Empfehlung ver­ab­schie­det. Damit kann man in jedes XHTML Dokument RDF Metadaten einbetten.

Neben Oracle gibt es in der Zwischenzeit bereits auch einige Anbieter aus­ge­reif­ter Triple Stores (RDF Datenbanken), die Infrastruktur ist nun also da — es ist zu erwar­ten, dass sich viele Enduser-Anwendungen in den nächs­ten Monaten dazu­ge­sel­len wer­den. Neben Yahoo! SearchMonkey hat sich ja neu­er­dings auch die Drupal-Community zuneh­mend den Standards ver­schrie­ben und mit einem klei­nen Plug-In namens Triplify kann man prin­zi­pi­ell alle CMS oder Wikis ins ein­hän­gen. Ein guter Startpunkt dafür sind jeden­falls auch Semantic Wikis: Die Informationen zu unse­rem neuen Springer-Band “Social ” haben wir bei­spiels­weise mit dem Semantic MediaWiki erfasst und publiziert.

So las­sen sich die Zusammenhänge schnel­ler brow­sen oder mit­tels facet­tier­ter Suche schnel­ler fin­den. Alle Informationen zu Autoren, Themen oder Artikeln sind außer­dem via RDF mit ande­ren RDF-Quellen leicht zu ver­net­zen — und darin liegt eigent­lich der Mehrwert des .

?: Für seman­ti­sche Webtechnologien wurde vor eini­ger Zeit der Begriff geprägt — die­ser Begriff taucht vor allem im Zusammenhang mit onto­lo­gi­schen Strukturierungsversuchen auf. Sind Ihnen kon­krete Anwendungsbeispiele bekannt?

!: ist nach wie vor ein dehn­ba­rer Begriff — die EU inter­pre­tiert die­sen z. B. ganz anders als die zB. Web 2.0– oder die Community.
Wir ver­ste­hen unter die Anreicherung (oder Konvertierung) von Web (2.0) — Inhalten um Metadaten, Thesauri und teil­weise auch bereits von Logik-basierten Ontologien. Im Sinne des geschieht dies unter Verwendung offe­ner Standards des W3C und teil­weise auch in Kombination mit offe­nen RDF-Datenquellen wie DBpedia oder Geonames.

Konkret ver­wen­den diese Standards und Technologien Social-Tagging Plattformen wie Faviki, Automatische Annotations-Services wie OpenCalais von Thomson Reuters, Websites mit zusätz­li­chen Navigationsmöglichkeiten wie BBC Music oder Oracle’s Pressroom zur facet­tier­ten Suche.

Gerade im letz­ten hal­ben Jahr wur­den viele Anwendungen auf Basis des RDF-Standards ent­wi­ckelt, wobei in vie­len Fällen OWL-Ontologien noch eine unter­ge­ord­nete Rolle spie­len, son­dern viel­mehr sprach­li­che Ontologien, um unstruk­tu­rierte Texte bes­ser erschlie­ßen zu können.

?: Vor kur­zem wurde die “seman­ti­sche” Suchmaschine Cuil gelauncht, die aller­dings im prak­ti­schen nicht-englischsprachigen Einsatz sehr zu wün­schen übri­gen lässt. Welche Verbesserungen wer­den seman­ti­sche Technologien für die Informationssuche bringen?

!: In vie­len Fällen möchte man eigent­lich Fragen stel­len und Antworten bekom­men. Wir sind nach all den Jahren Google gewöhnt, Begriffe ein­zu­ge­ben und Dokumente bekom­men, aus denen wir dann die Antworten manu­ell extra­hie­ren. Oft sind jedoch jene Fakten übers Netz ver­streut, die man benö­tigt, um eine Antwort auf eine etwas kom­ple­xere Frage zu bekommen.

Natürlich sind damit nicht alle Suchanfragen gemeint. Wenn man z. B. wis­sen will, wel­che Adresse ein Restaurant hat, wer­den nach wie vor Suchtechnologien á la Google die kos­ten­ef­fi­zi­en­tes­ten Services ermög­li­chen. Spannender wird’s dann schon in kom­ple­xe­ren Wissensgebieten wie z. B. den Lebenswissenschaften. Hier zei­gen spe­zi­elle, ontologie-gestützte Suchmaschinen wie GoPubMed, wohin die Reise geht. Um diese Services jedoch nut­zen zu kön­nen bedarf es eini­ger Einarbeitungszeit. Viele Newcomer bekla­gen sich, dass seman­ti­sche Suchmaschinen zu kom­pli­ziert wären, und Google oder Yahoo doch des­we­gen so erfolg­reich ist, weil sie so ein­fach zu bedie­nen wären.

Das mag in man­chen Situationen wie gesagt auch stim­men. Wenn Sie aber wis­sen wol­len, auf wel­chen Universitäten die Kinder der frü­he­ren ame­ri­ka­ni­schen Präsidenten stu­diert haben, dann muss man sich schon einige Zeit reser­vie­ren, um dies mit gän­gi­gen Suchtechnologien her­aus­zu­fin­den. Da bie­ten Technologien wie Freebase oder Parallax, oder eben Anwendungen im inter­es­sante Alternativen an — vor allem auch für das unter­neh­me­ri­sche Umfeld.

?: Wird sich durch die starke Dominanz englisch-sprachiger Ontologien die große Internet-Kluft zwi­schen Europa und den USA noch wei­ter auftun?

!: Nein. Die Thesaurus-Spezifikation des W3C, näm­lich SKOS bie­tet ja die Möglichkeit an, mehr­spra­chige Suchmaschinen zu unter­stüt­zen. Im medi­zi­ni­schen Bereich z. B. wird mit MeSH bei­spiels­weise ein umfas­sen­der Thesaurus ange­bo­ten, der mehr­spra­chig, auch in Deutsch ver­füg­bar ist.

?: Wirft man einen Blick auf Firmen und Institutionen, die sich mit seman­ti­schen Technologien beschäf­tig­ten, so gewinnt man not­wen­di­ger­weise den Eindruck, dass die glei­chen Aufgaben von zahl­rei­chen Firmen par­al­lel gelöst wer­den — oder ist die­ser Eindruck des Einzelkämpfertums falsch?

!: Ich denke, in der Community gibt es eine gute Mischung aus Kooperation und Konkurrenz. Der Markt für seman­ti­sche Technologien ist momen­tan ja stark im Wachsen, steckt aber noch in den Kinderschuhen. Ein Konsolidierungsprozess ist daher abseh­bar, noch sind ja viele Unternehmen stark an uni­ver­si­täre Einrichtungen gekop­pelt, die über EU-Forschungsprogramme zunächst finan­ziert wor­den sind.

Es ist jedoch ein star­ker Community-Spirit auch in der SemWeb-Community spür­bar. Es gibt viele Akteure und Organisationen, die an einem “grö­ße­ren Ganzen” inter­es­siert sind und nicht ein­fach den Markt abschöp­fen wol­len. Es gibt hier viele Parallelen zur Open Source Community: Offene Standards, offene Daten, offene Geister ;-)

?: Jeder Vertreter seman­ti­scher Technologien, mit dem ich bis­her gespro­chen habe, hat mir hoch und hei­lig ver­si­chert, dass sein System das leis­tungs­fä­higste und ein­zig logi­sche sei. Auf der ande­ren Seite konnte mir noch nie­mand eine so sim­ple Anwendung wie eine Websuchmaschine zei­gen, die gegen­über Google irgend­ei­nen Vorteil gehabt hätte. Was wür­den Sie einem Laien zei­gen, um ihn von der Relevanz seman­ti­scher Technologien zu überzeugen?

!: Wenn ich 2 Minuten Zeit habe, würde ich ver­bes­serte Suchmöglichkeiten á la Exalead und Reegle demons­trie­ren. Bei einer 5 Minuten-Demo zeige ich, dass es im vor allem um Zusammenhänge zwi­schen Dingen geht. (Demo) Wenn ich 15 Minuten Zeit habe, demons­triere ich, dass es wei­ters um eine bes­sere Vernetzung von Informationen und die zugrun­de­lie­gende seman­ti­sche Annotation geht. (Demo 1, Demo 2) Wenn ich aber eine Stunde Zeit hätte, dann würde ich erst über das an sich spre­chen — dem Web of Data, der LOD Cloud und all den Möglichkeiten und Gefahren, die in den nächs­ten Jahren auf uns zu kom­men werden.

Keine ähnli­chen Beiträge.


Bisher haben meine Lieblingsleser 4 Kommentare zu "Das Semantic Web nutzen — Interview mit Andreas Blumauer" geschrieben.

Wie ist Ihre Meinung?
  • Insurance Guy Identicon Icon

    Hi, finde ich ein total span­nen­des Thema! Gerade weil dadurch die Suche im Web mit seman­ti­schen Suchmaschienen ver­bes­sert wer­den könnten.

    Büro ist Krieg — Versicherung ist Weltkrieg

    Kommentar bewer­ten: Thumb up 0 Thumb down 0

    direkt antworten

    ritchie Identicon Icon

    Ich kann’s ja kaum noch erwar­ten, end­lich eine gut funk­tio­nie­rende deutsch­spra­chige seman­ti­sche Suche nut­zen zu können.

    Kommentar bewer­ten: Thumb up 0 Thumb down 0

    direkt antworten

  • Der Semantic Webber Identicon Icon

    Kompliment — gutes Interview mit vie­len Hintergrundinformationen, die mir wäh­rend mei­ner Diplomarbeit auch begeg­net sind.

    Ich glaube es ist vor allem wich­tig zu begrei­fen, das es ein flie­ßen­der Übergang zum seman­ti­schen Web ist. Ein Prozess bis die Standars ver­brei­tet sind und Unternehmen die Chancen auf Profit erkannt haben.

    Bleibt auf jeden Fall spannend.

    Kommentar bewer­ten: Thumb up 0 Thumb down 0

    direkt antworten

    ritchie Identicon Icon

    Das stimmt, seman­ti­sche Technologie wer­den ja vor allem im Suchbereich (zumin­dest im Anfangsstadium) bereits bei ers­ten “Mainstream”-Produkten eingesetzt.

    Kommentar bewer­ten: Thumb up 0 Thumb down 0

    direkt antworten

Kommentar schreiben

:frog: :frog2: :frog3: :frog5: :frog6: :dirtfrog: :frog4: :frog4o: :frog7: :artfrog: :darkfrog: :elkfrog: :frogface: :frogonleaf: :leefrog: :littlefrog: :princefrog: :coolfrog: :coolfrogjump: :mrt: :smoking666: :borg: :ninja: :satan: :saint: :elvis: :king: :pimp: :pirat: :mrdj: :elk: :cool: :geek: :weird: :mad: :sad: :-? :shock: :anonym: :angel: :kiss: :love2: :coffee2: :white2: :dog: :cat: :ccocktail: :beer: :thumbdown: :thumbup:

0 Track- und Pingbacks zu diesem Beitrag

  • Ping me, please! Einfach /trackback/ an die URL anhängen.
?
datenschmutz.tribe
         Login | Registrieren
via RSS Feed datenschmutz RSS Feed
als Newsletter
aweber
AlbanianArabicBasqueBelarusianBulgarianCatalanChinese (Simplified)CroatianCzechDanishDutchEnglishFrenchGermanItalianPortugueseRussianSpanish
datenschmutz q+a
Stellen Sie mir Ihre Frage zu Social Marketing, Blogging und Co. — ich ant­worte dem­nächst hier am Blog.
Neueste Beiträge