Erfreuliche News aus der Microblogging-Welt: am Montag habe ich endlich den Account @datenschmutz bekommen, den ich zukünftig statt @ritchie_tweets für meine deutschsprachigen Micro-Messages verwenden werde. Ich bin gerade dabei, allen Friends des alten Accounts zu folgen und hab mich über knapp 400 Followers in den ersten zwei Tagen ziemlich gefreut
Aktuelle datenschmutz-Postings werden wie gehabt über den Feed-Account @datenschmutzrss gepostet - ich bevorzuge die Trennung von "Human" und "RSS Accounts". Außerdem bin ich mit meinem Haupt-Account @datadirt (derzeit 33k Followers) seit Montag auf Platz 1 der Twem-Charts - Sascha Lobo sieht bloß noch den Hinterreifen meines Bikes.
Aber bei aller Freude über die Chart-Platzierung kann ich mir an dieser Stelle ein paar Anmerkungen zum Maßbändern, -stäben und -einheiten einfach nicht verkneifen. "What people know and what they say is like colorful sky," habe ich mal den Purple Pro singen hören. Und in der Tat: Einerseits beschwören sämtliche Evangelisten den dialogischen Charakter von Web 2.0 Services, andererseits gilt es fast schon als anrüchig, wenn die Follower-Followed-Ratio bei 1:1 liegt. Den größten .at/.de/.ch Twitteraccount in punkto Followers habe ich mit über 30k schon eine ganze Weile. Aber an die Spitze der Twem-Charts kam ich erst diese Woche, da ich mittlerweile aufgrund des rasanten Wachstums rund 17k mehr Followers als Friends habe.
Twem bezeichnet diese nicht-reziproke Gruppe als "Fans" und baut die Gesamtwertung auf dieser Differenz auf. Der Hintergedanke ist wohl, dass spammige Mass-Follow Accounts außen vor bleiben sollen, spricht mit 100k Followern und ebenso vielen Friends wäre man bei Twem ziemlich weit hinten. Aber spiegelt dieses Verfahren die Twitter-Realität überhaupt wider? Nein, denn im Extremfall müssen sich Followers und Friends überhaupt nicht überschneiden - ein Tweeper könnte beispielsweise 100 anderen Usern folgen, während im selbst 200 andere Accounts folgen, von denen er keinen einzigen in der Timeline hat. Um die tatsächliche "non-reziproke Differenz" zu eruieren, müsste Twem also analog zum äußerst nützlichen TwitterKarma beide Listen komplett abgleichen, um auf die tatsächliche Anzahl der "Fans" zu kommen.
Diese Zahl entspräche zumindest eher der tatsächlichen Differenz, aber was sagt die eigentlich aus? Es handelt sich lediglich um ein Analogon zu klassischen Maßzahlen á la Reichweite oder Newsletter-Abonnenten. Genauso gut könnte man diese Zahl mit dem Quotient Followers durch Friends hoch Pi multiplizieren und das zweimal durch den Kehrwert des Prozentsatzes @-Replies durch ReTweets dividieren. Doch der Punkt ist: es gibt keine *richtige* Art, Twitter zu verwenden, sondern völlig unterschiedliche Nutzungs-Szenarien. Kann man einen über Twitter geposteten RSS-Newsfeed des Spiegel sinnvoll mit dem Twitter-Account von Nora X, 17, Webdesignerin aus dem Wuppertal, vergleichen? Ich denke nicht. Auch ReTweets sind spätestens, seit man sie en gros um Spottpreise einkaufen kann, keine sinnvolle Maßeinheit mehr.
Am ehestens würde sich zur indirekten Messung der Popularität die Click-Through-Rate von geposteten Fotos, Links, Videos etc. eignen, und zwar in Relation zur Zahl der Followers. Sprich: wenn Heinz Mustermann mit 100 Followern einen Link postet und 20 User drauf klicken, dann ist das mehr wert als Elise Musterfrau Aussendung an 500 Followers, von denen nur fünf neugierig auf den Inhalt sind. (Wenn allerdings Walter Spamberger einen Link an seine hunderttausend Followers verschickt, von denen auch nur ein Prozent drauf klickt, dann sieht die Sache in punkto "Mediawert" schon wieder ganz anders aus.) Mit anderen Worten: Während in grauer Web 2.0 Vorzeit, als Technorati noch funktionierte, beispielsweise der Zahl der Trackbacks der letzten 3 Monate tatsächlich einen gewissen Aufschluss über die Relevanz bestimmter Blogs lieferte, so betont jede Twitter-Hitparade und Wertung lediglich einzelne quantitative Aspekte, die recht wenig über die (dialogische) Qualität des jeweiligen Accounts aussagen. Außer im Fall von datadirt natürlich!
Und noch mal ein kurzer Reminder: deutschsprachige Tweets gibt's ab sofort unter @datenschmutz, alle Blog-Updates unter @datenschmutzrss und wer Englisch bevorzugt, wirft einen Blick auf @datadirt respektive @datadirtrss. Ich twittere über ähnliche Themen wie hier am Blog - sprich Social Web, Online Marketing, Gadgets und die üblichen Geekereien. Natürlich freu ich mich über neue Followers, außerdem interessiert mich brennend: was halten Sie von Microblogging-Landvermessungen und Twitter-Hitparaden?
Die Social Media Suchmaschine Twingly hat das Potential, zum neuen Technorati zu avancieren. Während Big T. seit Monaten mit Aktualisierungs- und Verfügbarkeitsproblemen zu kämpfen hat, haben sich die Schweden für ihre Charts einiges überlegt: endlich gibt's eine standardisierte, nach 12 Sprachen getrennte Hitparade; and guess what: datenschmutz ist auf Platz #44 in der gesamten deutschsprachigen Blogosphäre!!!
Daher erstmal ein herzliches Dankeschön an all die Stammleserinnen und -leser, die datenschmutz diesen äußerst motivierenden Erfolg ermöglicht haben. Und ein extra-großes Danke an alle, die mich in den letzten 12 Monaten verlinkt haben. Ich revanchier mich bekanntlich gerne - eine gute Gelegenheit, Backlinks abzustauben, bietet mein wöchentliches Blogistan-Panoptikum: passende Themen können derzeit via Formular eingeschickt werden. Und Gratulation an Rob - er regiert souverän die deutschsprachige .at/.ch./.de Wertung. Die gesamte und die englischsprachige Wertung führt übrigens TechCrunch an, die sich natürlich erfreut zeigen, aber auch skeptisch:
Sweden-based Twingly, not to be confused with Twing, doesn't share much about the underlying technology and only says its ranking system focuses on 'inlinks and likes among other things'. They also stress that it shows the blogosphere according to their data, and that it’s not necessarily 100% accurate. It’s a nice feature, but late in the game, and you’ve got to ask yourself how obsolete both Twingly’s and Technorati's ranking would be if Google were actually the next to introduce the next 'Google PageRank for blogs'.
In der Tat - sollte irgendwann Big G eine eigenes Blogranking pushen, würden alle anderen Listen ziemlich obsolet. Aber ds wär mit Sicherheit unter den Top 100 Blogs zu finden: denn anders als bei den dbc werden hier keine "unliebsamen" Einträge händisch entfernt. Übrigens ebenso wie bei den Twitter Charts. Um nicht falsch verstanden zu werden: jeder, der seine eigene Hitparade baut, darf daran gerne rum-manipulieren wie's im beliebt. Unsympathisch finde ich beim Popkulturjunkie allerdings, dass er nicht unbeträchtlichen Aufwand betreibt, um den Eindruck von Objektivität zu erwecken: sozusagen Hausordnung als Farce, aber andererseits auch wieder zu unwichtig, um sich drüber aufzuregen.
Aber zurück zu erfreulicheren Dingen: dass es mit einem deutschsprachigen Blog schwierig bis unmöglich sein dürfte, in die Gesamtwertung zu rutschen, zeigt sich deutlich an der Tatsache, dass nicht mal BasicThinking unter den weltweiten Top 100 vertreten ist. Englisch ist und bleibt eben die Geschäftssprache der Blogosphäre - insofern bin ich auch recht froh über meinen erfreulich anlaufenden Einstieg ins anglo-amerikanische Netz aka datadirt. Hier geht's zu Twingly's deutschsprachigen Blogcharts.
PS: Ich hab mir Twingly bislang noch nicht näher angesehen - aber die (werbefreie!) Suchfunktion macht einen mehr als brauchbaren Eindruck. Ich sag nur: Pêche Rodemaque Royal
1. Die ÖWA (österreichische Web-Analyse) und ihre avanciertere Variante, die ÖWA plus, sind in der Alpenrepublik quasi die harte Werbewährung der großen Fische im Web-Teich: zur Teilnahme wird ein Zählpixel in die betreffende Homepage eingebaut, die Teilnahme ist kostenpflichtig. 2. Mir ist in letzter Zeit verstärkt aufgefallen, dass vorwiegend große und "professionelle" Homepages sich unglaublich viele Schnitzer bei der Programmierung leisten: entweder haben die jeweiligen Agenturen noch nie von xml-Validierung gehört, oder sie halten die Doctype-Deklaration für einen eigentlich unnötigen Nerd-Kommentar. Der Rekord lag bei über 300 Validierungsfehlern: damit verschenkt man natürlich ganz gewaltiges SERP-Potential. Synthese: was haben diese beiden Sachverhalte miteinander zu tun? Ganz einfach: ich werde ab sofort einmal monatlich ein alternatives Rating präsentieren: und zwar die Top-10 ÖWA-Sites, gereiht nach der Anzahl der Validierungsfehler. Und dabei gibt's auch was zu gewinnen, und zwar den begehrten Strunz [Trappatoni: Was machen Strunz?] in Gold-, Silber- und Bronze-Imitat.
Als Analysetool kommt der Validator des W3 Konsortiums zum Einsatz. Die Top-10 österreichischen Webseites ermittle ich anhand der Unique-Clients: dieser Wert ist meiner Meinung nach wesentlich aussagekräftiger als die Pageviews, die sehr stark von der Art des Angebots und der Seitenprogrammierung abhängen. (Obwohl Ajax & Co. bei Profi-Angeboten bislang eine Nischenrolle spielen.) Ich ziehe jeweils das aktuellste verfügbare Monatsranking heran - die ÖWA stellt die betreffenden Daten auf ihrer Homepage zur Verfügung, die Top Ten Sites werden anschließend durch den Validator gejagt. Die ÖWA trennt ihre Liste nach Einzel- und Dachangeboten: diese Unterscheidung interessiert mich für den vorliegenden Test nicht, ich verwende das gesamte CSV-Sheet, das die ÖWA auf ihrer Seite zum Download bereit stellt. Die meisten der gelisteten Seiten betreiben also mehrere Domains/Startseiten, für die Validierung wurde jeweils die Hauptadresse verwendet. Außerdem sind manche Angebote aufgesplittet vertreten: der ORF etwa ist auf Platz eins und zwei vertreten, und zwar jeweils mit dem Gesamtangebot und dem redaktionellen Angebot: in solchen Fällen ziehe ich immer das Gesamtangebot heran. Den ÖWA-Teilnehmern steht es übrigens frei, die jeweiligen Monatsdaten zu melden oder nicht - Seiten, die keine Unique Clients angeben, tauchen hier logischerweise auch nicht auf.
Die Reihung erfolgt absteigend nach der Zahl der Fehlermeldungen. Sollten eine oder mehrere Seiten nicht validierbar sein (Sonderzeichen, falsche Doctype-Deklaration etc.), so werden die vom Validator dafür angegebenen Gründe aufgeführt und die betreffende Seite gewinnt die Goldmedaille: bei mehreren Kandidaten gibt's ex-aequo auch mehrere erste Plätze. Et voilá, here we go:
(basierend auf den ÖWA-Daten von Juni 2008)
Die erste Ausgabe der datenschmutz Programmierfehler-Charts hat einen überlegenen Sieger: der echt-kupfer-vergoldete Strunz mit neonrotem Band geht an die nicht validierbare Krone.at. Nach einem knappen Rennen teilen sich Tripple.net und Tiscover mit je 331 Fehlern den echt-aluminium-versilberten Strunz, über den echt-plastik-bronzierten Strunz darf sich Austria.at mit 296 Fehlern freuen. Spannend wird's dann wiederum auf den hinteren Plätzen: als einziger mit langweilig-fehlerfreiem 0-Fehler Code landet derstandard.at auf gerade noch auf Platz zehn, während sich ORF.at mit sporadischen 5 Fehlern gerade noch so auf Platz 9 retten kann.
PS: im Übrigen freu ich mich natürlich wie ein Frosch im Sommerregen über die erstaunlich Tatsache, dass datenschmutz mittlerweile mehr Unique Clients hat als etwas gmx.at "Entertainment" und in etwa gleich viele wie Vienna Online "Community". Schade übrigens, dass Vienna.at nicht unter den Top-10 Seiten liegt: mit 316 Fehlern wäre immerhin Potential für einen guten dritten Platz vorhanden. Aber nun ohne weitere Umschweife zur Premierenwertung:
*) Es wurde kein Character Encoding angegeben, mit Fallback auf utf-8 war keine Validierung möglich.
...des deutschsprachigen Internet. Selbige haben 1000f gebaut - als Gegenpol zu Jans langweiliger und tendenziöser Technorati-Abschreibarbeit haben wir ja schon mal einen Gegenentwurf vorgelegt, aber dort liegt mein Blog auf dem schlaffen 35sten Platz.
In besagten ultimativen deutschen Blogcharts dagegen landete datenschmutz knapp nicht unter den Top 10 - auf Platz 11 hab ich's geschafft, gleichwohl hinter und vor sehr respektabler Konkurrenz:
Und warum ultimativ? Das verraten die Macher lieber selbst. Ganz gegen sonstige Gewohnheit zitier' ich ausnahmsweise mal den kompletten Beitrag, weil der die Idee kurz und bündig erklärt:
Hier die ersten Ergebnisse des Versuchs die 50 beliebtesten Blogs der deutschsprachigen Blogosphäre in ein ultimatives Ranking zu bringen. Mit Daten von Technorati, Google, del.icio.us, Mister Wong, Digg und metaroll, die in ein Punktesystem umgewandelt wurden, das aus drei gleichwertigen Kategorien besteht.
Die (theoretisch) maximal erreichbare Punktzahl liegt bei 1500. In jeder Kategorie werden maximal 500 Punkte vergeben. Die einzelnen Faktoren, die zusammen eine Kategorie bilden, haben unterschiedliche Wertigkeiten. Untersucht wurden z.B. neu eingehende Links in den letzten sieben Tagen / Gesamtlinks (von unique domains), die Anzahl der gespeicherten Bookmarks bei del.icio.us, Mister Wong etc., der PageRank, die Anzahl der Blogrolls bei metaroll... und weitere Faktoren, die ich aus Anti-Manipulationsgründen lieber geheim halte.
So, damit wäre alles gesagt, Hossa und juchee! Auch wenn ich schon wieder eine Armada von datenschmutz-Hatern vor den Keyboards sitzen sehe, die sich mit den neuesten Verschwörungstheorien überschlagen: "Ey Alda, der hat das doch alles nur voll gefaked!" Ja sicher Mann! Und die Analytics Zahlen gleich dazu, mir gehört nämlich das ganze Internet, seit mir Chuck Norris beigebracht, wie man durch Null teilt!