1. Die ÖWA (österreichische Web-Analyse) und ihre avanciertere Variante, die ÖWA plus, sind in der Alpenrepublik quasi die harte Werbewährung der großen Fische im Web-Teich: zur Teilnahme wird ein Zählpixel in die betreffende Homepage eingebaut, die Teilnahme ist kostenpflichtig. 2. Mir ist in letzter Zeit verstärkt aufgefallen, dass vorwiegend große und "professionelle" Homepages sich unglaublich viele Schnitzer bei der Programmierung leisten: entweder haben die jeweiligen Agenturen noch nie von xml-Validierung gehört, oder sie halten die Doctype-Deklaration für einen eigentlich unnötigen Nerd-Kommentar. Der Rekord lag bei über 300 Validierungsfehlern: damit verschenkt man natürlich ganz gewaltiges SERP-Potential. Synthese: was haben diese beiden Sachverhalte miteinander zu tun? Ganz einfach: ich werde ab sofort einmal monatlich ein alternatives Rating präsentieren: und zwar die Top-10 ÖWA-Sites, gereiht nach der Anzahl der Validierungsfehler. Und dabei gibt's auch was zu gewinnen, und zwar den begehrten Strunz [Trappatoni: Was machen Strunz?] in Gold-, Silber- und Bronze-Imitat.
Als Analysetool kommt der Validator des W3 Konsortiums zum Einsatz. Die Top-10 österreichischen Webseites ermittle ich anhand der Unique-Clients: dieser Wert ist meiner Meinung nach wesentlich aussagekräftiger als die Pageviews, die sehr stark von der Art des Angebots und der Seitenprogrammierung abhängen. (Obwohl Ajax & Co. bei Profi-Angeboten bislang eine Nischenrolle spielen.) Ich ziehe jeweils das aktuellste verfügbare Monatsranking heran - die ÖWA stellt die betreffenden Daten auf ihrer Homepage zur Verfügung, die Top Ten Sites werden anschließend durch den Validator gejagt. Die ÖWA trennt ihre Liste nach Einzel- und Dachangeboten: diese Unterscheidung interessiert mich für den vorliegenden Test nicht, ich verwende das gesamte CSV-Sheet, das die ÖWA auf ihrer Seite zum Download bereit stellt. Die meisten der gelisteten Seiten betreiben also mehrere Domains/Startseiten, für die Validierung wurde jeweils die Hauptadresse verwendet. Außerdem sind manche Angebote aufgesplittet vertreten: der ORF etwa ist auf Platz eins und zwei vertreten, und zwar jeweils mit dem Gesamtangebot und dem redaktionellen Angebot: in solchen Fällen ziehe ich immer das Gesamtangebot heran. Den ÖWA-Teilnehmern steht es übrigens frei, die jeweiligen Monatsdaten zu melden oder nicht - Seiten, die keine Unique Clients angeben, tauchen hier logischerweise auch nicht auf.
Die Reihung erfolgt absteigend nach der Zahl der Fehlermeldungen. Sollten eine oder mehrere Seiten nicht validierbar sein (Sonderzeichen, falsche Doctype-Deklaration etc.), so werden die vom Validator dafür angegebenen Gründe aufgeführt und die betreffende Seite gewinnt die Goldmedaille: bei mehreren Kandidaten gibt's ex-aequo auch mehrere erste Plätze. Et voilá, here we go:
(basierend auf den ÖWA-Daten von Juni 2008)
Die erste Ausgabe der datenschmutz Programmierfehler-Charts hat einen überlegenen Sieger: der echt-kupfer-vergoldete Strunz mit neonrotem Band geht an die nicht validierbare Krone.at. Nach einem knappen Rennen teilen sich Tripple.net und Tiscover mit je 331 Fehlern den echt-aluminium-versilberten Strunz, über den echt-plastik-bronzierten Strunz darf sich Austria.at mit 296 Fehlern freuen. Spannend wird's dann wiederum auf den hinteren Plätzen: als einziger mit langweilig-fehlerfreiem 0-Fehler Code landet derstandard.at auf gerade noch auf Platz zehn, während sich ORF.at mit sporadischen 5 Fehlern gerade noch so auf Platz 9 retten kann.
PS: im Übrigen freu ich mich natürlich wie ein Frosch im Sommerregen über die erstaunlich Tatsache, dass datenschmutz mittlerweile mehr Unique Clients hat als etwas gmx.at "Entertainment" und in etwa gleich viele wie Vienna Online "Community". Schade übrigens, dass Vienna.at nicht unter den Top-10 Seiten liegt: mit 316 Fehlern wäre immerhin Potential für einen guten dritten Platz vorhanden. Aber nun ohne weitere Umschweife zur Premierenwertung:
*) Es wurde kein Character Encoding angegeben, mit Fallback auf utf-8 war keine Validierung möglich.
Jana hat Michael Gursteins Vortrag über Community Informatics zusammengefasst, Max hat einen spannenden Beitrag über alternative Printmedien-Distribution verfasst und die EM hat unbarmherzig begonnen. Mir ist es am Wochenende quasi vollständig gelungen, mich jeglicher Fußball-"Emotion" zu entziehen: kein Wunder, ich habe Stunden vor UltraEdit verbracht, bis ein vier Tage alter DB-Dump endlich wieder vollständig auf UTF-8 umgebaut war. Die Teufelin steckt bekanntlich immer in den Details - soviele Search-and-Replace Operationen hab ich noch nie innerhalb von 48 Stunden durchgeführt... Falls jemand weiterhin Troubles mit der Darstellung der Sonderzeichen haben sollte, bitte ich um einen Hinweis.
Ha, von wegen Knight Rider 3, 4 oder 5.000: der originale Kitt lebt mittlerweile in Wien, wir haben ihn am vergangenen Wochenende im 22. Bezirk an der Tankstelle gesehen; natürlich tankt Kitt nicht, ich glaube, er wollte sich nur ein wenig mit anderen Autos unterhalten. Leider ging alles so schnell, dass es nur für eine jeweils abgeschnittene Vorder- und Rückansicht gereicht hat. Möglicherweise kann Kitt so aber auch besser um die Ecke fahren.

Wenn Typographie, Oberflächendesign und Print-Materialkunde auf engstem Raum zusammentreffen, dann entsteht im besten Fall eine Visitenkarte, die bleibenden Eindruck hinterlässt. Creativebits hat einige der schönsten Exemplare ausgestellt - wenn man diese Exemplare sieht, dann hält sich plötzlich die Freude mit den günstigen Vistaprint-Cards in relativ engen Grenzen
Wenn unser Planet durch Überhitzung (der Treibstoffpreise?) und/oder andere umwelttechnische Katastrophen längst vernichtet sein wird und kein Menschlein mehr auf der Erde verbleibt - also in circa. 75 Jahren - wird OpenID kein Thema mehr sein. Auf Blogoscoped gibt's eine köstliche Internet-FAQ aus der Zukunft - hier ein kleiner Auszug:
What was the internet?
The internet and the world web was a computing system to transfer human information. Scientists have based its beginning to the years 1920 to 1940.What was electromail?
Electromail was another transport protocol to transfer human information, but it was quickly discontinued as it caused misunderstandings due to lack of correctly representing emotions.What were world web sites?
A so-called world web site consisted of an address of its owner to locate their physical business location, as well as other miscellaneous transmitting of human information that was considered important at the time. The protocol used to decode the information was called hypertext, and as its standards changed quickly over the years, it is impossible to decode most of the information contained within.
"Bayan, des samma mir," singen Rammstein auf ihrem neuesten Album, wie dieses Video unwiderlegbar beweist:
In diesem Sinne wünsch ich eine unvorstellbar angenehme Woche ohne Datenbank-Katastrophen und sonstige Unbillen... ab Montag geht's hier auf datenschmutz wieder normal weiter. Sorry, falls der eine oder andere Kommentar aus den letzten drei Tagen verloren ging - da steckt keinesfalls System dahinter! :twisted:
Sorry für die Umständ’ - da will man bloß ein paar kleinere Updates in den Tabellen machen und muss dann voller Entsetzen feststellen, dass der vorausschauend angelegte Dump im falschen Format exportiert wurde (naja, was heißt wurde… ich hab ihn falsch exportiert); und es war ganz schön mühsam, die vielen hässlichen ¤-Umlaute wieder loszuwerden. Aber mit vereinten Transcoding-Kräften von UltraEdit und Notepad++ hat’s dann irgendwann doch wieder hingehaut; besten Dank an Georg und Ben!
Trotz der ganzen UTF-Umkodiererei konnte ich das Sonderzeichen-Suchproblem leider trotzdem nicht lösen - die Suche nach “Maßnahmen” führt zur Seite für “Manahmen” und bleibt somit ergebnislos. Allerdings, und das scheint mir mehr als mysteriös, funktioniert die Umlautsuche über das neu installierte “Live Search Popup” Plugin. Gibt man im Suchfeld z.B. “Maßnahmen” oder “dümmster” ein, erscheinen im Popup-Layer die korrekten Ergebnisse; erst bei Klick auf den Suchbutton passiert der Umlaut-Murks. Hat da vielleicht jemand eine Idee, woran das liegen könnte?
Jedenfalls ist der ganze Zeichensalat wieder beseitigt; und ich werde mich hüten, jemals wieder irgendwelche Änderungen an der Live-DB vorzunehmen, denn auch ein Dump schützt nicht vor allen Unbillen, wie mich der heutige Tag, schmerzhaft gelehrt hat. Beim nächsten Mal werd ich mir einfach via Shell-Dump und Import ein Duplikat der DB anlegen und dann in diesem nach Lust und Laune herumfuhrwerken.