Schlagwort-Archive: daten

Wintervögel zählen in Würzburg

Der Landesbund für Vogelschutz in Bayern hat wie in jedem Jahr zu der Zählung der Wintervögel im Freistaat aufgerufen, diesmal in der Zeit vom 8. bis 10. Januar 2016. Und diesmal war ich bei dem netten Citizen-Science-Projekt in Würzburg auch mit dabei.

Einen Vogel gesichtet und die Zahl schön auf einen Zettel notiert!
Einen Vogel gesichtet und die Zahl schön auf einen Zettel notiert!

Kaffee in den Thermobecher gefüllt, noch eine Jogginghose über die Jeans gezogen und den Foto klar gemacht — und ab auf den Balkon, Vögel zählen.

Gezählt wird je die maximale Zahl einer Vogelart, die innerhalb einer Stunde zu sehen ist. Und es handelt sich nicht um einen Wettbewerb, wer die meisten Vögel beobachtet hat. Auch wenige — oder gar keine — Vogelsichtungen sind interessant. Um eine möglichst gute Statistik über die Veränderungen der Vogelpopulation in Bayern erstellen zu können, müssen aber auch viele Leute Beobachtungsdaten beim LBV einreichen — geht einfach über ein Formular auf der Webseite.

Das Online-Formular für die Ergebnisse der Zählung.
Das Online-Formular für die Ergebnisse der Zählung.

Also habe ich eine Stunde auf dem Balkon verbracht, einen Podcast ganz leise — um noch Gezwitscher hören zu können — als Unterhaltung im Ohr. Viele Vögel habe ich nicht  erwartet, nachdem unser schöner Garten abgeholzt wurde. Und so war es auch. Ein Amsel hab ich gesehen — die dafür öfter. Und dann doch mal zwei Elstern gleichzeitig. Kurz vor Ablauf der Stunde hat sich dann doch noch ein Vogel vor das Haus verirrt — und ich bin so gut wie sicher, dass es eine Kohlmeise war.

Und meine Zahlen finden sich nun auch in der Statistik über die Wintervögel in Würzburg wieder.

Fertig gezählt. 1 Amsel, 2 Elstern und 1 Kohlmeise in einer Stunde beobachtet.
Fertig gezählt. 1 Amsel, 2 Elstern und 1 Kohlmeise in einer Stunde beobachtet.

Würzburg-Marathon-Karte in und von 3D … Betrieb

Würzburg in 3D-Daten in 3ds Max.Screenshot 3DBetrieb
Würzburg in 3D-Daten in 3ds Max.Screenshot 3DBetrieb

Apropos Residenzlauf — bald ist ja wieder der iWelt-Marathon in Würzburg, nämlich am 17. Mai 2015. Meine ehemaligen Bürokollegen von 3D Betrieb haben eine schöne Übersichtskarte über die Laufstrecke im Computer erstellt und im Netz visualisiert. Sieht recht cool aus.

Und bin gespannt, was die Jungs und das Mädel noch mit den dreidimensionalen Daten von Würzburg noch so alles anfangen.

Erst mal sehen, ob sie meine Idee noch umsetzen, alle interessanten Punkte auf der Karte mit den jeweiligen Artikeln im WürzburgWiki zu verlinken.

Die Laufstecke des Würzburger Marathons im Browser.
Die Laufstecke des Würzburger Marathons im Browser.

Radiohören und der Déjà-vu-Faktor

Radiostatistiken2Ich höre nicht mehr viel Radio — also die kommerziellen Radiosender. Ein Grund dafür ist, dass ich oft das Gefühl habe, die spielen ständig die gleichen Lieder.

Wohlgemerkt: Ich habe das Gefühl von Déjà-vu — ob mir mein Empfinden keinen Streich spielt, weiß ich nicht genau.

Um mir da mal Klarheit zu verschaffen, habe ich angefangen, die Playlists der regionalen Sender auszuwerten.

Ich sammle also automatisiert, welche Lieder bei Radio Gong und Charivari (über die Playlist auf den jeweiligen Webseiten), aber auch bei den Webradios (über die laut.fm-API) in Würzburg gespielt wurden. Und diese Daten werte ich dann aus.

In der ersten Phase habe ich ausgezählt, wie viele Lieder von wie vielen Künstlern am jeweils gestrigen Tag überhaupt gespielt wurden . Daraus errechne ich dann, wie hoch der Prozentsatz an “Abwechslung” an diesem Tag war. Wenn 100 Lieder von 100 verschiedenen Künstlern gespielt wurden, dann ist das zum 100% Abwechslung. 100 Lieder von einem einzigen Künstler sind eine Abwechslungsrate von 1%. Mehr ist also besser.

Und soweit kann man das auch schon anschauen:

radiostat.wuerzblog.de

Die Programmierung habe ich etwas hingeschludert, da muss ich nachmal etwas nacharbeiten. Denn geplant habe ich noch ein paar Funktionen.

  • Die einzelnen Lieder in die Statistik mit einrechnen. Spielt Charivari von Rod Steward fünfmal am Tag das selbe Lied oder fünf verschiedene Lieder?
  • Über längere Zeiträume analysieren — pro Woche, Monat oder Jahr. Dann ist der Abwechslungsfaktor auch aussagekräftiger.
  • Eine ordentliche API für die Rohdaten und Statistiken anbieten — vielleicht hat ja auch jemand außer mir Lust mit den Daten zu arbeiten und was zu programmieren. Wer das jetzt schon machen will: unter http://radiostat.wuerzblog.de/data/ sind die schon überarbeiteten JSON-Dateien der einzelnen Tage zu finden.
    Datei-Schema: stat-dd.mm.jjjj.json (dd=zweistelliger Tag mit evtl führender Null, mm=Monat, jjjj=Jahr)
  • Fehlerquellen reduzieren: Jingles besser erkennen (und nicht einbeziehen), verschiedene Schreibweisen/Schreibfehler von Künstlern und Liedtiteln erkennen
  • Design, Layout und UI verbessern

Ich werde an der Radiostatistik weiterarbeiten, das kann sich aber ein bisschen ziehen — Zeit ist Mangelware. Und nicht vergessen: Noch ist die Statistik in der Testphase. Da können noch immer mal komische oder falsche Ergebnisse rauskommen, oder sie kann auch mal gar nicht funktionieren.

Anmerkung 1: Wer sich fragt, warum der Abwechslungs-Wert des Radio Würzblog nicht so übermäßig gut ist, der muss bedenken, dass dieses Webradio relativ strengen Regeln unterliegt. Da wird nur Musik von Künstlern gespielt, die aus Würzburg bzw. Unterfranken kommen oder schon mal in Würzburg gespielt haben. Das schränkt die mögliche Auswahl an Musikstücken schon mal deutlich ein. Und dann muss ich diese Musik noch besitzen oder sie muss im Soundpool von laut.fm sein — was gerade in der regionalen und/oder alternativen Musikszene meist nicht der Fall ist.
Wer den Wert nach oben treiben will, der muss mir einfach Musik überlassen, die in das Schema passen! 🙂

Anmerkung 2: Datenjournalist Lorenz Matzat merkte an, ob nicht “Vielfalt” ein besserer Begriff wäre als “Abwechslung”.

Habe kurz darüber nachgedacht , ihm Recht gegeben und den Begriff in den Statistiken geändert. Danke Lorenz. 🙂

statistik_2011_header

Hosen runter!

Gestern hatte ich die Verkehrsunfallstatistik 2011 für Unterfranken in der Hand — um die geht es jetzt gar nicht. Ich kam aber auf die Idee, mal die Würzblog-Statistik für das vergangene Jahr anzuschauen. Die Jahre zuvor hatte ich nie eine Möglichkeit, eine solide Jahresstatisik für das Blog zu erstellen. Google Analytics habe ich nur hin und wieder mal laufen lassen, genau wie andere Statisik-Tools. Irgendwie habe ich mich gescheut, meine Zahlen einem fremden Anbieter in den Rachen zu werfen.

Aber es gibt ja eine sehr gute Open-Source-Alternative, die auf meine eigenen Webspace läuft: Piwik, das so ähnlich aussieht wie Google Analytics und Zugriffe auf das Würzblog seit Mitte 2010 mitzählt. Das Jahr 2011 ist das erste Jahr, dass ich komplett mit Piwik erfasst habe. Übrigens werden die Daten anonymisiert, bei der IP-Adresse wird der letzte Block gelöscht.

Und wie sah das Jahr 2011 im Würzblog nun aus?

Noch nie habe ich in einem Jahr so wenig gebloggt wie 2011, schäbige 124 Artikel sind in der Zeit entstanden, die meisten davon im zweiten Halbjahr. Zum Vergleich: Das nächstschlechtere Jahr war 2009 mit 265 Artikeln. In diesem Jahr2012 sieht es schon jetzt übrigens deutlich besser aus.

Und wieviele haben nun diese wenigen Artikel gelesen? Im gesamten Jahr 2011 hatte das Würzblog 69720 Besuche (Piwik filtert übrigens gut Bots aus, die Zahl sollte sich also ziemlich mit der wirklichen Leseranzahl decken) und 123702 Seitenaufrufe.

Zu den Besuchen der Website kommen auch noch die RSS-Feeds. Die werden im Würzblog normalerweise über den Umweg über Feedburner abonniert. Pro Tag hatte das Würzblog im Schnitt 389 Feed-Abonnenten — wie genau das Feedburner auch immer zählt. Im gesamten Jahr waren es 141834 Abonnenten. Für Feedburner-Fetischisten: Im Jahr hatte der Feedburner-Feed einen Reach von 17279, Item Views vom 37660, Item Clickthroughs von 9546 und 599968 Hits. Die Feedburner-FAQ erklärt die Bedeutung von manchen Werten. Die Bewertung der Feedzahlen ist für mich schwierig. Viele Leser werden es vielleicht wie ich machen, und Blogs fast nur über die Feeds lesen. Manche lesen den Feed und die Webseite. Und dann gibt es noch Leute, die den Feed abonniert haben, ihn aber nicht lesen.

Interessant für mich als Webdesigner, der ich ja auch immer noch bin, ist die Browserverteilung 2011. Und ich kann aufatmen: Der Internet Explorer kommt auf weniger als ein Viertel der Besucher. Brave Besucher! 😉

browserfamilien

Oder die Betriebssysteme 2011: Viel Windows, ein wenig Mac OS, der Rest ist vor allem Linux, dann iPhone und Android. Interessantes Nebenergebnis: Die Linux-Nutzer bleiben im Schnitt am längsten pro Besuch auf dem Blog, nämlich 2 Minuten und 36 Sekunden.

os_wuerzblog

Gibt es noch Fragen oder der Wunsch nach speziellen Daten?

WueWoWas und PayPal, just good friends?

Wer einen Account bei wuewowas.de und auch einen Account bei PayPal hat, der sollte sicherheitshalber mal bei PayPal reinschauen, ob da keine ungewollten Transaktionen vorhanden sind.
Gernot von WueWeb hat vor ein paar Wochen festgestellt, dass PayPal eine Zahlung von seinem Konto an Gameforge durchführen wollte, die er nicht angewiesen hat. Nachdem er diesen Fall in dem Blogbeitrag dargestellt hat, fanden sich in den Kommentaren auch andere Leidensgenossen. Nach und nach zeigte sich, dass viele aus Würzburg kommen und dann noch, dass sie bei PayPal das selbe Passwort verwenden wie bei wuewowas.de. Es könnte also sein, dass Benutzerdatenbank bei wuewowas.de gehackt wurde und mit diesen Daten über PayPay bei Gameforge eingekauft wurde, das wäre zumindest eine Erklärung,

Das nur als Hinweis, Gernot hält euch bestimmt auf dem Laufenden. Und vielleicht sollte man einfach mal so wieder das PayPal-Passwort ändern, kann nie schaden. Und am besten kein Passwort verwenden, dass woanders in Benutzung ist.

Elena, die kleine Datenkrake vom Heuchelhof

Seit vorgestern wohnt ja Elena in Würzburg. Neee, nicht die Elena, die andere. Unsere Elena wohnt bei der Deutschen Rentenversicherung, ich vermute mal in einem Appartement in der Berner Straße 1, Inneneinrichtung und Hausmeister wurden gestellt. Mit vollem Namen heißt sie “Elektronischer Entgeltnachweis” und sie lässt sich schon gerne mal alle “einkommensrelevanten Informationen” von ca. 40 Millionen Arbeitnehmern schicken. Also wer wann wie viel verdient hat zum Beispiel, praktisch, wenn man Arbeitslosengeld oder ähnliches berechnen will. Und weil Elena noch Platz in ihrer Wohnung hat, da hat sich die Regierung gedacht, sie lagern bei ihr im Keller noch gleich weitere Daten ein. Ob der Arbeitnehmer gestreikt hat, wie viel Fehlzeiten er hatte, ob es Abmahnungen gab und so weiter.

Nicht dass diese Daten vorher nicht irgendwo zu bekommen waren, aber hey — muss das alles in Elenas Keller gebunkert werden, ohne zu wissen, ob man sie mal braucht? Und mit solchen eingelagerten Vorratsdaten ist es wie mit eingemachten Obst. Wenn man es einkocht denkt man sich, die Einmachgläser werden erst aufgemacht, wenn der Schnee einen halben Meter hoch ist. Aber letztendlich sind nach zwei Wochen 80% der Gläser schon leergefuttert. Oder wie es das Unabhängiges Landeszentrum für Datenschutz Schleswig-Holstein 2008 geweisagt hat:

Sind Daten einmal vorhanden, sind diese schnell vielfältigen Begehrlichkeiten ausgesetzt, gegen die die Betroffenen keine Abwehrmöglichkeiten haben

Elena, du kleine Datenkrake vom Heuchelhof, merk dir wenigestens ein paar Sachen: Nicht gierig werden, die Haustüre immer schön abschließen, Fenster geschlossen halten, nicht besoffen auf Weinfesten ins Plaudern kommen. Vielleicht klingel ich mal irgendwann bei dir — darf ich ja.