Schlagwort-Archive: statistik

Wintervögel zählen in Würzburg

Der Landesbund für Vogelschutz in Bayern hat wie in jedem Jahr zu der Zählung der Wintervögel im Freistaat aufgerufen, diesmal in der Zeit vom 8. bis 10. Januar 2016. Und diesmal war ich bei dem netten Citizen-Science-Projekt in Würzburg auch mit dabei.

Einen Vogel gesichtet und die Zahl schön auf einen Zettel notiert!
Einen Vogel gesichtet und die Zahl schön auf einen Zettel notiert!

Kaffee in den Thermobecher gefüllt, noch eine Jogginghose über die Jeans gezogen und den Foto klar gemacht — und ab auf den Balkon, Vögel zählen.

Gezählt wird je die maximale Zahl einer Vogelart, die innerhalb einer Stunde zu sehen ist. Und es handelt sich nicht um einen Wettbewerb, wer die meisten Vögel beobachtet hat. Auch wenige — oder gar keine — Vogelsichtungen sind interessant. Um eine möglichst gute Statistik über die Veränderungen der Vogelpopulation in Bayern erstellen zu können, müssen aber auch viele Leute Beobachtungsdaten beim LBV einreichen — geht einfach über ein Formular auf der Webseite.

Das Online-Formular für die Ergebnisse der Zählung.
Das Online-Formular für die Ergebnisse der Zählung.

Also habe ich eine Stunde auf dem Balkon verbracht, einen Podcast ganz leise — um noch Gezwitscher hören zu können — als Unterhaltung im Ohr. Viele Vögel habe ich nicht  erwartet, nachdem unser schöner Garten abgeholzt wurde. Und so war es auch. Ein Amsel hab ich gesehen — die dafür öfter. Und dann doch mal zwei Elstern gleichzeitig. Kurz vor Ablauf der Stunde hat sich dann doch noch ein Vogel vor das Haus verirrt — und ich bin so gut wie sicher, dass es eine Kohlmeise war.

Und meine Zahlen finden sich nun auch in der Statistik über die Wintervögel in Würzburg wieder.

Fertig gezählt. 1 Amsel, 2 Elstern und 1 Kohlmeise in einer Stunde beobachtet.
Fertig gezählt. 1 Amsel, 2 Elstern und 1 Kohlmeise in einer Stunde beobachtet.

Grüße nach Mountain View, USA

Zugriffe aus Mountain View auf das Würzblog.
Zugriffe aus Mountain View auf das Würzblog.

Liebe Grüße aus Würzburg nach Mountain View, Kalifornien, USA!

Und danke für das immer noch anhaltende Interesse am Würzblog, wie ich bei einem Blick in die — natürlich anonymisierten — Statistiken entdeckt habe.

Wer mag das in Mountain View sein? Jemand bei Google, LinkedIn oder der Mozilla Foundation? Oder — das wäre besonders cool — jemand beim SETI-Institut? Am Ende ist es einfach nur ein ein etwas schräg programmierter Bot? Naja, vermutlich … 😉

Wer oder was immer es ist — weiterhin viel Spaß beim Lesen des Würzblog! 🙂

 

Radiohören und der Déjà-vu-Faktor

Radiostatistiken2Ich höre nicht mehr viel Radio — also die kommerziellen Radiosender. Ein Grund dafür ist, dass ich oft das Gefühl habe, die spielen ständig die gleichen Lieder.

Wohlgemerkt: Ich habe das Gefühl von Déjà-vu — ob mir mein Empfinden keinen Streich spielt, weiß ich nicht genau.

Um mir da mal Klarheit zu verschaffen, habe ich angefangen, die Playlists der regionalen Sender auszuwerten.

Ich sammle also automatisiert, welche Lieder bei Radio Gong und Charivari (über die Playlist auf den jeweiligen Webseiten), aber auch bei den Webradios (über die laut.fm-API) in Würzburg gespielt wurden. Und diese Daten werte ich dann aus.

In der ersten Phase habe ich ausgezählt, wie viele Lieder von wie vielen Künstlern am jeweils gestrigen Tag überhaupt gespielt wurden . Daraus errechne ich dann, wie hoch der Prozentsatz an “Abwechslung” an diesem Tag war. Wenn 100 Lieder von 100 verschiedenen Künstlern gespielt wurden, dann ist das zum 100% Abwechslung. 100 Lieder von einem einzigen Künstler sind eine Abwechslungsrate von 1%. Mehr ist also besser.

Und soweit kann man das auch schon anschauen:

radiostat.wuerzblog.de

Die Programmierung habe ich etwas hingeschludert, da muss ich nachmal etwas nacharbeiten. Denn geplant habe ich noch ein paar Funktionen.

  • Die einzelnen Lieder in die Statistik mit einrechnen. Spielt Charivari von Rod Steward fünfmal am Tag das selbe Lied oder fünf verschiedene Lieder?
  • Über längere Zeiträume analysieren — pro Woche, Monat oder Jahr. Dann ist der Abwechslungsfaktor auch aussagekräftiger.
  • Eine ordentliche API für die Rohdaten und Statistiken anbieten — vielleicht hat ja auch jemand außer mir Lust mit den Daten zu arbeiten und was zu programmieren. Wer das jetzt schon machen will: unter http://radiostat.wuerzblog.de/data/ sind die schon überarbeiteten JSON-Dateien der einzelnen Tage zu finden.
    Datei-Schema: stat-dd.mm.jjjj.json (dd=zweistelliger Tag mit evtl führender Null, mm=Monat, jjjj=Jahr)
  • Fehlerquellen reduzieren: Jingles besser erkennen (und nicht einbeziehen), verschiedene Schreibweisen/Schreibfehler von Künstlern und Liedtiteln erkennen
  • Design, Layout und UI verbessern

Ich werde an der Radiostatistik weiterarbeiten, das kann sich aber ein bisschen ziehen — Zeit ist Mangelware. Und nicht vergessen: Noch ist die Statistik in der Testphase. Da können noch immer mal komische oder falsche Ergebnisse rauskommen, oder sie kann auch mal gar nicht funktionieren.

Anmerkung 1: Wer sich fragt, warum der Abwechslungs-Wert des Radio Würzblog nicht so übermäßig gut ist, der muss bedenken, dass dieses Webradio relativ strengen Regeln unterliegt. Da wird nur Musik von Künstlern gespielt, die aus Würzburg bzw. Unterfranken kommen oder schon mal in Würzburg gespielt haben. Das schränkt die mögliche Auswahl an Musikstücken schon mal deutlich ein. Und dann muss ich diese Musik noch besitzen oder sie muss im Soundpool von laut.fm sein — was gerade in der regionalen und/oder alternativen Musikszene meist nicht der Fall ist.
Wer den Wert nach oben treiben will, der muss mir einfach Musik überlassen, die in das Schema passen! 🙂

Anmerkung 2: Datenjournalist Lorenz Matzat merkte an, ob nicht “Vielfalt” ein besserer Begriff wäre als “Abwechslung”.

Habe kurz darüber nachgedacht , ihm Recht gegeben und den Begriff in den Statistiken geändert. Danke Lorenz. 🙂

statistik_2011_header

Hosen runter!

Gestern hatte ich die Verkehrsunfallstatistik 2011 für Unterfranken in der Hand — um die geht es jetzt gar nicht. Ich kam aber auf die Idee, mal die Würzblog-Statistik für das vergangene Jahr anzuschauen. Die Jahre zuvor hatte ich nie eine Möglichkeit, eine solide Jahresstatisik für das Blog zu erstellen. Google Analytics habe ich nur hin und wieder mal laufen lassen, genau wie andere Statisik-Tools. Irgendwie habe ich mich gescheut, meine Zahlen einem fremden Anbieter in den Rachen zu werfen.

Aber es gibt ja eine sehr gute Open-Source-Alternative, die auf meine eigenen Webspace läuft: Piwik, das so ähnlich aussieht wie Google Analytics und Zugriffe auf das Würzblog seit Mitte 2010 mitzählt. Das Jahr 2011 ist das erste Jahr, dass ich komplett mit Piwik erfasst habe. Übrigens werden die Daten anonymisiert, bei der IP-Adresse wird der letzte Block gelöscht.

Und wie sah das Jahr 2011 im Würzblog nun aus?

Noch nie habe ich in einem Jahr so wenig gebloggt wie 2011, schäbige 124 Artikel sind in der Zeit entstanden, die meisten davon im zweiten Halbjahr. Zum Vergleich: Das nächstschlechtere Jahr war 2009 mit 265 Artikeln. In diesem Jahr2012 sieht es schon jetzt übrigens deutlich besser aus.

Und wieviele haben nun diese wenigen Artikel gelesen? Im gesamten Jahr 2011 hatte das Würzblog 69720 Besuche (Piwik filtert übrigens gut Bots aus, die Zahl sollte sich also ziemlich mit der wirklichen Leseranzahl decken) und 123702 Seitenaufrufe.

Zu den Besuchen der Website kommen auch noch die RSS-Feeds. Die werden im Würzblog normalerweise über den Umweg über Feedburner abonniert. Pro Tag hatte das Würzblog im Schnitt 389 Feed-Abonnenten — wie genau das Feedburner auch immer zählt. Im gesamten Jahr waren es 141834 Abonnenten. Für Feedburner-Fetischisten: Im Jahr hatte der Feedburner-Feed einen Reach von 17279, Item Views vom 37660, Item Clickthroughs von 9546 und 599968 Hits. Die Feedburner-FAQ erklärt die Bedeutung von manchen Werten. Die Bewertung der Feedzahlen ist für mich schwierig. Viele Leser werden es vielleicht wie ich machen, und Blogs fast nur über die Feeds lesen. Manche lesen den Feed und die Webseite. Und dann gibt es noch Leute, die den Feed abonniert haben, ihn aber nicht lesen.

Interessant für mich als Webdesigner, der ich ja auch immer noch bin, ist die Browserverteilung 2011. Und ich kann aufatmen: Der Internet Explorer kommt auf weniger als ein Viertel der Besucher. Brave Besucher! 😉

browserfamilien

Oder die Betriebssysteme 2011: Viel Windows, ein wenig Mac OS, der Rest ist vor allem Linux, dann iPhone und Android. Interessantes Nebenergebnis: Die Linux-Nutzer bleiben im Schnitt am längsten pro Besuch auf dem Blog, nämlich 2 Minuten und 36 Sekunden.

os_wuerzblog

Gibt es noch Fragen oder der Wunsch nach speziellen Daten?