Technik
15.07.2014

Wer viel misst, misst Mist – Teil 2

Von

Audio-Abrufzahlen ohne Missverständnisse – Teil 2: Audio-Downloads

Nach der Klärung der Begriffe beschäftigen uns nun die Messwerte, die beim Abruf von Audio-Dateien, also den Hörfunk-Beiträgen im digitalen mp3-Format, erzeugt werden.

Was soll gemessen werden?

In diesem Beitrag geht es um die Messung der Downloads von Audio-Dateien. Die Hörfunk-Beiträge vom Deutschlandradio haben feste Adressen (URLs) über die sie abgerufen werden können. Damit wäre die naheliegende und wahrscheinlich wichtigste Maßeinheit bereits gefunden: Die Anzahl der Abrufe einer bestimmten Audio-Datei innerhalb eines bestimmten Zeitraums, z.B. innerhalb eines Tages, einer Stunde und so weiter.

Außerdem wäre es noch interessant zu wissen ob die Audio-Dateien vollständig oder nur teilweise heruntergeladen wurden. Sicher ist, dass teilweise heruntergeladene Dateien nicht komplett abgespielt worden sind. Aber ob sie überhaupt abgespielt wurden, weiß niemand. Selbst bei vollständig heruntergeladenen Dateien kann man nicht nachvollziehen ob sie jemals abgespielt wurden. Das hier besprochene Messverfahren, gibt also keine Auskunft darüber, ob ein Beitrag abgespielt wurde oder nicht. Das ist wichtig zu wissen, weil insbesondere Podcatcher die Audio-Beiträge herunterladen, wenn sie im Podcast veröffentlicht werden. Ob der Abonnent die Audios tatsächlich jemals abspielt, wird man so nicht erfahren. Es gibt aber andere Messmethoden, die dies in eingeschränktem Umfang ermöglichen. Darauf wird weiter unten noch eingegangen.

Woher kommen die Messwerte?

Die Audio-Dateien werden von Webservern ausgeliefert, die jeden Download eines Audios protokollieren. Im Protokoll werden die sog. OK-Hits festgehalten und im Idealfall entsteht also pro heruntergeladenem Audio ein Eintrag im Protokoll. Aber:

Ein Protokolleintrag (OK-Hit) ist nicht gleich einem Download!

Wenn ein Audio-Beitrag nicht zu groß ist (wenige Megabyte) und PC, Smartphone oder Tablet den Beitrag mit einer einzigen Anfrage herunterladen können, ist es wirklich einfach. Doch leider ist das nicht immer der Fall. Häufig fordern die empfangenden Geräte die Dateien in Häppchen an, was dazu führt, dass für den Download einer Audio-Datei mehrere Protokolleinträge gemacht werden. Und wenn ganz viele Downloads dieser Art nahezu gleichzeitig stattfinden, wird es schwer, die zusammengehörenden Anfragen bei der Auswertung des Protokolls wieder zusammen zu führen.

Um zu verstehen, wann und wovon Protokolleinträge erzeugt werden, hier ein paar Beispiele:

  1. Der Beitragsplayer im Internetangebot von Deutschlandradio
    Neben den Text-Beiträgen befindet sich ein Audio-Player mit dem zum Text passenden Audio-Beitrag. Wird der Audio-Player gestartet, so lädt er die Audio-Datei herunter und spielt sie ab.
  2. Podcatcher laden Audios vorweg herunter
    Podcatcher, wie iTunes laden die Audio-Dateien herunter, sobald sie im Podcast-Feed aufgelistet werden. Das Audio wurde zwar geladen, aber wurde es je angehört? Man weiß es nicht.
  3. Webbrowser
    Webbrowser enthalten oft ein Player-Plugin über das Audio-Dateien abgespielt werden können.
  4. Audio-Player
    Es gibt unzählige Audio-Player, vom Windows Media Player über Winamp bis hin zu VLC, die Audio-Dateien herunterladen und abspielen können.
  5. u.v.m

Auch sogenannte Bots erzeugen Protokolleinträge, die aber korrekterweise nicht mitgezählt werden dürfen. Bei Bots handelt es sich um automatisch initiierte Downloads, die z.B. von Suchmaschinenbetreibern oder anderen Contentverwertern das Internet nach Audio-Dateien durchsuchen.

Von der Audio-Datei zum Beitrag

Wie bereits im ersten Teil des Beitrags erläutert, sieht die typische Download-Adresse eines Deutschlandradio Hörfunk-Beitrags so aus:

http://ondemand-mp3.dradio.de/file/dradio/2014/06/28/dlf_20140628_1641_6736594b.mp3

Im Protokoll wird man genau diese URL finden, die jedoch keinen Hinweis darüber gibt, welchen Inhalt dieser Beitrag hat und in welcher Sendung er lief. Um diese Informationen zu ergänzen, muss aufs CMS zurück gegriffen werden. Dort befinden sich sämtliche Metadaten zu allen Audio-Beiträgen des Deutschlandradios – sofern sie im Internet veröffentlicht werden dürfen.

In einem derzeit laufenden Projekt werden die Protokolldaten mit den Metadaten der Audios korreliert um sie über ein Statistik-Tool abrufbar zu machen.

Das Abspielen von Audios messen

Die Abspielzeiten von Audios kann man nur mit einem speziell dafür eingerichteten Player messen. Weil auf die Funktionen von externen Soft- und Hardware-Playern kein Zugriff möglich ist, beschränkt sich das Messen der Abspiel-Aktivitäten auf die hauseigenen Player, also den Beitrags-Player, der in die Webseiten des Angebotes integriert ist. Mit Hilfe von Javascript ist es möglich die Aktionen, wie das Klicken der Play- und Stopp-Taste und das Vor- und Zurückspulen zu erfassen. Damit kann man recht genau ermitteln, welche Beiträge für die Nutzer besonders interessant waren, indem man die durchschnittliche Wiedergabedauer misst und damit die Wiedergaberate errechnet.

Man muss aber wissen, dass nur ein Teil der Zugriffe auf Audio-Beiträge über den Webseiten-Player erfolgt und das bei den Analysen berücksichtigen.

Fazit

Jeder Download eines Audio-Beitrags schlägt sich im Protokoll nieder. Das Protokoll ist demnach die zentrale Stelle um Rückschlüsse über die nicht-lineare Nutzung der digitalen Hörfunk-Beiträge zu bekommen. Allerdings kann man nicht sagen, ob der Beitrag tatsächlich angehört wurde. Aber das Problem haben alle Arten von Medienstatistik.

Der dritte Teil folgt in Kürze …

Kommentare zu diesem Beitrag (2)

  1. Maren Müller | 8. August 2014, 15:44 Uhr

    Mist

    Bei der Quotenmessung fürs Fernsehen weiß doch bei den Panelteilnehmern auch keiner, ob die Sendung tatsächlich geschaut wird oder ob die Kiste nur nebenbei läuft.
    Wie misst man im Radio die Hörerzahlen von einer Nachtsendung? Gibt es da Schätzungen, Hochrechnungen o.ä.?

    • Richard Weiß | 11. August 2014, 16:11 Uhr

      Vielen Dank für Ihren Beitrag! Ob die Hörerinnen und Hörer den Inhalt aufgenommen oder gar verstanden haben lässt sich leider auch nicht zuverlässig ermitteln. Im Zeitraum zwischen 22 Uhr und 6 Uhr werden durch die Medienanalyse keine Hörerzahlen ermittelt.