MServer icon indicating copy to clipboard operation
MServer copied to clipboard

Feature Request: Unterstützung für Staffel/Episode Daten

Open ChristianKuehnel opened this issue 2 years ago • 12 comments

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

ChristianKuehnel avatar Nov 07 '23 11:11 ChristianKuehnel

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Die ARD entgegen hat diese Daten immer noch im Titel (Beispiel: https://www.ardmediathek.de/serie/der-zuerich-krimi/ "Borcherts Fall (S01/E01)").

Immer noch ist gut ;) . Gottseidank hat die ARD seit der Übernahme der Sendungen vom ZDF ebenso bis auf wenige Ausnahmen SCHON IMMER im Titel gahabt. _

dadidadit avatar Nov 07 '23 14:11 dadidadit

Das ZDF hat jetzt offenbar die Staffel und Episode bei Serien aus dem Titel entfernt und speichert diese in einem eigenen Feld (Beispiel: https://www.zdf.de/serien/solo-fuer-weiss : "S01 F08").

Es wäre super, wenn MediathekView das auch (z.b. als eigene Spalten) anzeigen würde.

Das ZDF hat Staffel und Episode bis auf ganz wenige Ausnahmen NOCH NIE im Titel gehabt, weder in der API noch im EPG noch im Videotext des Senders. Soviel dazu..

Dann habe ich mich da geirrt. Entschuldigung.

Die Informationen zur Staffel/Episode sind irgendwo vorhanden (auf der Webseite werden sie angezeigt) und es wäre super, wenn jemand einen Weg finden würde diese zu extrahieren.

ChristianKuehnel avatar Nov 07 '23 15:11 ChristianKuehnel

Das ZDF macht das wie es gerade Lust hat. Je naach Mondstand, Sonnenscheindauer geteilt durch Redakteursalter und Tagesform. Da war noch nie was konsistent. Es gibt Serien die vorbildlich mit S01E0X getagt sind, andere einfach nur mit Titel und Folgennummmer darf man sich selber suchen. Ich sehe nicht was MV daran ändern könnte, die Rohdaten vom ZDF sind shice, Punkt.

vitusson avatar Nov 07 '23 16:11 vitusson

Ich glaube hier ist besser aufgdhoben

codingPF avatar Nov 07 '23 23:11 codingPF

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Woher (welche API/Webseite/...) bezieht denn MediathekView die Inhalte beim ZDF? Ist das ein Webscraper? Oder hat das ZDF eine API dafür?

ChristianKuehnel avatar Nov 08 '23 10:11 ChristianKuehnel

Dann sollte ich mir die Rohdaten mal anschauen und überlegen, ob man daraus irgendwas sinnvolles extrahieren kann.

Dann such mal schön. Und wenn du fündig sein solltst, kannst du den Entwicklern, die sich bisher immer große Mühe gegeben haben und einfach nichts finden (wollen?) ganz toll erklären, wie einfach das doch war , wenn das ZDF diese Informationen nicht zur Verfügung stellen will. Noch nicht einmal im eigenen erzeugten und veröffentlichten Videotext im Fernsehprogramm findest du dazu irgend etwas zu Staffel und Folge .... Im einfachsten Fall holst du dir die gewünschten Serientitel mit fehlenden Infos einfach aus dem ARD-Link oder gehts auf die Webseite in der ZDF-Mediathek und schaust sie dir da ab. Das geht nämlich ganz einfach: Klick auf den "Link zur Webseite".

dadidadit avatar Nov 08 '23 17:11 dadidadit

Dinge ändern sich und es kann nicht schaden (auch bekannte) Themen noch zu durch denken

codingPF avatar Nov 08 '23 19:11 codingPF

ja, das ZDF hat die Infos tatsächlich explizit mittlerweile in seiner Datenstruktur: Screenshot from 2023-11-08 21-50-16

Eine Erweiterung in diese Richtung wäre durchaus mal denkbar.

pidoubleyou avatar Nov 08 '23 20:11 pidoubleyou

@dadidadit Ich finde deinen Tonfall sehr unfreundlich und unangemessen bezogen auf mein Angebot Zeit zu investieren um das Tool zu verbessern.

@pidoubleyou Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

ChristianKuehnel avatar Nov 09 '23 14:11 ChristianKuehnel

Das sieht doch super aus! Kann ich mir diese Daten irgendwo anschauen? Woher beziehen wir diese Daten?

über die ZDF-API. wenn du die Filmseite bei ZDF aufrufst, findest du einen JSON-Request mit folgender Url: https://api.zdf.de/content/documents/zdf/serien/solo-fuer-weiss/solo-fuer-weiss---liebeswut-102.json

Den zugehörigen Deserializer findest du im Code hier.

pidoubleyou avatar Nov 11 '23 19:11 pidoubleyou

ich habe mal ein paar Zeilen code rein gebaut...hier der output (random sample) um mal einen Eindruck zu bekommen....NO EPISODE habe ich drin gelassen damit man verstehen kann wie oft das Feld gefüllt ist. Das sieht schon sehr nett aus aber hat auch eine großen imapact...

Blinky Bill#Cranky, der Clown -  (NO EPISODE)
Doku#Vom Freiwilligenjahr zum eigenen Hostel in Afrika - Abenteuer Auswandern in Tansania (NO EPISODE)
In aller Freundschaft#Verpasste Gelegenheiten -  (NO EPISODE)
Bares für Rares#Bares für Rares vom 6. November 2023 - Die Trödel-Show mit Horst Lichter #SE2023#EP256
Löwenzahn#Hühner - Das große Gackern #SE42#EP371
Abendschau - Der Süden#Sendung 09.11.2023 · Das Wichtigste aus Südbayern -  (NO EPISODE)
Death in Paradise#Rückschwung #SE11#EP4
heute#Gedenkfeier zur Reichspogromnacht (NO EPISODE)
ZDFinfo Doku#Murderous History: Der Teufel von Chicago - Rätselhafte Verbrechen #SE2022#EP3
Volle Kanne#Blühendes für den Winter - Tipps von Elmar Mai zu Weihnachtssternen und Amaryllis (NO EPISODE)
SWR1 Leute#Inna Hartwich - Moskau-Korrespondentin - Russland: Darum begehren die Menschen nicht auf -  (NO EPISODE)
Terra X#Welten-Saga - Die Schätze Indiens - Folge 2 der sechsteiligen Dokureihe mit Christopher Clark #SE1#EP2
ZDFinfo Doku#Murderous History: Die Leichenräuber von Edinburgh - Rätselhafte Verbrechen #SE2022#EP2
SWR Aktuell Baden-Württemberg#Sendung 19:30 Uhr vom 6.11.2023 -  (NO EPISODE)
KiKANiNCHEN#Der Krebs -  (NO EPISODE)
Leschs Kosmos#Der Schatz in der Mülltonne - Das Recycling-Versprechen #SE2022#EP7
Insectibles#10. Das große Leuchten -  (NO EPISODE)
heute journal update#Fiedler: "Personal nach wie vor knapp" (NO EPISODE)
Panorama#"The Marvels": Diverser Cast und Actionszenen (NO EPISODE)
Terra X#Überleben – Planet im Wandel - Dokureihe mit Dirk Steffens #SE19#EP5
ZDFinfo Doku#Geheimes Saudi-Arabien - Aufbruch und Unterdrückung  #SE1#EP3
Doku & Reportage#Von der Fabrik zur Kunst -  (NO EPISODE)

codingPF avatar Nov 12 '23 11:11 codingPF

Danke für die Links!

Ich versuche mal zusammenzufassen, was zu tun wäre:

  • Crawler:
    • Vom ZDF bekommen wir bei einigen Serien/Folgen die Daten geliefert, bei anderen nicht.
    • Bei der ARD könnte man dieselbe Information mit einer Heuristik (S01/E02) aus dem Titel raten. Wird manchmal funktionieren und manchmal auch nicht.
    • Weitere Sender müsste man sich einzeln anschauen.
  • Datenmodell:
    • Man müsste das gesamte Datenmodell an diversen Stellen um die entsprechenden Attribute erweitern.
    • Nachdem das eine größere Änderung ist müsste man das irgendwie rückwärtskompatibel gestalten, insbesondere damit ältere SW-Versionen sich nicht an den neuen Daten verschlucken.
  • Frontends:
    • Man müsste das Java und das Webfrontend erweitern, damit dort die zusätzlichen Daten dort auch angezeigt und gefiltert/sortiert werden können.

Das klingt tatsächlich nach einer größeren Aktion. Seht ihr da einen Mehrwert, der den Aufwand rechtfertigt?

ChristianKuehnel avatar Nov 13 '23 13:11 ChristianKuehnel