MServer icon indicating copy to clipboard operation
MServer copied to clipboard

ARTE: Filme aus Banner fehlen

Open pidoubleyou opened this issue 5 years ago • 3 comments

Im Forum wurde ein fehlender Film gemeldet.

Erste Analyse: Der Crawler findet nur Filme, die auf den Subkategorie-Seiten unter "Alle Videos" aufgeführt sind. Es gibt anscheinend auch Filme, die nur im oberen Banner verlinkt sind. Diese werden nicht gefunden.

Da der Crawler aktuell über die API sucht, wird das schwierig werden, außer wir schreiben den Crawler um auf HTML parsen.

P.S. ARTE scheint keine API-Calls mehr auf der Webseite zu machen, um die Übersichtsseiten aufzubauen. Einzig für die Video-Infos wird noch ein API-Call durchgeführt (mittlerweile in einer v2 statt v1)

Betrifft sowohl Master als auch Develop.

Weiteres Beispiel: die Kurzfilme von Georges Méliès Forumseintrag

pidoubleyou avatar Feb 10 '20 21:02 pidoubleyou

Nur zu meinem Verständnis: Wenn der Crawler auf HTML parsen umgeschrieben werden würde, und gleichzeitig die Banner aber offensichtlich ip-abhängig/geo-abhängig gestaltet werden, würden damit immer noch Filme fehlen. Weniger als jetzt, aber doch der eine oder andere. Versteh ich das richtig?

DaDirnbocher avatar Apr 23 '20 08:04 DaDirnbocher

@DaDirnbocher Der crawler würde dann deutlich länger brauchen und insgesamt noch weniger finden. Wir nutzen, mittlerweile, die API genau deshalb. Ist ja auch klar von einer API recht direkt die Informationen erhalten die man braucht ist einfacher und schneller als zig Seiten HTML zu laden und zu parsen.

Nicklas2751 avatar Apr 23 '20 12:04 Nicklas2751

Idee: Android-App lädt für jede Kategorie ein JSON, dass die ProgramIds beinhaltet. Darin sind die Banners enthalten. Wäre eine Überlegung, sich das anzusehen.

pidoubleyou avatar Feb 28 '21 19:02 pidoubleyou