Ankündigung

Einklappen
Keine Ankündigung bisher.

Auslesen des Quelltexts unterbunden?

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Auslesen des Quelltexts unterbunden?

    Ich benutze ein Script, um damit sporadisch aus einer Website Preise auszulesen. Dazu habe ich vom Prinzip her das hier benutzt:

    PHP-Code:
    $url "https://www.example.com";

    $page file_get_contents($url,'r');

    // dann Weiterverarbeitung von $page 
    Funktionierte bis vor kurzem auch noch einwandfrei. Jetzt auch noch - nur nicht mehr bei dieser einen Website. $page bleibt leer.

    Woran kann das liegen? Kann der andere Webserver irgendwie unterbinden, dass der Quelltext auf diese Art und Weise ausgelesen wird? Oder hat sich durch eine ggf. neuere PHP-Version irgendetwas verändert? Und gibt es noch weitere Möglichkeiten, nach diesem Schema vorzugehen, d.h. Daten aus dem Quelltext auszulesen, die sich von meiner Vorgehensweise unterscheiden?

  • #2
    Verwende in deinem Beispielcode keine Domains, die nicht dir gehören. Ich ändere das mal auf example.com.

    Am besten du fragst den Betreiber der Seite. Der muss ja wissen, was er beabsichtigt bzw. was er tut. Das ist wesentlich zielführender als die Herumraterei.

    Kommentar


    • #3
      Nein hat sich nichts durch neue PHP Versionen geändert, aber wenn du das schon ansprichst solltest du mal ins error.log von PHP schauen.
      Der Webserver kann natürlich das Ausliefern unterbinden wenn er merkt das einer seine Seite ausliest und ihn das stört, das zeigt aber auch, dass du dir die Einwilligung des Seitenbetreibers nicht eingeholt hast.

      Kommentar


      • #4
        file_get_contents hat keinen zweiten Parameter "r". Vermutlich wird der User-Agent geprüft vom Server.

        Kommentar

        Lädt...
        X