Ankündigung

Einklappen
Keine Ankündigung bisher.

Inhalt einer fremden Seite auslesen Skript

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Inhalt einer fremden Seite auslesen Skript

    Hallo Community,

    ich bin noch PHP Anfänger und habe folgendes Problem. Es geht um die Seite: https://www.it-sicherheit.de/securit..._webapp/ampel/.

    Ich möchte eine eigene Seite erstellen auf der nur der Abschnitt Adobe bis Oracle zu sehen ist alles andere brauche ich nicht und dabei soll alles auf einer Seite sein ohne runter scrollen zu müssen d.h. es soll so am ende ungefähr aussehen: http://www.php.de/attachment.php?att...1&d=1422361533
    (Habe es jetzt kurz mit Paint gemacht)
    Ich muss ja irgendwie die Daten von der Seite auslesen um sie auf meiner eigenen darzustellen. Meine Seite soll auch immer nach 10 Minuten schauen ob sich auf dieser Ampelschaltung etwas verändert hat und dieses aktuell halten.

    Könnt ihr mir helfen?
    Angehängte Dateien


  • #2
    Ich muss ja irgendwie die Daten von der Seite auslesen um sie auf meiner eigenen darzustellen. Meine Seite soll auch immer nach 10 Minuten schauen ob sich auf dieser Ampelschaltung etwas verändert hat und dieses aktuell halten.
    Achtung - zuerst: https://www.it-sicherheit.de/meta_na...gsbedingungen/

    Hast du gelesen? Hole dir jedenfalls vorher das schriftliche ok ein.

    LG
    Debugging: Finde DEINE Fehler selbst! | Gegen Probleme beim E-Mail-Versand | Sicheres Passwort-Hashing | Includes niemals ohne __DIR__
    PHP.de Wissenssammlung | Kein Support per PN

    Kommentar


    • #3
      Zitat von hausl Beitrag anzeigen
      Achtung - zuerst: https://www.it-sicherheit.de/meta_na...gsbedingungen/

      Hast du gelesen? Hole dir jedenfalls vorher das schriftliche ok ein.

      LG
      Die Seite ist nur für mich alleine und wird nicht veröffentlicht.

      Kommentar


      • #4
        Zitat von Dr.Day Beitrag anzeigen
        ich bin noch PHP Anfänger und habe folgendes Problem. Es geht um die Seite: https://www.it-sicherheit.de/securit..._webapp/ampel/.

        Ich möchte eine eigene Seite erstellen auf der nur der Abschnitt Adobe bis Oracle zu sehen ist alles andere brauche ich nicht und dabei soll alles auf einer Seite sein ohne runter scrollen zu müssen d.h. es soll so am ende ungefähr aussehen: http://www.php.de/attachment.php?att...1&d=1422361533
        (Habe es jetzt kurz mit Paint gemacht)
        Ich muss ja irgendwie die Daten von der Seite auslesen um sie auf meiner eigenen darzustellen.
        Genau. Aber so einfach ist es nicht!

        Was Du tun kannst:

        Analysiere die Webseite damit Du weist welche HTML-Elemente Du brauchst.

        Analysiere Die Webseite damit Du herausbekommst welche Verfahren u.U. nötig sind um sinnvolle Inhalte zu extrahieren. z.B: welche Codierung verwendet wird, ob das Markup gültig ist (sonst muss es u.u. repariert werden um es z.B. als XML zu parsen.), welche Styles von Dir verwendet werden müssen um das einzubindende HTML in Deinem Dokument entsprechend Deinen wünschen zu formatieren, usw.

        Lade den Content der URL (z.B. mit file_get_contents())

        Ersetze Entities die im Context des geladenen Dokuments ungültig sind (in Deinem Fall   Umlaute und &copy durch gültige XML zeichen

        lass tidy_repair_string mit den passenden Optionen drüber laufen

        Lade das XML mit simplexml_load_string()

        finde mit XPATH '//div[@class="products"]' die benötigten Elemente

        und gibt diese in einer Scheife dahin aus wohin sie eben ausgegeben werden sollen.

        Das ganze nennt sich dann Parser.

        Noch fix paar CSS styles für den neuen Seiteninhalt definieren und schon bist Du durch damit.

        Hat hier genau 4 Minuten gedauert. Aber keine Angst, den Spass auf selber machen nehme ich dir nicht indem ich Dich mit fertigen Code quäle.

        MfG, Ulf
        PHP-Manual ¡ mysql_* ist veraltet ¡ Debugging: Finde DEINE Fehler selbst ¡ Passwort-Hashing ¡ Prepared Statements

        Kommentar

        Lädt...
        X