Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] zugriff auf quelltext

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] zugriff auf quelltext

    Guten Morgen,

    ich bin mir dessen bewusst, dass das Problem mit dem ich euch konfrontieren möchte, und um eure Hilfe bitte, schon oft angesprochen wurde, aber trotzdem, mit nachfolgendem script lese ich HTML-Quellcode aus

    PHP-Code:
    //$Inhalt = implode("", file("http://www.mathemath.eu/MathematheuFeatures.php")); <- geht problemlos
    $Inhalt file_get_contents('http://www.bm.butterfieldgroup.com/Rates/Foreign_Exchange/');//Problem!!
    $Inhaltgekuerzt=str_replace("\r\n","",$Inhalt);//Leerzeichen entfernen für weitere Auswertung
    $schreibe fopen("bm.txt""w");
    fwrite($schreibe$Inhaltgekuerzt);
    //fputs($schreibe, $Inhaltgekuerzt);
    fclose($schreibe); 
    wie ihr an den // erkennt habe ich, wegen meines Problems schon einige Versuche zur Lösung gestartet, DENN, wenn ich beispielsweise den HTML Quellcode aus Butterfield - Bermuda - BM_foreign_exchange einlesen und als Textfile speichern möchte bekomme ich nicht ein Bit

    habt ihr eine Idee woran es liegen könnte? Ebenso verhält es sich bei asp/aspx Dateien. Reine HTML Seiten bereiten keine Schwierigkeiten *hmmm*


  • #2
    google mal nach Simple HTML Dom Parser und dein problem ist gelößt
    apt-get install npm -> npm install -g bower -> bower install <package> YOLO https://www.paypal.me/BlackScorp | Mein Youtube PHP Kanal: https://www.youtube.com/c/VitalijMik

    Kommentar


    • #3
      hast du mal den HTML-Quellcode von de Butterfield-Seite angeschaut ...

      HTML-Code:
      <meta content="Microsoft Visual Studio .NET 7.1" name="GENERATOR">
      		<meta content="C#" name="CODE_LANGUAGE">
      		<meta content="JavaScript" name="vs_defaultClientScript">
      		<meta content="http://schemas.microsoft.com/intellisense/ie5" name="vs_targetSchema">
      		<meta name="ROBOTS" content="FOLLOW,INDEX">
      
      <base href="http://www.bm.butterfieldgroup.com/ButterfieldBank/templates/Jur-RatesAuto.aspx?NRMODE=Published&
      NRORIGINALURL=%2fRates%2fForeign_Exchange&NRNODEGUID=%7b78BFAB28-772F-4E17-B912-25919E2129A3%7d&
      NRCACHEHINT=NoModifyGuest">
      da hast du wieder dein ASP ...
      "Irren ist männlich", sprach der Igel und stieg von der Drahtbürste

      Kommentar


      • #4
        Danke für eure schnellen Antworten

        den simple HTML DOM Parser schaue ich mir an, Danke für den Hinweis, BS

        bedeutet dass, das der Quelltext von ASPx Dateien nicht ohne direkten Aufruf der Seite durch einen Browser ausgelesen und gespeichert werden können, eagle?

        Ich tu mir das etwas mit meiner Denke schwer: rufe ich eine Seite über dden Browser auf, ist es ja nicht damit zu vergleichen mit php auf die Seite zuzugreifen, richtig? Ich habe ja keinen Interpreter... *grübel*

        Kommentar


        • #5
          das ist nicht ganz richtig ..

          ob du die Seite nun im Browser anguckst, oder sie "so" ausliest kommt idR aufs gleiche heraus - da dir der Zugriff aufs Dateisystem des entfernten Webservers ja fehlt, muss die Seite in beiden Fällen durch den Webserver aufbereitet und bereitgestellt werden.

          Ob das nun ursprünglich PHP oder PERL oder eben ASP ist , letztlich kann der Webserver nur HTML-Content ausliefern - und sowas erhältst du dann..

          etwas gemeiner ist das, wenn die Seite große Teile ihres Content erst im Browser "zusammenmontiert", indem weitflächig Javascript zum Einsatz kommt (womöglich mit onload gestartet) ... dann hast du natürlich das Problem, dass dein PHP script eben kein Browser ist und das javascript-Krams nicht ausführt - diese Art Seiten ist aber eher selten.

          In dem Zusammenhang - diese Butterfield-Seite hat am Anfang nach den Meta-tags eine ziemliche "Latte" an Javascript-Code - ich hoffe mal, der ist nicht schuld und das mit dem Dom-parser klappt für dich
          "Irren ist männlich", sprach der Igel und stieg von der Drahtbürste

          Kommentar


          • #6
            DOM Parser

            also ich habe den Parser (simplehtmldom_1_11.zip von sourceforge.net) runter geladen, und bekomme ab Zeile 544 einen Fehler in der Synthax hinterlegt.

            Die Zeile mit dem php Befehl

            $Inhalt = file_get_contents... habe ich mit
            $Inhalt = file_get_html... ersetzt

            der Aufruf und die Weiterverarbeitung (also speichern in txt Datei) sollten ja ident sein (einmal php, und einmal DOM Parser)

            aber, irgendwie

            PHP-Code:
            include 'simple_html_dom.php';
            $html file_get_html('http://www.google.com/');
            $Inhaltgekuerzt=str_replace("\r\n","",$html);//leerzeichen entfernen für weitere Auswertung
            $schreibe fopen("bm.txt""w");
            fwrite($schreibe$Inhaltgekuerzt);
            //fputs($schreibe, $Inhaltgekuerzt);
            fclose($schreibe); 
            geht das nicht...

            file_gets_contents funktioniert im übrigen leider auch nicht für google.com

            was ist an der Methode falsch, BS?

            Wenn die Seite durch JS zusammengesetzt wird (wie wahrscheinlich bei Butterfield), gibt es eine Möglichkeit die Seite zu "reizen", um sie zur Bildung des HTML Codes zu bringen, eagle?

            Ich hoffe meine Fragen sind nicht zu langweilig für euch!

            Kommentar


            • #7
              hm .. möglicherweise hilft dir dann cURL - damit kannst du dein PHP-Script noch "näher" an das Verhalten eines echten Browsers bringen - Cookie entgegennehmen und dem Server wieder zurückgeben bei späteren Anfragen .....)
              "Irren ist männlich", sprach der Igel und stieg von der Drahtbürste

              Kommentar


              • #8
                also, ich habe jetzt eine exe unter vb geschrieben, das klappt soweit

                vielen Dank für eure Hilfe!

                Kommentar

                Lädt...
                X