Ankündigung

Einklappen
Keine Ankündigung bisher.

HTML Text Parsen aus iFrame

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • HTML Text Parsen aus iFrame

    Hallo,

    ich hab immer wieder einen wiederkehrenden HTML Code aus welchem ich einige Informationen in eine neue HTML Datei schreiben möchte (per Variabel).

    Ich würde gern diese News hier http://www.aerosoft-shop.com/list_ne...cat=fs&lang=de auf meiner Seite anbieten, dieses ist auch abgesegnet von Seitens des anbieters.

    Nun würde ich gern in mein HTML Dokument die Heatline, das Datum, den Text, und die Links sowie das Bild in einer anderen Anornung automatisch anzeigen lassen.

    Gibt es hier eine möglichkeit für Anfänger?

    Wäre sehr dankbar

  • #2
    K.a. was hast du denn schon Versucht?

    Erstmal brauchst du die komplette Seite. file_get_contents sollte das in der Regel erledigen.
    Danach musst dir die Informationen gezielt raussuchen z.B.: mit preg_match_all.

    In der Doku sind eigentlich ein paar gute Beispiele mit denen man das hin bekommt.
    Versuch dich am besten erstmal daran alle Headlines auszulesen.

    Wenn du das hinbekommen hast sollte die anderen Informationen auch kein Problem sein.
    Erstmal würde ich für jede Information mit einem eigenen aufruf von preg_match_all machen. Alle Informationen über einen Aufruf ist schon etwas anspruchvoller.

    Kommentar


    • #3
      Hallo,

      falls Du noch nie mit Reguären Ausdrücken gearbeitet hast würde ich Dir folgende Alternative empfehlen: http://net.tutsplus.com/tutorials/ph...l-dom-library/

      LG

      Kommentar


      • #4
        danke, werde mir das zweite einmal ansehen sieht jedoch auf den ersten blick sogar komplex bzw zu komplex für mich aus

        Kommentar


        • #5
          Ich war ja schon drauf und dran DOMDocument zu empfehlen, aber dat wird nix, die Page is HTML-technisch für weiter hinten am körper ... da wo Hose.

          1-2 Blicke ins Support-Forum von dem Laden haben mir verraten das die "demnächst" einen RSS-Feed für deren News bereitstellen wollen ( nagut ist noch im 'we will discuss that'-Status ), entweder du wartest darauf oder brichst dir vorsichtig per regex die Finger.

          Kommentar


          • #6
            Den RSS Feed bieten sie wohl nicht an laut rückspache mit Ihnen .. also siehst du da keine Möglichkeit? Das irgendwie aufzubereiten so das wir es anbieten können?
            Bzw keine die man als Anfänger umsetzen kann?

            Kommentar


            • #7
              Wäre auch gern bereit für ein funktionierendes Script was zu zahlen

              Kommentar


              • #8
                Nichts das 1000%-ig redundant läuft und gänzlich auf regex verzichten kann.

                Eine methodische Krücke wäre, das du mit sehr flachen expressions per regex die einzelnen <table>...</table> aus dem Unkraut-Code ausliest und diese dann mit entsprechenden Libraries in PHP zu einem Objekt kaskadieren lässt so das du dann bequem per Library zugreifen kannst..

                Aber das reicht es schon wenn irgendwann beim veröffentlichen einer News ein "Eingabe-Unfall" passiert oder der WYSIWYG-Editor von der CMS-Krücke des Shops den Sith-Lord beim zusammenstecken des HTML-Sources raushängen lässt. Endet beides dann wohl in "nicht wohlgeformtes (x)HTML".

                Der direkte Zugriff per Library wird relativ fix nicht möglich weil die URL die du gepostet hast, kein Dokument ausliefert das valide ist. ( Kein Doctype, kein head, title und body tag.. ) Du musst also in jedem fall bei nicht-regex lösungen mehr fummeln als bei einer regex-Lösung.

                Kommentar


                • #9
                  also ich hab ne seite wo ich code auslese und mache es so
                  (beispiel mit deiner seite)
                  PHP-Code:
                  <?php
                      $host 
                  "http://www.aerosoft-shop.com/list_news.php?cat=fs&lang=de";
                      
                  $filestring file_get_contents($host);
                      
                  $startpos 0
                      while(
                  $pos strpos($filestring"<td colspan=\"2\"  align=\"left\" valign=\"top\" class=\"text_body\"><p>"$startpos)){  //<td colspan=\"2\"  align=\"left\" valign=\"top\" class=\"text_body\"><p> das und unten
                          
                  $string substr($filestring$posstrpos($filestring"</p>"$pos 1) - $pos); // das jeweils austauschen gegen geeignete stellen aus dem quelltext um jeweils datum links usw auszulesen
                          
                  $text[] = $string;
                          
                  $startpos $pos 1;
                      }
                      
                  print_r($text);
                  ?>

                  hab alles ausprobiert klappt einwandfrei. nur alles auf einmal hat nicht geklappt wegen "Fatal error: Allowed memory size of 134217728 bytes exhausted".

                  und das problem ist halt
                  Aber das reicht es schon wenn irgendwann beim veröffentlichen einer News ein "Eingabe-Unfall" passiert

                  Kommentar


                  • #10
                    Wäre es nicht möglich die <table> tags mit regex auszulesen und dann in den <body> tag einer Seite reinzukopieren? Dann hätte man eine vernünftige Seite mit der man arbeiten kann.

                    Kommentar


                    • #11
                      Du kannst auch jedes <table>-Tag als "eigene" XML laden ( DOMDocument oder SimpleXML ), in das jeweilige table das root element ist, das wäre nicht das problem. Die Mücke 'must be wellformed' sticht da nur allzu oft.

                      Kommentar

                      Lädt...
                      X