Ankündigung

Einklappen
Keine Ankündigung bisher.

Seite zerlegen?

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Seite zerlegen?

    Hallo leute,

    in meinem letzten Beitrag suchte ich nach nen Fehler warum das Zerlegen von webseiten ausgaben nicht funktionierte.
    Nun das 2. Problem. Die ausgabe soll in eine Textarea eingetragen werden, das funktioniert. Nur gibt es dort den kompletten htmlcode mit Text zur anzeige.

    Hier der Scriptcode:
    <?php

    function string_zerlegen($inhalt, $start, $ende)
    {
    $zwischen = explode($start, $inhalt);
    $ergebnis = explode($ende, $zwischen[1]);
    return $ergebnis[0];
    }

    $url = 'http://www.meine-seite.de';
    $starttext = '<body';
    $endtext = '</body';
    $seite = implode('', file ($url));

    $ausgabe = string_zerlegen($seite, $starttext, $endtext);

    ?>
    <form name="form1" method="post" action="">
    <textarea name="textfield" cols="80" rows="50"><?php echo $ausgabe; ?></textarea>
    </form>

    Wie kann ich das ändern das der Htmlcode nicht angezeigt wird sondern nur die Textausgabe?


  • #2
    Moin,
    damit regex-tutorial und preg_match [Edit] oder besser damit preg_replace das is fuer ersetzungen uhd nicht nur fuer vergleiche[/Edit]

    arbeite den ersten Durch(am besten alle kapitel) und wende es mit dem 2. an.
    so kannst du alles was zwischen < und > steht rausfiltern

    und fuer quellcode benutze bitte den PHP-Button ganz rechts neben dem URL-Button, der macht Syntaxhighlighting
    Wie lautet die adäquate Antwort auf "ihr benehmt euch wie kleine Kinder!" ?

    "Er hat Angefangen!"

    Kommentar


    • #3
      Damit habe ich es schon versucht nur steige ich nicht so richtig dahinter bei regex und preg_match. Und außerdem da ich täglich rund 400 seiten zerlegen will und in die textausgaben ohne html in die datenbank speichern will finde ich ist es mit regex zu umfangreich denn nicht jede Seite besitzt den gleichen inhalt.
      Bei meinem Script spielt es keine Rolle welchen Inhalt die Seite besitzt. nur das einzige Problem ist, es soll der HTML-CODE nicht mit anzeigen in dem Textareafeld.

      Kann mir dabei irgend einer nen tip geben außer mit regex und preg_match?

      Danke

      Kommentar


      • #4
        hi,

        strip_tags() ist dein freund.

        Kommentar


        • #5
          Kann mir dabei irgend einer nen tip geben außer mit regex und preg_match?
          Geht auch ganz einfach mit preg_match(), war erst kürzlich hier die Frage danach.

          Kommentar

          Lädt...
          X