Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] Zeichenauschliessen mit Retex

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] Zeichenauschliessen mit Retex

    Ich lese von einer Webseite bestimmte links aus mittels Preg_match_all

    PHP-Code:
    preg_match_all ('#<a href="([^\<]*)\">([^\<]*)</a>#' ,$Artikel$artikelPREG_SET_ORDER); 
    Ist es möglich den RegTex so zu erweitern dass er links die mit einen span umschlossen si ignoriert?

    Beispiel:
    PHP-Code:
    <span class="shortName"><a href="/b-juniorinnen-hessenliga/spiele/sg-altengronau-jossa-gegen-jfv-oberau-duedelsh-alt/28234/192">JFV Oberau/Düdelsh./Alt.</a></span
    diese sollen nicht ausgwählt werden
    Wie ist das Möglich mit Regtex oder Alternative?

  • #2
    Ungetestet:

    Code:
    #(?<!<span class="shortName">)<a href="([^\<]*)\">([^\<]*)</a>#
    - http://php.net/manual/en/regexp.refe...assertions.php

    Zur Frage, ob Regex (regular expressions) dazu optimal geeignet sind, siehe jüngst diesen Thread:

    - http://www.php.de/php-einsteiger/102...-auslesen.html

    Ach, schau an. Der ist auch von dir.

    Kommentar


    • #3
      Ich verweise mal hier drauf: http://htmlparsing.com/php.html

      Übrigens:

      Retex ... RegTex ... Regtex
      Äh.. nö
      The string "()()" is not palindrom but the String "())(" is.

      Debugging: Finde DEINE Fehler selbst! | Gegen Probleme beim E-Mail-Versand | Sicheres Passwort-Hashing | Includes niemals ohne __DIR__
      PHP.de Wissenssammlung | Kein Support per PN

      Kommentar


      • #4
        Gibts es für RegTex ein schönes Deutschprachiges Buch?


        Zur Frage, ob Regex (regular expressions) dazu optimal geeignet sind, siehe jüngst diesen Thread:

        - http://www.php.de/php-einsteiger/102...-auslesen.html ([Erledigt] Links korrekt aus einer Webseite auslesen)
        Wenn ich noch mehr solche Parse mache werde ich es mit dem HTMl Parser probieren.

        Das Problem ist da halt nur dass der saubereb Code benötigt den die wenigsten Seiten haben.


        Schau mal ob dein Provider tidy unterstützt, bzw frei gegeben hat. Wenn nicht mal nachfragen ob es möglich ist.
        Tidy ist in der Lage dein invalides HTML zu bereinigen, außer Doppelvergaben von ID's bekommt Tidy nicht hin.
        Kann mir einer dass mit dem tidy nochmal erklären. Warum läuft dass über den Server gibt es da auch andere Sachen die das HTML Bereinigen die kein Server. Ich lese ja mit PHP die Seite aus warum soll dass dan nochmal zum Server? Vo der Seite die ich auslese habe ich kein Zugriff auf den Server.

        Kommentar


        • #5
          WAS zum Teufel ist RegTex?
          [QUOTE=nikosch]Macht doch alle was Ihr wollt mit Eurem Billigscheiß. Von mir aus sollen alle Eure Server abrauchen.[/QUOTE]

          Kommentar


          • #6
            Muss ne neue Erfindung sein. Regelmäßige Textverwaltung?
            [URL="http://goo.gl/6Biyf"]Lerne Grundlagen[/URL] | [URL="http://sscce.org/"]Schreibe gute Beispiele[/URL] | [URL="http://goo.gl/f2jR7"]PDO > mysqli > mysql[/URL] | [URL="http://goo.gl/jvfSZ"]Versuch nicht, das Rad neu zu erfinden[/URL] | [URL="http://goo.gl/T2PU5"]Warum $foo[bar] böse ist[/URL] | [URL="http://goo.gl/rrfzO"]SQL Injections[/URL] | [URL="http://goo.gl/Q81WJ"]Hashes sind keine Verschlüsselungen![/URL] | [URL="http://goo.gl/2x0e2"]Dein E-Mail Regex ist falsch[/URL]

            Kommentar


            • #7
              Zitat von Blackhead77 Beitrag anzeigen
              Gibts es für RegTex ein schönes Deutschprachiges Buch?
              Zitat von hausl Beitrag anzeigen
              Übrigens:

              Retex ... RegTex ... Regtex
              Äh.. nö
              Kannst ja mal hier beginnen: http://regexp-evaluator.de/tutorial/

              Ansonsten ev. das hier (hatte ich mal angefangen zu lesen): http://www.amazon.de/Regul%C3%A4re-A...ausdr%C3%BCcke

              Meiner Meinung nach ist online alles vorhanden was man braucht, teilweise auch in deutsch und gut aufbauend aufbereitet.

              LG
              The string "()()" is not palindrom but the String "())(" is.

              Debugging: Finde DEINE Fehler selbst! | Gegen Probleme beim E-Mail-Versand | Sicheres Passwort-Hashing | Includes niemals ohne __DIR__
              PHP.de Wissenssammlung | Kein Support per PN

              Kommentar


              • #8
                Ein Link auf einen Duden bringt in für den Anfang vielleicht weiter ^^...
                [URL="https://github.com/chrisandchris"]GitHub.com - ChrisAndChris[/URL] - [URL="https://github.com/chrisandchris/symfony-rowmapper"]RowMapper und QueryBuilder für MySQL-Datenbanken[/URL]

                Kommentar

                Lädt...
                X