Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] html tags filtern mit regex

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] html tags filtern mit regex

    hallo zusammen,
    sitze jetzt schon einige stunden vor regex-turtorials.

    mein problem:
    ich möchte gerne aus einer html-datei
    alle html-tags herausfiltern.

    ich dachte:
    Code:
    [^<]
    ist schonmal en guter anfang. dann bin ich mir nicht sicher, wo
    ich reinschreiben soll, welche, wieviele zeichen folgen dürfen:

    Code:
    [^<]+[^[:print]]+[^>]+
    so in etwa dachte ich. funktioniert nur leider nicht.
    kann mir vielleicht jmd helfen, wäre super.

    eine kleine erweiterung solls dann später geben.
    in diesem reinen text dann, soll nach einemn bestimmten string gesucht werden und dieser dann, jetzt mit einem html-tag, ergänzt werden.

    Code:
    ([^<]+[^[:print]]+[^>]+)(gesuchter string)(ersetzen mit "gesuchter string" und was drumherum)
    hab das mit diesen backreferences nicht ganz drauf.
    kann mir vielleicht auch jmd literatur empfehlen, finde das thema nämlich
    irgendwie faszinierend ...

    vielen dank
    und grüße
    tim

  • #2
    mein problem:
    ich möchte gerne aus einer html-datei
    alle html-tags herausfiltern.
    Im Profi-Forum posten, und die Suche nicht benutzen

    EDIT:
    http://www.phpfriend.de/forum/ftopic21431.html

    Kommentar


    • #3
      wie wärs mit strip_tags()
      :arrow: [URL="http://tiny.cc/0xlvv"]Wie man Fragen richtig stellt[/URL]

      Kommentar


      • #4
        verzeihung, ich wollt hier niemandem zu nahe treten
        und schon gar nicht mit banal einfachen fragen belästigen.

        nur dachte ich, dass regex-ausdrücke profis nicht unterfordern.

        die suche habe ich genutzt, nur leider mit den informationen nicht
        viel anfangen können, speziell für meinen fall.

        vielleicht habe ich auch etwas überlsen.

        das ist für profis natürlich einfacher, deswegen wäre ich dankbar
        für einen link, den ich übersehen habe.

        ich poste einfach nochmal bei den fortgeschrittenen !

        Kommentar


        • #5
          nur dachte ich, dass regex-ausdrücke profis nicht unterfordern.
          Nö, machen sie auch nicht, aber strip_tags() kennen auch schon Anfänger
          Obwohl es dafür auch ein RegExp gibt, was aber sinnlos wäre.

          Kommentar


          • #6
            danke für die antwort, dsmcg.

            die lösung muss sehr performant sein, denn
            es handelt sich um ca. 500 html seiten.

            d.h. das ignorieren der html-tags, das finden eines strings
            und letzlich das ergänzen dieses strings muss alles mit einem
            preg_match-aufruf passieren.

            danach wirds dann flux zurück in die db geschrieben

            danke nochmal,
            grüße
            tim

            Kommentar


            • #7
              Zitat von CIX88
              Nö, machen sie auch nicht, aber strip_tags() kennen auch schon Anfänger
              das heist dann wohl ich bin Anfänger =(

              ACHTUNG: IRONIE!
              :arrow: [URL="http://tiny.cc/0xlvv"]Wie man Fragen richtig stellt[/URL]

              Kommentar


              • #8
                hmmmmmmmmmmmmmmmm,

                nochmal:

                Den Befehl strip_tags() kennen auch schon Anfänger.
                Ist praktisch der Urschleim wenn man mit PHP anfängt.
                Wenn jemand hier im bei Profi fragt, wie man HTML-Tags entfernt, dann ist das schon recht hart.

                Kommentar


                • #9
                  nein,
                  der rückgabetyp ist der gesäuberte string !!!

                  den müsste ich jetzt ja nochmal nach der eigentlichen "needle" durchsuchen,
                  um dann den original irgendwie zu verändern.

                  nein, zu redundant.

                  bitte nur eine regex lösung zum ignorieren von von html-tags.
                  den rest versuch ich dann allein.

                  danke,
                  grüße
                  tim

                  Kommentar


                  • #10
                    dclp-faq ... gähn...

                    8.11. Wie ersetze ich in einem Text, jedoch nicht innerhalb von HTML-Tags?
                    http://www.php-faq.de/q/q-regexp-ersetzen.html

                    Basti

                    Kommentar


                    • #11
                      ach komm, die trabbifahrer hier
                      hams echt nich drauf.

                      warum verbringt ihr eure freizeit in foren,
                      wenn ihr auf die leute, die infos suchen, dumm runterschaut.

                      bravo.

                      achja: danke basti.

                      und für die anderen profis war das jetzt nicht drin oder wie!?

                      Kommentar


                      • #12
                        Hi.

                        Das ist einfach das alte Problem der Forenaufteilung hier. Es ist eigentlich so gedacht, dass eben im Profi-Forum nur diejenigen Posten, die sich für Profis halten und es nicht so ist, dass im Profi-Forum lauter Profis rumhängen, an die man sich eben wendet, wenn man schnell eine kompetente Antwort auf jede beliebige Frage will. Das Ganze steht dann in einem festgepappten Thread im Profi-Forum, den aber eh niemand liest, bevor er hier postet. Auch im Untertitel des Forums ist das angedeutet, aber auch dort wird diese Idee einfach andauernd übersehen.

                        In sofern ist in meinen Augen swohl die grantige Reaktion irgendwo verständlich, wie auch eben die Tatsache, dass hier Leute "falsch" rein-posten.

                        Das ist meiner Meinung nach einfach ein Problem der Aufteilung bzw. wenn man es denn nun unbedingt so haben will (und das ist nunmal so entschieden worden - von wem auch immer), der ausreichenden Bekanntgabe, wie das gemeint ist.

                        Die Leute schaun einfach mit unteschiedlichen Erwartungen hier rein und dann gibt es Konflikte.

                        Ich finde es auch irgendwie nervig, wenn im Profi-Forum eine Frage gestellt wird, die sich 1:1 in der dclp-faq findet und geb dem auch Ausdruck, aber geschickter wäre es wahrscheinlich, einfach zu akzeptieren, dass eben viele hier reischreiben, die sich nicht für Profis halten (ich halte mich auch nicht für einen und hab hier glaub ich auch noch nie einen Thread eröffnet), sondern nur die Idee das Forums missverstanden haben, vielleicht sogar missverstehen mussten, da die Hinweise ja offensichtlich nicht ausreichend "funktionieren".

                        Basti

                        Kommentar

                        Lädt...
                        X