Ankündigung

Einklappen
Keine Ankündigung bisher.

Habe bei rss feed trotz <meta charset="utf-8"> komische Zeichen

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Habe bei rss feed trotz <meta charset="utf-8"> komische Zeichen

    Habe mir ein Rss reader aus den Netzt gesucht der ganz normal den Rss feed auslesen tut. Hat jetzt auch keine besonderen Funktionen oder so.
    Es funktioniert ja auch so weit , doch im Endergebniss sind alle . ä,ü,ö und ß nur noch ���
    Habe <meta charset="utf-8"> im Document mit im <head> Stehen.
    .Der originale Rss wo es ausgelesen wird hat keine komischen Zeichen,also müßen die Zeichen wohl irgendwo von mir da rein kommen.
    Nur was kann man noch machen außer utf-8 zu nutzen.
    Hat da jemand noch nee Idee ?
    Ich mach keine Rechtschreibfehler - ich schreib Freestyle!
    Erreichbar in mein Javascript-Forum und in Facebook-Chat

  • #2
    Du musst auch UTF-8 ausgeben und nicht nur im Header setzen. Davon abgesehen sollte auch im HTTP-Header die richtige Zeichenkodierung angegeben werden.

    Kommentar


    • #3
      Zitat von hellbringer Beitrag anzeigen
      Davon abgesehen sollte auch im HTTP-Header die richtige Zeichenkodierung angegeben werden.
      ??Was ist den daran falsch ? Hier steht das so und hat bis jetzt auch immer geklappt.
      https://wiki.selfhtml.org/wiki/Zeich...g/Webdokumente

      Zitat von hellbringer Beitrag anzeigen
      Du musst auch UTF-8 ausgeben
      Wie macht man das.Bis jetzt hatte ich nie probeme damit.
      Ich mach keine Rechtschreibfehler - ich schreib Freestyle!
      Erreichbar in mein Javascript-Forum und in Facebook-Chat

      Kommentar


      • #4
        Zitat von hellbringer Beitrag anzeigen
        Du musst auch UTF-8 ausgeben und nicht nur im Header setzen. Davon abgesehen sollte auch im HTTP-Header die richtige Zeichenkodierung angegeben werden.
        Ok mit utf8_encode() geht es
        Ich mach keine Rechtschreibfehler - ich schreib Freestyle!
        Erreichbar in mein Javascript-Forum und in Facebook-Chat

        Kommentar


        • #5
          Zitat von basti1012 Beitrag anzeigen

          Ok mit utf8_encode() geht es
          utf8_encode() konvertiert ISO-8859-1 in UTF-8. Bist du sicher, dass die Daten als ISO-8859-1 vorliegen? Dieser uralte Zeichensatz enthält nicht mal das €-Zeichen.

          Kommentar


          • #6
            Zitat von hellbringer Beitrag anzeigen

            utf8_encode() konvertiert ISO-8859-1 in UTF-8. Bist du sicher, dass die Daten als ISO-8859-1 vorliegen?
            Wie kann ich das rausfinden ? In der xml Datei kann ich davon nix finden. und wie gesagt mit utf8_encode() sind die Zeichen alle weg . Das rss feed hat zumindest neue sachen drinne stehen die 1-2 Wochen alt sind und die Homepage sieht auch nicht gerade sehr alt aus. Das sie dann einen uralten Zeichensatz verwenden kann ich mir jetzt nicht vorstellen.

            Ich mach keine Rechtschreibfehler - ich schreib Freestyle!
            Erreichbar in mein Javascript-Forum und in Facebook-Chat

            Kommentar


            • #7
              Zitat von basti1012 Beitrag anzeigen

              Wie kann ich das rausfinden ?
              PHP-Code:
              mb_detect_order('ASCII, UTF-8, ISO-8859-1');
              var_dump(mb_detect_encoding($deinString)); 
              sorry, shift-taste kaputt

              Kommentar


              • #8
                Zitat von basti1012 Beitrag anzeigen
                ... und wie gesagt mit utf8_encode() sind die Zeichen alle weg ...
                Dann schau doch mal ins Handuch zu utf8_encode, dort steht ein wichtiger Hinweis.

                Verwende als Ausgangskodierung Windows-1252 und als Zielkodierung UTF8 mit der Funktion mb_convert_encoding.

                Kommentar


                • #9
                  Wenn man alle relevanten Aspekte berücksichtig, sind utf8-Funktionen überflüssig.
                  https://www.php-rocks.de/thema/98-di...schw-rung.html
                  Competence-Center -> Enjoy the Informatrix
                  PHProcks!Einsteiger freundliche TutorialsPreComposed Packages

                  Kommentar


                  • #10
                    Arne Drews
                    Was machst du denn mit einer XML Datei die du von einem Anbieter erhältst wo die erste Zeile schon so
                    HTML-Code:
                    <?xml version='1.0' encoding='windows-1252' standalone='yes'?>
                    beginnt?

                    Eigentlich sollten XML Dateien immer in UTF-8 daherkommen, eigentlich.
                    Wenn aber die XML-Datei von einem Windows Programm erstellt wird sieht die Sache oft ganz anders aus.
                    Eine Konvertierung zu UTF-8 scheint mir dann der einfachste Weg zu sein.

                    Kommentar


                    • #11
                      In so einem Fall ja, wir reden hier aber von einem RSS Feed, also nicht zwingend Windows als Basis dahinter.
                      Selbst wenn, würde ich die Datei einen Prozessschritt zuvor in UTF8 umschreiben und dann wie gewohnt weiter verarbeiten.
                      Aber das hat denke ich nichts mit der eigentlichen Frage hier zu tun.
                      Competence-Center -> Enjoy the Informatrix
                      PHProcks!Einsteiger freundliche TutorialsPreComposed Packages

                      Kommentar

                      Lädt...
                      X