Ankündigung

Einklappen
Keine Ankündigung bisher.

UTF-8 Beitrag

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • hausl
    hat ein Thema erstellt UTF-8 Beitrag.

    UTF-8 Beitrag

    .. zur einfachen Verlinkung bei solchen Themen.

    Zusammenfassung, Analyse, Auflistung Lösungen: http://php-de.github.io/jumpto/utf-8/

    Feedback, PullRequests etc. gerne.

  • Arne Drews
    antwortet
    Ich denke, erwähnen kann man das durchaus, sollte aber darauf hinweisen, dass es keine 100%ige Garantie ist.

    Einen Kommentar schreiben:


  • hausl
    antwortet
    Zitat von hellbringer
    Es ist ja nur eine Zeile Code
    pro Datei. Darum geht es mir. Ich denke Leute die nach sowas fragen haben keine "saubere" Front-Controller-Applikation sondern viele Dateien in vielen Ordnern mit vielen includes von vielen HTML-PHP-Konstruken .. etc..

    In einer .htaccess im docroot wäre es nur eine Zeile ...

    Zitat von hellbringer
    Ich würde mich nicht auf eine Serverkonfiguration verlassen
    ... und explizit (sofern in den Files nichts steht was wieder übersteuert).

    Einen Kommentar schreiben:


  • hellbringer
    antwortet
    Zitat von hausl Beitrag anzeigen
    Ich würde da gerne hier noch (nach dem zweiten Punkt) die Möglichkeit ergänzen/erwähnen, UTF-8 als default angeben zu können,

    http://httpd.apache.org/docs/2.0/mod...defaultcharset

    https://www.w3.org/International/que...t.de#extension

    Gut? Oder spricht da was dagegen was mir gerade nicht einfällt.
    Ich würde mich nicht auf eine Serverkonfiguration verlassen, sondern die Kodierung immer explizit in der Anwendung setzen. Es ist ja nur eine Zeile Code und es tut nicht weh. Was spart man sich dadurch?

    Einen Kommentar schreiben:


  • hausl
    antwortet

    Ich würde da gerne hier noch (nach dem zweiten Punkt) die Möglichkeit ergänzen/erwähnen, UTF-8 als default angeben zu können,

    http://httpd.apache.org/docs/2.0/mod...defaultcharset

    https://www.w3.org/International/que...t.de#extension

    Gut? Oder spricht da was dagegen was mir gerade nicht einfällt.

    Donkschen!

    Einen Kommentar schreiben:


  • Arne Drews
    antwortet
    Dafür gibts aber dann iconv().

    Einen Kommentar schreiben:


  • drsoong
    antwortet
    Daten aus Fremdquellen müssen mittels utf8_encode() in UTF-8 überführt werden, wenn sie nicht als UTF-8 vorliegen (Datei, Windows-System, …).
    Hierzu fiel mir auf, dass die benannte Funktion lediglich ISO-8859-1 in UTF-8 überführt.

    Einen Kommentar schreiben:


  • fireweasel
    antwortet
    Zitat von rkr Beitrag anzeigen
    <ãrzte>Da ist ein Wort der Warnung angebracht: MySQL-Devs sind Schweine, traue Ihnen nicht ein Stück...</ãrzte>
    <hanlon>Never attribute to malice what you can explain by stupidity.</hanlon>
    Die lernen halt laufend dazu. Ich meine, hast du von Anfang an gewusst, was sich hinter "UTF-8" verbirgt? Siehste!

    PS: Wird für diesen Beitrag jetzt eigentlich GEMA fällig?
    Nur, wenn du ihn laut vorsingst.

    Zitat von jspit Beitrag anzeigen
    Ein Fremdwort mit 5 weiteren Fremdworten einem Einsteiger zu erklären bringt nix.
    BMP: Sammlung von Unicode-"Zeichen", die jeder vernünftige Web-Browser auf jedem halbwegs aktuellen Betriebssystem anzeigen kann (Android mit Einschränkungen).
    SMP: Zusätzliche Sammlung von Unicode-"Zeichen", die jede Web-Anwendung unterstützen sollte, wenn sie Apple-User (iOS) als Zielgruppe hat oder per WhatsApp lachende Scheißhaufen verschickt werden sollen.

    Einen Kommentar schreiben:


  • hausl
    antwortet
    Zitat von tkausl Beitrag anzeigen
    Situation 1, Mögliche Ursache:
    Sollte es nicht genau andersrum sein?
    Richtig.. danke für den Hinweis.

    Einen Kommentar schreiben:


  • jspit
    antwortet
    Wenn es um Bestellungen geht, kommt man um aktives Filtern nicht rum oder man haut das Formular den Nutzer um die Ohren. Hab es leider schon häufig erlebt, das im Vordruck zum Betreff für eine Überweisung Zeichen benutzt wurden, welche meine Bank zurückweist.
    ​Hättest du als Beispiel die DB für ein eigenes Fratzenbuch genannt, da muss dies selbstredend alles rein.

    Einen Kommentar schreiben:


  • rkr
    antwortet
    Zitat von jspit
    @rkr: So ein Firlefanz würde ich aus einem Bestellkommentar gnadenlos rausfiltern und das nicht zum Anlass nehmen, utf8mb4 zu nutzen.
    Naja, das Problem ist ja, dass du das wirklich aktiv filtern musst. Mysql verweigert die Annahme - nein, mysql tut, was man von mysql erwarten würde: es schneidet die Daten beim ersten Vorkommnis eines nicht unterstützen Zeichens einfach ab, was bei Xml-Dokumenten zu... naja, kaputten Xml-Dokumenten führen wird. <ãrzte>Da ist ein Wort der Warnung angebracht: MySQL-Devs sind Schweine, traue Ihnen nicht ein Stück...</ãrzte>

    PS: Wird für diesen Beitrag jetzt eigentlich GEMA fällig?

    Einen Kommentar schreiben:


  • jspit
    antwortet
    Oder kurz:
    Beachten Sie, dass MySQL unter „utf8“ nur die Zeichen der BMP (Basic Multilingual Plane U+0000..U+FFFF) versteht. Um auch die Zeichen aus höheren Unicode-Regionen verwenden zu können, muss „utf8mb4“ statt „utf8“ verwendet werden, was ab MySQL-Version 5.5.3 zur Verfügung steht.
    In vielen Tuts ist noch utf8_general_ci zu finden. Da das Wiki wohl für in erster Linie Einsteiger gedacht ist, sollte für eine Empfehlung für utf8_unicode_ci oder auch utf8mb4_unicode_ci ein einfach formulierter Hinweis zu den Unterschieden nicht fehlen. Ein Fremdwort mit 5 weiteren Fremdworten einem Einsteiger zu erklären bringt nix.

    @rkr: So ein Firlefanz würde ich aus einem Bestellkommentar gnadenlos rausfiltern und das nicht zum Anlass nehmen, utf8mb4 zu nutzen.

    Einen Kommentar schreiben:


  • rkr
    antwortet
    https://dev.mysql.com/doc/refman/5.5...e-utf8mb4.html

    Erst mit mb4 lassen sich Emojis darstellen. Und es gibt wirklich Leute, die solche Zeichen beispielsweise in Bestellkommentaren verwenden

    Einen Kommentar schreiben:


  • ChristianK
    antwortet
    Hast du gerade eine gute Referenz für den Unterschied unicode/bin/mb4? Dazu fand ich eben nichts...

    Einen Kommentar schreiben:


  • rkr
    antwortet
    Es wäre nett noch mal auf utf8mb4 einzugehen
    utf8_unicode_ci ist nämlich aktuell nicht der beste Griff...

    Einen Kommentar schreiben:

Lädt...
X