Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] Das war bislang kein PHP-Problem - Silbentrennung

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] Das war bislang kein PHP-Problem - Silbentrennung

    Hintergrund für diesen Post ist diese Diskussion, wo gleich drei Benutzer zum Ergebnis kommen, dass die Silbentrennung kein PHP-Problem ist.

    Sachstand HTML bietet für die Worttrennung eine elegante Lösung mit dem & shy ; an, wodurch die Worttrennung vom Browser erledigt wird und zwar je nach Bedarf. Gegenüber einer harten Tren-nung hat das den Vorteil, dass die Trennung nur im Bedarfsfall ersichtlich ist und erfolgt und gegenüber word-wrap (CSS) bietet die Lösung mittels HTML den Vorteil, dass nicht stupide umgebrochen wird, sondern auch das in der deutschen Rechtschreibung geforderte Trennzeichen gesetzt wird.

    In Javascript scheint es bereits eine Lösung für die automatische Worttrennung zu geben, in PHP gibt es so etwas - berücksichtigt man obig verlinkte Diskussion - anscheinend bislang nicht.

    Ansatz: Meine Überlegung ist eine eigene Klasse zu schreiben, die das im Deutschen auch erledigt und ein deutsches Wort in seine Bestandteile zerlegt und mit dem HTML-Trenner versieht.

    Bedarf So eine Klasse könnte in Blogs, auf Websiten usw. zum Einsatz kommen und dürfte m. E. brauchbar sein.

    Und jetzt? Mich würde interessieren, ob es dazu Feedback gibt, ob so etwas mit PHP schon mal versucht wurde und es fertige Ansätze gibt.

    Ich denke, dass die Kernfunktionalität zu schreiben, unproblematisch sein dürfte. Einige Probleme wird man sicher bis Version 1.0 nicht ausschalten können (v. a. Fremd- und Lehnwörter), dennoch dürfte eine erste Version bereits brauchbar sein. Jemand Interesse hier ggf. mitzuwirken???
    Zur Bewertung von Benutzerbeiträgen > Adblock Plus installieren und die Bewertungsbausteine einmal mit der rechten Maustaste anklicken und im Kontextmenü "Element blockieren" wählen. Entspannt die Benutzung dieses Forums hier ungemein.


  • #2
    Könnte es schon geben > phpHyphenator. Lese mich gerade durch den Quelltext...
    Zur Bewertung von Benutzerbeiträgen > Adblock Plus installieren und die Bewertungsbausteine einmal mit der rechten Maustaste anklicken und im Kontextmenü "Element blockieren" wählen. Entspannt die Benutzung dieses Forums hier ungemein.

    Kommentar


    • #3
      http://de.wikipedia.org/wiki/Worttre...g_im_Deutschen
      Die orthografische Worttrennung in der deutschen Sprache beruht auf Wortbestandteilen, (Sprech-)Silben, grafischen und ästhetischen Eigenschaften. Die reformierten Regeln werden im Artikel neue deutsche Rechtschreibung dargestellt.

      Gelegentlich begegnet man sinnentstellenden Trennungen, die meist von automatischen Rechtschreibprüfungen textbearbeitender Programme herrühren wie beispielsweise Fluch-torte (richtig: Flucht-orte), Türk-linke (richtig: Tür-klinke). Die Ursache dafür ist der falsche Abgleich mit Morphemen, die im vorinstallierten Wörterbuch enthalten sind. Abhilfe kann nur durch manuelle Korrektur der Trennausnahmen im Programm oder Erweiterung des installierten Wörterbuchs bewerkstelligt werden.
      Mehr braucht man eigentlich nicht sagen.
      --

      „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
      Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


      --

      Kommentar


      • #4
        Mehr braucht man eigentlich nicht sagen.
        Leider doch. Ich hab mich noch nicht vertiefend eingelesen, aber wenn man es auf Regeln runter brechen kann, dann vielleicht schon. Letztlich geht es um die Optimierung eines Algorithmus zur Verarbeitung von Strings und die Kopplung von Regeln und Mustern.

        Warum das aus deiner Sicht uninteressant sein sollte, das Problem zu lösen, erschließt sich mir nicht unbedingt. Einziger Punkt aus meiner Sicht ist, dass es bereits viele Ansätze mittels PHP gibt - ich habe Google mal bemüht, wobei ich noch nicht abschätzen kann, ob alle auf ein oder zwei Skripte verweisen oder einfach nur immer einen ähnlichen Namen für ihre Software nutzen.

        Mal per Hand

        - Zahl der Vokale: 3 => 3 Silben

        - Fluch | t | ort | e

        - Flucht, aber Fluch | ten

        Ein PC-Programm versteht das Wort nicht, weshalb der Algorithmus optimiert werden muss und ggf. solche Wörter dem Benutzer noch mal vorlegen müsste.

        In meinem Umfeld kenne ich eine Art Blogsystem, wo regelmäßig Texte eingespeist werden und anschließend dauerhaft zugänglich sind. Wenn so ein Skript im Hintergrund liefe - nicht bei jedem Aufruf - und die eingespeisten Texte vernünftig für die Datenbank zurichtet, dann wäre hier m. E. ein Fortschritt erzielt.

        Wenn der Prozess schon einmal halbautomatisch ablaufen würde und die Standardfälle erledigen und über den Rest den Benutzer informieren würde, würde ich das für einen Fortschritt halten und dass das Deutsche viele Standardfälle bietet, sollten wir nicht ignorieren:

        Som | mer

        vor | kom | men

        hal | ten

        ge | ben

        ha | ben

        usw. usf.
        Zur Bewertung von Benutzerbeiträgen > Adblock Plus installieren und die Bewertungsbausteine einmal mit der rechten Maustaste anklicken und im Kontextmenü "Element blockieren" wählen. Entspannt die Benutzung dieses Forums hier ungemein.

        Kommentar


        • #5
          Ehrlich gesagt finde ich das Prinzip in weiten Teilen überflüssig. Die verlinkten Beispiele benutzen nun auch unnötigerweise noch einen Blocksatz, aber in einem gescheiten lesbaren Kontext bietet sich nun doch eher der Flattersatz an und dort ist eine Abtrennung von manchmal 2 oder 3 Buchstaben nur selten sinnvoll. Lange Worte sehe ich ein, aber die kann man ja auch bei der Eingabe mit wenigen shy's entschärfen. Das Problem war bisher eher die nicht vollständige Browserunterstützung von shy.

          Mal per Hand

          - Zahl der Vokale: 3 => 3 Silben

          - Fluch | t | ort | e

          - Flucht, aber Fluch | ten
          Keine Ahnung, was mir das jetzt sagen soll. Faktisch gibt es sowohl die Worte „Flucht“ und „Ort“, als auch „Fluch“ und „Torte“ im Deutschen. Vermutlich gibt es sogar Wörter, die je nach Kontext andere Bedeutung und womöglich dementsprechend andere Trennschreibung besitzen. Mir fällt konkret kein Beispiel ein, aber „beinhalten“ und Co deuten ja die Sachlage schon an.
          --

          „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
          Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


          --

          Kommentar


          • #6
            Das Problem wird auf den Benutzer und d. h. an den Browser und die Rechenleistung des Benutzers durchgereicht (Link). Läuft im Firefox bereits tadellos - so weit ich das mit einem flüchtigen Blick beurteilen konnte - und wird von Chrome noch nicht unterstützt. Damit ist das Thema beendet.

            Ehrlich gesagt finde ich aber ganz erheblich und ärgerlich, dass du offenbar Forenbeiträge nachträglich ändern kannst, ohne dass das vom Forum mit einem Arbeitsvermerk ("Geändert von ... (Heute um ...). Grund: ...") quittiert ist, was ich behutsam formuliert für eine mittlere Katastrophe halte. Ich erspare mir hier mal Kraftausdrücke.
            Zur Bewertung von Benutzerbeiträgen > Adblock Plus installieren und die Bewertungsbausteine einmal mit der rechten Maustaste anklicken und im Kontextmenü "Element blockieren" wählen. Entspannt die Benutzung dieses Forums hier ungemein.

            Kommentar


            • #7
              Wodrauf willst du mit diesem Thread eigentlich hinaus.

              Ob hier Threads bearbeitet werden können ohne Hinweis oder nicht ist mir ziemlich Schnuppe. Vlt. liegts auch nur daran das nikosch ein Moderator ist und deswegen kein Hinweis erscheint.

              Kommentar


              • #8
                Ehrlich gesagt finde ich aber ganz erheblich und ärgerlich, dass du offenbar Forenbeiträge nachträglich ändern kannst, ohne dass das vom Forum mit einem Arbeitsvermerk ("Geändert von ... (Heute um ...). Grund: ...") quittiert ist, was ich behutsam formuliert für eine mittlere Katastrophe halte. Ich erspare mir hier mal Kraftausdrücke.
                Besser ist das. Ich kanns nämlich nichjt ändern. Zudem habe ich den Beitrag nur ergänzt.
                --

                „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
                Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


                --

                Kommentar


                • #9
                  Ich glaub ich hab endlich jemanden für meine Ignorier-Liste gefunden.. O_o
                  [URL="https://gitter.im/php-de/chat?utm_source=share-link&utm_medium=link&utm_campaign=share-link"]PHP.de Gitter.im Chat[/URL] - [URL="https://raindrop.io/user/32178"]Meine öffentlichen Bookmarks[/URL] ← Ich habe dir geholfen ? [B][URL="https://www.amazon.de/gp/wishlist/348FHGUZWTNL0"]Beschenk mich[/URL][/B].

                  Kommentar


                  • #10
                    Jetzt wo halskrause endlich weg ist, wa?
                    --

                    „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
                    Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


                    --

                    Kommentar


                    • #11
                      Zitat von nikosch Beitrag anzeigen
                      Jetzt wo halskrause endlich weg ist, wa?
                      [URL="https://gitter.im/php-de/chat?utm_source=share-link&utm_medium=link&utm_campaign=share-link"]PHP.de Gitter.im Chat[/URL] - [URL="https://raindrop.io/user/32178"]Meine öffentlichen Bookmarks[/URL] ← Ich habe dir geholfen ? [B][URL="https://www.amazon.de/gp/wishlist/348FHGUZWTNL0"]Beschenk mich[/URL][/B].

                      Kommentar

                      Lädt...
                      X