Hallo,
ich möchte gerne einen Text algorithmisch auswerten lassen und Wortketten, die im Text vorkommen zählen und die jeweilige Häufigkeit ermitteln.
zum Beispiel, Ausgangstext:
das hier ist ein beispielstext. ein beispielstext kann verschiedene wörter enthalten.
Ergebnis:
"ein beispieltext" - 2x im Text enthalten.
Um die Häufigkeit einzelner Wörter zu zählen würde ich nach Leerzeichen ein explode durchführen und dann mittels verschiedener Array Funktionen sortieren und zählen. Wie gehe ich aber für 2...n wortstücke vor um auch effezient zu zählen? Mir fehlt komplett der Ansatz
Vielleicht hat jemand ja schon mal ähnliches umgesetzt - bin für jegliche Hilfe dankbar!
ich möchte gerne einen Text algorithmisch auswerten lassen und Wortketten, die im Text vorkommen zählen und die jeweilige Häufigkeit ermitteln.
zum Beispiel, Ausgangstext:
das hier ist ein beispielstext. ein beispielstext kann verschiedene wörter enthalten.
Ergebnis:
"ein beispieltext" - 2x im Text enthalten.
Um die Häufigkeit einzelner Wörter zu zählen würde ich nach Leerzeichen ein explode durchführen und dann mittels verschiedener Array Funktionen sortieren und zählen. Wie gehe ich aber für 2...n wortstücke vor um auch effezient zu zählen? Mir fehlt komplett der Ansatz
Vielleicht hat jemand ja schon mal ähnliches umgesetzt - bin für jegliche Hilfe dankbar!
Kommentar