Ich habe eine Variable $text die den Text einer Webseite (mit Satz- und Sonderzeichen, ohne HTML-Tags und -Entities) enthält. Ich möchte nun die $n häufigsten Schlüsselwörter extrahieren und als Array ausgeben.
Stopwörter sollen nach Möglichkeit raus, es reicht aber, wenn einfach alle Wörter kürzer als z. B. 5 Zeichen rausfallen.
Das ganze muss nicht besonders schön sein, quick-and-dirty reicht
Ich habe jetzt so lange daran rumprobiert, dass ich völlig den Überblick verloren habe, allerdings brauche ich die Funktion dringend ... Evtl. kann von Euch jemand weiterhelfen?
Vincent
Stopwörter sollen nach Möglichkeit raus, es reicht aber, wenn einfach alle Wörter kürzer als z. B. 5 Zeichen rausfallen.
Das ganze muss nicht besonders schön sein, quick-and-dirty reicht

Ich habe jetzt so lange daran rumprobiert, dass ich völlig den Überblick verloren habe, allerdings brauche ich die Funktion dringend ... Evtl. kann von Euch jemand weiterhelfen?
Vincent
Kommentar