Je nachdem, ob auch ein Export als CSV notwenig ist, koentest Du auch darüber nachdenken, die Daten doch zu normalisieren und eine zusätzliche Importtabelle zu benutzen, die dann softwareseitig in die Normalform überführt wird. Eine entsprechende Überführung müsste man nach einem Import antriggern (weiss nicht, moeglicherweise iost das auch via DB Trigger moeglich) oder per CRON in einem zeitlichen Intervall (dann fehlen in der normalisierten Menge zeitweise einige Elemente).
Andere Moeglichlichkeit wäre, das CSV über PHP zu importieren und dort neue INSERT-Statements zu erzeugen.
Wie gesagt, Stemming koennte man mit einer Liste ebenfalls gestemmter Synonymwoerter ergänzen. WM wäre allerdings schon ein Extremfall, weil das Wort so kurz ist.
Allerdings ist es bei einem festen Vokabular (ein sog. Thesaurus) auch nicht ganz so dringlich mit der Wortstammreduzierung, da bei einem gut gepflegten Index kaum Doppelungen vorkommen sollten - doch eher Taggingprinzip.
Nachteilig ist das Verhältnis zur Suche.
Tags bietet man üblicherweise als Liste/Wolke an, so dass die Suche schon konkret ist. Eine Synonymsuche funktioniert nur so gut, wie der Wort- und Synonymindex ist. Deshalb mein Vorschlag des Stemmings: Hier werden sowohl von der Schlagwortmenge, als auch von den Suchwoertern einzig die Wortstämme gebildet und verglichen.
__________________ --
One pixel is still too big. Please make it smaller. ASAP. Initiative Mittelstand. Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
-- |