Hallo!
ich hoffe, dass ich hier im richten Unterforum gelandet bin
Ich habe mit einem Kumpel ein Freewebhosting laufen, das auch relativ erfolgreich und ich hab viel selbst geschrieben dafür (Setze mal keinen Link, damit es nicht heißt, ich möchte nur Werbung machen
)
Jetzt wollen wir unseren Kunden die Möglichkeit geben innerhalb der Kundenwebsites zu suchen (also eine Art Suchmaschine intern).
Dafür wollen wir via PHP automatisiert die Websites in Themengebiete einteilen und taggen lassen.
Hier überlege ich gerade nach einem Konzept.
Meine Idee ist, dass ich nach dem bekannten Konzept natürlich Links crawle und verfolge, solange diese intern sind. Jede Website würde ich nach Stichworten durchsuchen, die ich vorher Themengebieten zuordne.
zB PHP -> Entwicklung, Nudeln -> Essen/Rezepte, und so weiter.
Dann würde ich schauen, in welchem Verhältnis die Wörter stehen und die Kategorie, wo die meisten Wörter sind im Verhältnis zur Gesamtanzahl, die würde es dann werden.
Habt ihr da eventuell andere Ansätze?
Gruß.
solar22
ich hoffe, dass ich hier im richten Unterforum gelandet bin
Ich habe mit einem Kumpel ein Freewebhosting laufen, das auch relativ erfolgreich und ich hab viel selbst geschrieben dafür (Setze mal keinen Link, damit es nicht heißt, ich möchte nur Werbung machen
)Jetzt wollen wir unseren Kunden die Möglichkeit geben innerhalb der Kundenwebsites zu suchen (also eine Art Suchmaschine intern).
Dafür wollen wir via PHP automatisiert die Websites in Themengebiete einteilen und taggen lassen.
Hier überlege ich gerade nach einem Konzept.
Meine Idee ist, dass ich nach dem bekannten Konzept natürlich Links crawle und verfolge, solange diese intern sind. Jede Website würde ich nach Stichworten durchsuchen, die ich vorher Themengebieten zuordne.
zB PHP -> Entwicklung, Nudeln -> Essen/Rezepte, und so weiter.
Dann würde ich schauen, in welchem Verhältnis die Wörter stehen und die Kategorie, wo die meisten Wörter sind im Verhältnis zur Gesamtanzahl, die würde es dann werden.
Habt ihr da eventuell andere Ansätze?
Gruß.
solar22

Kommentar