php.de

Zurück   php.de > php.de Intern > Off-Topic Diskussionen

Off-Topic Diskussionen Mach mal Pause vom Programmieren!

Antwort
 
LinkBack Themen-Optionen Thema bewerten
Alt 24.10.2011, 13:30  
Neuer Benutzer
 
Registriert seit: 31.10.2009
Beiträge: 13
PHP-Kenntnisse:
Fortgeschritten
solar22 befindet sich auf einem aufstrebenden Ast
Standard Konzept: Websites thematisch ordnen

Hallo!
ich hoffe, dass ich hier im richten Unterforum gelandet bin
Ich habe mit einem Kumpel ein Freewebhosting laufen, das auch relativ erfolgreich und ich hab viel selbst geschrieben dafür (Setze mal keinen Link, damit es nicht heißt, ich möchte nur Werbung machen )
Jetzt wollen wir unseren Kunden die Möglichkeit geben innerhalb der Kundenwebsites zu suchen (also eine Art Suchmaschine intern).
Dafür wollen wir via PHP automatisiert die Websites in Themengebiete einteilen und taggen lassen.
Hier überlege ich gerade nach einem Konzept.
Meine Idee ist, dass ich nach dem bekannten Konzept natürlich Links crawle und verfolge, solange diese intern sind. Jede Website würde ich nach Stichworten durchsuchen, die ich vorher Themengebieten zuordne.
zB PHP -> Entwicklung, Nudeln -> Essen/Rezepte, und so weiter.
Dann würde ich schauen, in welchem Verhältnis die Wörter stehen und die Kategorie, wo die meisten Wörter sind im Verhältnis zur Gesamtanzahl, die würde es dann werden.
Habt ihr da eventuell andere Ansätze?

Gruß.
solar22
solar22 ist offline   Mit Zitat antworten
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 24.10.2011, 13:36  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 35.987
PHP-Kenntnisse:
Fortgeschritten
nikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunft
Standard

Zitat:
ich hoffe, dass ich hier im richten Unterforum gelandet bin
Nein, bist Du nicht.

Inserate, Konzepte und Meinungsumfragen

[MOD: verschoben]
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist offline   Mit Zitat antworten
Alt 24.10.2011, 13:44  
Neuer Benutzer
 
Registriert seit: 31.10.2009
Beiträge: 13
PHP-Kenntnisse:
Fortgeschritten
solar22 befindet sich auf einem aufstrebenden Ast
Standard

Zu dem von dir verlinkten Thema http://www.php.de/php-einsteiger/675...sumfragen.html (Inserate, Konzepte und Meinungsumfragen)
Ich suche niemanden, der mir das macht, ich möchte nur wissen, ob jemand evtl. einen anderen Ansatz hat spontan oder nicht ^^ Eine Art spontanes Brainstorming, bevor ich heute Abend mich an meinen Ansatz setze

Gruß.
solar22
solar22 ist offline   Mit Zitat antworten
Alt 24.10.2011, 14:00  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 35.987
PHP-Kenntnisse:
Fortgeschritten
nikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunft
Standard

Deswegen hab ichs auch nach OT verschoben und nicht getrasht. Grundlegend gilt trotzdem, dass dies keine Frage zur Entwicklung ist, sondern eine Konzeptdiskussion, die das fachliche Niveau für den Softwaredesign-Thread nicht erreicht. Denn ganz ehrlich - so ausgefeilt ist ja Dein dargelegter Lösungsansatz nicht.
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist offline   Mit Zitat antworten
Alt 24.10.2011, 14:06  
Erfahrener Benutzer
 
Benutzerbild von mermshaus
 
Registriert seit: 14.06.2009
Beiträge: 1.729
PHP-Kenntnisse:
Fortgeschritten
mermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz sein
Standard

Das Problem liegt hier:

Zitat:
Jede Website würde ich nach Stichworten durchsuchen, die ich vorher Themengebieten zuordne.
Es gibt eine ganze Menge Dinge.

Kannst du den Nutzern nicht ein Interface zur Verfügung stellen, in dem sie ihre Seite selbst kategorisieren können? Das wird allemal exakter.
__________________
Blog | Buch | Kaloa
mermshaus ist gerade online   Mit Zitat antworten
Alt 24.10.2011, 14:23  
Neuer Benutzer
 
Registriert seit: 31.10.2009
Beiträge: 13
PHP-Kenntnisse:
Fortgeschritten
solar22 befindet sich auf einem aufstrebenden Ast
Standard

Die Idee dahinter ist, den Nutzern bereits 1-2 Kategorievorschlägen zu geben.
Ich mein, wenn eh einmal die Seite gecrawlt wird, kann man diesen Vorgang ja zur Contenterkennung gleich nutzen.

@nikosch: Ja, stimmt Ausgefeilt ist es nicht, aber soll es noch werden
solar22 ist offline   Mit Zitat antworten
Alt 24.10.2011, 14:46  
Erfahrener Benutzer
 
Benutzerbild von mermshaus
 
Registriert seit: 14.06.2009
Beiträge: 1.729
PHP-Kenntnisse:
Fortgeschritten
mermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz seinmermshaus kann auf vieles stolz sein
Standard

Das klingt so einfach bei dir.

Hast du denn eine Taxonomie deutscher Begriffe bereits vorliegen, die du nutzen kannst? (Ich weiß ehrlich gesagt nicht, ob man sowas kostenlos im Web findet.)

Ich finde das Thema durchaus spannend. Aber ich befürchte, dass das sehr viel Arbeit werden kann für einen eher zweifelhaften oder zumindest geringen Nutzen.
__________________
Blog | Buch | Kaloa

Geändert von mermshaus (24.10.2011 um 15:46 Uhr). Grund: Typo
mermshaus ist gerade online   Mit Zitat antworten
Alt 24.10.2011, 15:37  
Neuer Benutzer
 
Registriert seit: 31.10.2009
Beiträge: 13
PHP-Kenntnisse:
Fortgeschritten
solar22 befindet sich auf einem aufstrebenden Ast
Standard

Es geht mir ersteinmal nur um die Erarbeitung der PHP Funktion als solcher anhand ein paar Beispiellisten.
Wenn das ganze wirklich so funktioniert, wie ich mir das vorstelle könnte man durchaus ein paar Listen erstellen. Ich denke da wird sich sicher was finden lassen, auch wenn man evtl ein wenig dafür zahlen muss.
Der Nutzen: nun, man könnte damit auch Websites ausfindig machen, wie Themen behandeln, die man nicht auf dem eigenen Server haben möchte und dem Administrator eine Mail zukommen lassen mit einer Warnung zur Prüfung des Inhaltes.
solar22 ist offline   Mit Zitat antworten
Alt 24.10.2011, 16:08  
Erfahrener Benutzer
 
Registriert seit: 07.07.2010
Beiträge: 231
PHP-Kenntnisse:
Anfänger
mentalman ist ein sehr geschätzer Menschmentalman ist ein sehr geschätzer Menschmentalman ist ein sehr geschätzer Mensch
Standard

Warum wollt ihr denn die Suche in Themengebiete einteilen?
Ich finde es immer nervig, wenn ich vorher ein Themengebiet auswählen muss, in dem gesucht wird. Und wenn es die Möglichkeit gibt, auch ohne Themenvorgabe zu suchen, dann mache ich das.

Ich habe vor Kurzem selber mal mit sowas herumexperimentiert, also eine kleine Anfängersuche gebastelt, die auch funktioniert hat.

Dabei wurde eine Website komplett eingelesen, alle Wörter einer zuvor definierten Blacklist herausgefiltert, und die restlichen Wörter mit Angabe ihrer URL in eine DB geschrieben, also immer Seitenweise.
Hinzu kamen dann auch noch die vorher ausgelesenen Keywords.

Wenn ich dann nach einem Wort gesucht habe, wurden mir die passenden URL's ausgespuckt.
Alles stark verbesserungsfähig, klar.
Aber für den Anfang, um gewisse Prinzipien zu verstehen und überhaupt mal einzusteigen, war das schon ganz interessant.

Zum Beispiel lernt man dann, dass man nicht einfach so mal schnell eine komplette Seite mit allen Unterseiten crawlen kann, weil dann nämlich, je nach Anzahl der Unterseiten, plötzlich ein Server-Error aufploppt und die Seite nicht mehr erreichbar ist...
__________________
Da ist schon wieder dieses Wort 'stark'... Warum ist in der Zukunft alles 'stark'? Hängt das irgendwie mit Veränderungen in der Erde zusammen?
mentalman ist offline   Mit Zitat antworten
Alt 24.10.2011, 16:45  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 35.987
PHP-Kenntnisse:
Fortgeschritten
nikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunft
Standard

Zitat:
Der Nutzen: nun, man könnte damit auch Websites ausfindig machen, wie Themen behandeln, die man nicht auf dem eigenen Server haben möchte
Na hoffentlich hältst DU Dich dann auch an die robots.txt…
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist offline   Mit Zitat antworten
Antwort


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
[Erledigt] Framework Kernel Konzept Geryon Software-Design 36 06.10.2010 22:23
[Erledigt] Erstelle günstig Websites (Privat) KerS Freizeit 8 24.09.2010 11:35
Konzept einer Datenbankabstraktion Dark Guardian Software-Design 29 30.01.2010 18:13
[Erledigt] Koordinatensystem Ordnen roest Datenbanken 3 22.01.2010 16:45
[Erledigt] Konzept für einen PHP Web Crawler Dark Guardian Software-Design 10 23.11.2009 16:31
APC bei mehreren Websites Elliot PHP-Fortgeschrittene 5 02.02.2008 01:10
ordnen eines arrays PHP Tipps 2005-2 4 28.09.2005 07:13
datum nach tagen ordnen PHP Tipps 2005 3 06.05.2005 08:49

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
ordnen von websites, website thematisch

Alle Zeitangaben in WEZ +2. Es ist jetzt 17:26 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum