php.de

Zurück   php.de > Webentwicklung > PHP Einsteiger > PHP Tipps 2007

 
 
LinkBack Themen-Optionen Thema bewerten
Alt 22.05.2005, 11:05  
Gast
 
Beiträge: n/a
Standard Suchrobots ausfiltern

Moin

Ich bin am erstellen eines eigenen logfile.

Nun habe ich dies eine Woche getestet und dabei gesehen, dass etwa jeder vierte Eintrag von einer Suchmaschine stammt.

Da es mich aber nicht Wunder nimmt, welche dieser Suchmaschine wie viel mal täglich bei mir vorbeikommt, möchte ich einen Suchrobotfilter erstellen.

Doch wie kann ich Robots von normalen usern unterscheiden?
 
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 22.05.2005, 11:11  
Moderator
 
Benutzerbild von robo47
 
Registriert seit: 03.09.2004
Beiträge: 11.792
PHP-Kenntnisse:
Fortgeschritten
robo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz sein
Standard

robots.txt

den bots den zugriff damit verbieten ? auf das dokument?
robo47 ist offline  
Alt 22.05.2005, 11:20  
Gast
 
Beiträge: n/a
Standard

Ich glaube er will die Robots aus seinen Logfiles filtern.
Ich hab mal ein Array mit allenmöglichen Robots aus bbclone kopiert:
http://woltersware.dyndns.org/space/robots.txt
Das musst du einfach abfragen ob der Regex darin in $_SERVER['HTTP_HOST'] drin ist
 
Alt 22.05.2005, 13:13  
Gast
 
Beiträge: n/a
Standard

Danke für die Datei.

Aber für was sind diese vielen Arrays?
Würde da nicht einfach ein Array reichen mi allen Robotsnamen oder haben die Begriffe icon, title und rule noch eine bestimme Funktion?
 
Alt 22.05.2005, 13:18  
Gast
 
Beiträge: n/a
Standard

Wenn du von mir erwartest das ich dir die 400 Robots in ein eindimensionales Array umschreibe hast du dich geschnitten.
 
Alt 22.05.2005, 13:36  
Gast
 
Beiträge: n/a
Standard

Natürlich habe ich dies nicht erwartet, aber mich nimmt es Wunder, welche dieser vier Möglichkeiten(array-name, icon, rule, title) dann auch in $_SERVER['HTTP_HOST'] vorkommen.
Also welche array-teile ich löschen kann und welche ich für mein Filtersystem benötige?
 
Alt 22.05.2005, 13:42  
Gast
 
Beiträge: n/a
Standard

rule ist ein Regex der in $_SERVER['HTTP_HOST'] vorkommen sollte wenn es ein Robot ist. icon ist nur ein Bildsche dat BBclone für ihre Darstellung braucht. Und Title ist der Name.

Im grunde reicht es aber auch schon wenn du einfach HTTP_HOST auf
so Schlüsselwörter wie "crawler", "bot" und "spider" überprüfst.
 
Alt 11.07.2006, 08:15  
Erfahrener Benutzer
 
Registriert seit: 18.07.2005
Beiträge: 154
iRadiaX
iRadiaX eine Nachricht über ICQ schicken iRadiaX eine Nachricht über AIM schicken
Standard

@ Du-weisst-schon-wer: Die Datei existiert nicht mehr, aber ich bräuchte sie nochmal.. hast du sie noch?

Danke im Voraus,
iRadiaX
__________________
Quedilo - Downloads schneller finden
iRadiaX ist offline  
 


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
HTML-Tags ausfiltern -> PLAIN Text für Weiterverarbeitung sponer PHP Tipps 2006 2 16.02.2006 16:50
Dateiendung ausfiltern Mano PHP Tipps 2004-2 10 30.12.2004 20:48

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
logdateien filtern robots, bbclone robots rausfiltern, spider und bots filtern php, php regex robot filter, php regex robot erkennung, robots filtern, php robot ausfiltern, suchrobots, such-robots, php spider bots filtern array, bbclone array rule, suchrobot, php spider ausfiltern

Alle Zeitangaben in WEZ +2. Es ist jetzt 13:09 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum

Creative Commons License
Dieser Inhalt ist unter einer Creative Commons-Lizenz lizenziert.