Hallo,
Ich habe eine PHP Datei (googlebot-tracker.php) die feststellt wann der Googlebot das lezte mal vorbei geschaut hat und mir dann eine E-Mail schickt.
Code:
<?php
// Bot & Domain festlegen
$domain = "meine-domain.com";
$bot = "Googlebot";
if(ereg($bot, $_SERVER['HTTP_USER_AGENT'])) {
if($bot == "Googlebot") {
if (substr($REMOTE_HOST, 0, 11) == "216.239.46.") $bot = "Googlebot Deep Crawl";
elseif (substr($REMOTE_HOST, 0,7) == "64.68.8") $bot = "Google Freshbot";
}
if ($QUERY_STRING != "") {
$page = "http://" . $_SERVER['SERVER_NAME'] . $_SERVER['PHP_SELF'] . "?" . $_SERVER['QUERY_STRING'] . "";
} else {
$page = "http://" . $_SERVER['SERVER_NAME'] . $_SERVER['PHP_SELF'] . "";
}
// E-Mail Setup
$to = "bla@bla.com";
$subject = "Googlebot entdeckt auf: $domain";
$body = "$bot wurde entdeckt auf $domain\n\n
Datum.............: " . date("F j, Y, g:i a") . "
Gecrawlte Seite.............: " . $page . "\n\n
Have a nice day!
";
// E-Mail senden
mail($to, $subject, $body);
}
?>
Der Nachteil hier. Ich werde natürlich nur benachrichtigt wenn Googlebot genau diese eine Seite gecrawlt hat.
Gibt es irgendeine Möglichkeit das für alle Seiten, Bilder, CSS die sich innerhalb meines Webverzeichnis befinden zu realisieren? Bei einer einfachen HTML Seite mit Unterverzeichnissen.
Ich weiß ich kann mir die HTTP Requests auch über meine Webserver Access Log usw. ansehen oder mittels Wordpress geht es ja auch sehr einfach. Ich würde das aber gerne mit PHP lösen. Vorallem hat man ja auch nicht immer Zugriff auf die Webserver Logs oder nutzt Wordpress.
Danke schon einmal vorab für eure Hilfe.