Ankündigung

Einklappen
Keine Ankündigung bisher.

$_SERVER['HTTP_USER_AGENT'] Ausgabe bei webcrawlern?

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • $_SERVER['HTTP_USER_AGENT'] Ausgabe bei webcrawlern?

    Hallo,
    ich würde gerne wissen was die Ausgabe von $_SERVER['HTTP_USER_AGENT'] bei Searchrobots, Webcrawlern, Spidern und dergleichen ist.
    Wird da nur der Name vom UserAgent ausgegeben, oder die komplette Beschreibung?

    Beispiel
    Name: Googlebot
    Beschreibung: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    Quelle: https://support.google.com/webmaster.../1061943?hl=en

    Eine weitere Frage ist: Gibt es eine Möglichkeit per PHP solcherlei Webseiten"besucher" eindeutig zu erkennen? Ausgenommen diejenigen, die einen echten Besucher immitieren.

  • #2
    Hast du einen Server?
    Dann würde ich einfach mal in die Logs, oder Statistiken falls du Webalizer oder ähnliches hast, schauen um alle "besonderen" User-Agents zu finden.

    Kommentar


    • #3
      Die Frage ist, was hast du vor?

      Es gibt Listen, welche die bekannten Bots mit ihren UA auflisten, diese findest du mit einer Suchmaschine unter dem Suchterm "user agents bots"

      Kommentar


      • #4
        Die User-Agents von Crawlern müssen keinen bestimmten Patterns folgen, siehe folgende Liste:

        https://github.com/monperrus/crawler...er-agents.json

        Zu deiner 2. Frage: Du könntest beispielsweise auf den Piwik-Device-Detector zurückgreifen (https://github.com/piwik/device-detector). Dieser bietet direkt die passende Methode an: $deviceDetector->isBot()

        Kommentar

        Lädt...
        X