Hallo
ich hab eine Suchfunktion geschrieben die die ganze HP durchsucht. Leider durchsucht Sie wirklich alles, auch Sachen die nicht durchsucht werden solle. Nun war mein Gedanke die robots.txt auszulesen und nach den Vorgaben dort zu durchsuchen. Leider finde ich hier irgendwie keinen Unterschied zwischen Files und Directories.
z.B.
User-agent: *
Disallow: /cgi-bin
Disallow: /faq
Disallow: /angebot/file.html
Ausser natürlich die Extension.
1. Ist es korrekt wenn ich nach der Extension Entscheide ob Verzeichnis oder File?
2. kann ich als nicht zu durchsuchendes Verzeichnis z.B. /cgi_bin rausholen?
Peter
ich hab eine Suchfunktion geschrieben die die ganze HP durchsucht. Leider durchsucht Sie wirklich alles, auch Sachen die nicht durchsucht werden solle. Nun war mein Gedanke die robots.txt auszulesen und nach den Vorgaben dort zu durchsuchen. Leider finde ich hier irgendwie keinen Unterschied zwischen Files und Directories.
z.B.
User-agent: *
Disallow: /cgi-bin
Disallow: /faq
Disallow: /angebot/file.html
Ausser natürlich die Extension.
1. Ist es korrekt wenn ich nach der Extension Entscheide ob Verzeichnis oder File?
2. kann ich als nicht zu durchsuchendes Verzeichnis z.B. /cgi_bin rausholen?


Kommentar