php.de

Zurück   php.de > Webentwicklung > PHP Einsteiger > PHP Tipps 2005-2

 
 
LinkBack Themen-Optionen Thema bewerten
Alt 08.09.2005, 17:15  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard Fragen bezüglich einer Suchmaschine

Hallo ich habe mal einige Fragen die mich zur Zeit brennend interessieren und ich hoffe ihr könnt mir mal ein bisschen helfen. :wink:

Also es dreht sich alles um Suchmaschinen:

1. Wie arbeitet eigendlich so ein Suchrobot? Nimmt er nur die Metainformation aus der Seite raus oder den ganzen Inhalt? Und was macht er dann damit?

2. Wie "sucht" ein Robot? Also beginnt er einfach die Suche an einer x-beliebigen Stelle im Internet und hohlt sich da Informationen und geht dann weiter?

3. Wird so ein Robot durch einen Cronjob gesteuert oder ist er sogar einer?

4. (Wie) Kann man einen Robot mit PHP realisieren?

würde mich freuen wenn's mir jemand erklären könnte.
Charly Shop Sui ist offline  
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 08.09.2005, 17:46  
Erfahrener Benutzer
 
Registriert seit: 29.10.2004
Beiträge: 1.781
derHund
Standard

1. das kommt auf den bot an, für gewöhnlich wird der gesamte inhalt ausgelesen (wobei das eigentlich total irrelevant ist) - wie fragst du das? der inhalt wird dann ausgewertet, je nach bot werden links, email-adressen oder sonstiges extrahiert.
2. ja, er verfolgt die verlinkungen
3. natürlich kann er durch einen cron gestartet werden, oder auch die ganze zeit laufen ... je nach dem
4. es gibt fertige klassen dafür, selber schreiben ist auch nicht schwer ... fsockopen() + preg_macth_all() .. das wars schon fast

das beachten der robots.txt darfst du nicht vergessen.
__________________
derHund ist offline  
Alt 08.09.2005, 18:06  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard

zu 1: wird dann auch gewöhnlich der gesamte Inhalt in der DB der Suchmaschine abgespeichert?
zu 2: welche verlinkungen?
zu 3: wie kann ein PHP-Script die ganze Zeit einfach so laufen ohne CronJob?

5. Robot.txt?^^
Charly Shop Sui ist offline  
Alt 08.09.2005, 18:16  
Erfahrener Benutzer
 
Registriert seit: 27.10.2004
Beiträge: 1.093
PHP-Kenntnisse:
Fortgeschritten
Chr!s
Standard

1) Wenn dus brauchst, ja, (solltest du aber nicht)
2) Na die Links auf der Seite
3) Mit einer while-Schleife die quasi erst dann aufhört bis du keinen Link mehr findest (was wohl nicht passieren wird). Denk dabei aber an max_execution_time() ! Außerdem ist PHP für soetwas nicht unbedingt geeignet.
5) http://www.exine.de/suchmaschinen/robots.htm
Chr!s ist offline  
Alt 08.09.2005, 18:25  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard

sorry aber es geht weiter, bin halt neugierig:

zu 1: also nur metatags bzw. die keywords oder?
zu 2: Und wenn's da eine Links gibt, ist dann schluss? Bzw. wird das immer so gemacht? Und gibt es eine extra Funktion für PHP die die Links aus der Seite rausfiltert?
zu 3: Was wäre dann besser geeignet? Perl?
Charly Shop Sui ist offline  
Alt 08.09.2005, 18:34  
Erfahrener Benutzer
 
Registriert seit: 29.10.2004
Beiträge: 1.781
derHund
Standard

1. den keywords/descriptions wird heute bei den großen sumas eh keine große relevanz mehr zugestanden. wenn du eine seite spiderst, kannst du ihren inhalt auf deiner platte ablegen, um ihn später zu analysieren und relevante infos in der db zu speichern.
2. du mußt links extrahieren, um auf weitere seiten zu kommen. so schnell wird da nicht schluß sein. als php-funktion kannst du preg_match_all verwenden.
3. ja, oder c++ oder java ...
__________________
derHund ist offline  
Alt 08.09.2005, 19:18  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard

Okay damit wären meine Fragen alle geklärt, danke an alle.
Charly Shop Sui ist offline  
Alt 09.09.2005, 15:18  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard

Kann mir jemand sagen, woher ich solche Suchklassen bekomme? Hab schon rumgegoogled aber nur seiteninterne Suchmaschinen gefunden.
Charly Shop Sui ist offline  
Alt 09.09.2005, 17:40  
Erfahrener Benutzer
 
Registriert seit: 27.10.2004
Beiträge: 1.093
PHP-Kenntnisse:
Fortgeschritten
Chr!s
Standard

Schreib dir doch eine selber..?
Ich bin mir nicht sicher ob jemand soetwas 4 free anbietet..
Chr!s ist offline  
Alt 09.09.2005, 18:15  
Erfahrener Benutzer
 
Registriert seit: 04.05.2005
Beiträge: 102
Charly Shop Sui
Standard

Hmm, ich werd's probieren. Bin mir aber noch nicht sicher wie genau ich den Inhalt einer Seite (unter Angabe einer URL) auslese. Kann mir da vllt. jemand einen Denkanstoß geben? Ich frag dann auch nicht mehr weiter, versprochen :wink:
Charly Shop Sui ist offline  
 


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Renommee Funktion wirft Fragen... tomtaz Board-Support 11 02.07.2008 21:18
gettext, einige fragen notyyy PHP Tipps 2008 12 01.05.2008 12:09
Fragen eines Anfängers ;) ap1 PHP Tipps 2006 22 12.06.2006 20:20
Fragen zu Programmen von PHP Der Sebbel PHP Tipps 2006 6 09.06.2006 00:20
Suchmaschine findet nicht alle Begriffe PHP Tipps 2006 4 04.02.2006 11:51
FireFox Suchmaschine entfernen Off-Topic Diskussionen 4 08.12.2005 15:49
Datenbank fragen Off-Topic Diskussionen 8 07.11.2005 14:21
Generelle PHP Fragen Madden PHP-Fortgeschrittene 3 11.04.2005 01:24
Einige grundlegende Fragen zu PHP PHP Tipps 2005 3 07.02.2005 18:34
[Erledigt] Allgemeine Anfänger Fragen PHP Tipps 2004-2 5 20.12.2004 14:57
benötige suchmaschine Beitragsarchiv 3 26.10.2004 00:35
Ich habe 3 Fragen. Off-Topic Diskussionen 3 12.09.2004 21:10
fragen zu einem Login und Zeit blabla über MySQL PHP Tipps 2004 10 12.09.2004 15:21
Fragen über Fragen :) Igäl PHP Tipps 2004 3 26.08.2004 08:59
[Erledigt] Fragen über Fragen... wer kann helfen? PHP Tipps 2004 2 08.07.2004 21:12


Alle Zeitangaben in WEZ +2. Es ist jetzt 08:26 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum

Creative Commons License
Dieser Inhalt ist unter einer Creative Commons-Lizenz lizenziert.