Ich glaube, ich habe eine Ahnung, was er vor hat ...
Wer OPERA kennt, findet den Startbildschirm oder zumindest den Tab-Snapshot zur Laufzeit bestimmt genauso hilfreich in der Orientierung wie ich. Mouse über Browsertab und der zeigt die aktuelle Seite im Mini-Format an ... ohne Klick auf den Tab selbst. Ob man es braucht, naja ... ^^
Ich tippe drauf, dass der Kunde etwas ähnliches möchte - allerdings eben nur als Text. Hier fangen Deine Probleme aber an, da die Seiten, die im Webverzeichnis gelistet werden könnten, keine ähnlichen Signaturen aufweisen werden, wenn wir jetzt mal nicht über mögliche Auslesepunkte wie <body> oder ähnlich sprechen. Du musst ja Merkmale haben, wo und wie Du den Text entnehmen willst ... und während ein Eintrag alles mit CSS macht, nutzt der nächste bspw. Grafiken, das alte Font-Tag usw.
Ich habe kürzlich Börsendaten aus einer Seite "geholt" (offizielle Anfrage ist gestellt, ob das per Cronjob erlaubt ist) und musste diesen eben sehr individuell aufbereiten - das klappt auf der Seite, ich bekomme nur die gewollte Info (muss dennoch die gesamte Seite vorher abholen) und kann diese in meine DB aufnehmen - auf der nächsten/anderen Seite klappt es nicht!! (weil anderes Seitenaufbaumuster)
Du kannst ja auch schlecht die Seitenbetreiber dazu auffordern, "Markierungen" (z. B. <!-- ab hier Seitentext -->) einzupflegen.
Fazit: Nur einen Teil anzeigen bzw. nur Teile daraus wirst Du global nicht hinkriegen. Demnach würde ich mich vielleicht eher am Markt orientieren: Benutze META-Tags (Title, Description) ... dann hättest Du zumindest eine Teilwahrheit.
just my 2 cent
S.
__________________ Manche Menschen sind wie Schnitzel - nicht zäh, aber beidseitig bekloppt! |