Ankündigung

Einklappen
Keine Ankündigung bisher.

Seiten Indizierung

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Seiten Indizierung

    Hi,
    meine Frage bezieht sich auf ein suchscipt das ich gemacht hab, aber immernoch nicht ganz fertig bekomme.
    Und zwar fehlt mir einfach eine Idee wie ich alle Seiten einer domain indizieren /auflisten kann.
    Würde ich z.B. ein script schreiben, das alle Seiten durchgeht und alles zwischen "<a href=" und "</a>" kopiert und in ne mysql Tabelle schreibt, hätte ich ja nicht die tatsächlichen links, sondern nur sowas wie "../toll.php" .
    Deshalb bräuchte ich etwas, das wirklich die links öffnet und dann den tatsächlichen link auch auflistet.
    So etwas gibt es auch auf diversen linkchecker Seiten, diese Programme machen ja auch nichts anderes.
    Hat einer von euch eine Idee oder vielleicht sogar einen fertigen Code den ich mal durcharbeiten könnte ?


  • #2
    Re: Seiten Indizierung

    Ein etwas schwammiges Konzept:
    Zitat von Björnderantichecker
    meine Frage bezieht sich auf ein suchscipt das ich gemacht hab (das keiner außer Dir kennt), aber immernoch nicht ganz fertig bekomme.
    Und zwar fehlt mir einfach eine Idee wie ich alle Seiten einer domain indizieren /auflisten kann.
    Dazu könnte ich das erst mal beisteuern:
    http://test.php-help.info/dirlist-1/
    Das Script findet erst mal die Files. Das Problem ist nur, wenn Du die Seiten nach Inhalten durchsuchen willst.

    Sind es nur 100-200, geht das mit file() und preg_match(). Wenn es aber zuviele Seiten sind, wird das Script in einer vom User akzeptierten Wartezeit nicht fertig. Für den Fall gibt es zwar andere Möglichkeiten, die aber allesamt auf einen Server mit Rootaccount basieren.

    Kommentar


    • #3
      Danke für deine Antwort, aber so ganz hilft mir dein kleines script nicht weiter.
      Wenn ich es ausführe dann werden mir alle files angezeigt, aber nicht wirklich die urls mit den jeweiligen Variablen.
      Bsp.: ./root/index.php
      statt: ./root/index.php?id1=german
      Was auch logisch ist, da diese ja nur beim anklicken eines links hinzugefügt werden.
      Ich bräuchte also ein script, das sich rekursiv durch die Seiten klickt und immer den tatsächlichen link speichert.
      Dazu auch ne Idee ?

      Kommentar


      • #4
        Zitat von Björnderantichecker
        Ich bräuchte also ein script, das sich rekursiv durch die Seiten klickt und immer den tatsächlichen link speichert. Dazu auch ne Idee ?
        Nein. Da ich den Content fast ausschließlich in einer MySQL Tabelle speichere, sieht meine "Suchmaschine" wesentlich anders aus.

        Kommentar


        • #5
          Leider habe ich keinen Einfluss darauf, wie der Content dieser Seite gespeichert wird, da ich nur ein suchscript programmieren soll Aber könntest du oder irgendjemand mir vielleicht wenigstens sagen wie ich die Adresse einer aktuell geöffneten Seite auslesen kann ??? Also quasi das, was oben im Adressfeld des browsers steht wenn ich auf einer Seite bin.
          Wäre klasse, danke.

          Kommentar


          • #6
            Zitat von Björnderantichecker
            Aber könntest du oder irgendjemand mir vielleicht wenigstens sagen wie ich die Adresse einer aktuell geöffneten Seite auslesen kann ???
            Janz einfach: schreibe in Dein Script testweise ganz unten
            Code:
            phpinfo();
            rein, ruf die Seite im Browser auf und guck Dir die letzte Tabelle der Ausgabe von phpinfo() an. Der Rest steht dann im Handbuch...

            Kommentar

            Lädt...
            X