Ankündigung

Einklappen
Keine Ankündigung bisher.

Automatisiertes Exportieren von Wikipedia

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Automatisiertes Exportieren von Wikipedia

    Hallo,
    ich will ein Script schreiben womit ich die Wikipedia Export Funktion(Seiten exportieren - Wikipedia) automatisiert bediene.

    Sprich ich rufe eine Funktion z.B. get_wiki_content($search_string) auf, diese soll die oben genannte Export Funktion ausführen und als Kategorie $search_string übergeben. Das Ergebnis (XML) soll mir die Funktion z.B. in eine Datei auf meinen Webserver speichern und in ein neues Wiki Importieren (oder halt nur speichern).

    Dies soll nicht genutzt werden um die Daten vom online Wiki zu kopieren, sondern um von meinem lokalen Wiki die Daten die ich brauche in ein neues Wiki zu kopieren, und bei 3GB Wiki-Daten wovon ich viell 100MB brauche, dachte ich mir ist dies die einfachste möglichkeit.

    Hat einer eine Idee, wie bzw ob dies möglich ist ?
    Leider hab ich im moment einfach keine Idee wie und wo ich anfangen soll, ich hoffe Ihr versteht was ich meine.

    Vielen Dank schonmal,
    gruss
    PoNr


  • #2
    So wie ich dass erkennen kann, musst du einfach
    Code:
    http://de.wikipedia.org/wiki/Spezial:Exportieren/Psychologie
    öfnnen und mit PHP komplett einlesen.
    Danach kannst auch speichern.

    Kommentar


    • #3
      Hmm, wie "lese" ich dies denn ein?
      Und, sehe ich das richtig, es sind ja keine Bilder danach mehr enthalten, oder!?
      Hat jmd eine Idee wie ich an die dann ran komme?

      Kommentar


      • #4
        Dann versuchs mal nicht mit Exportiern sondern versuchs mit einlesen der Datei(wikipedia.org/wiki/BLAbla) mit file();

        Dann schauste nach wie viel Zeilen für die Seitenleiste am Anfang weglassen musst und wieviel am Ende(Fussleiste).

        Um die Bilder auf Webspace zu speichern nutze wget.

        Ziemlich kompliziert. Hoffe schaffst das alleine!!

        Kommentar

        Lädt...
        X