Hallo zusammen,
ich möchte aus einer Wikipedia-Seite den ersten Absatz auslesen und verwende dazu den curl-Befehl. Aus der eingelesenen Seite möchte ich den Text rausfiltern, der sich zwischen <p> und </p> befindet. Das funktioniert aber leider nicht.
Folgenden Code benutze ich derzeit:
Mit diesem Code findet keinerlei Ausgabe statt. Wenn ich nun allerdings die <p>-tags außen vor lasse und beispielsweise stattdessen als pattern reinen Text eingebe, wie bspw. 'Arthur' und 'Thronfolger', dann wird mir der Text dazwischen korrekt ausgegeben.
Oder wenn ich statt der per curl erzeugten Variable $absatz einfach die o.g. Wikipedia-API-Seite direkt aufrufe und dort den Text in die Zwischenablage kopiere und ihn dann manuell als Text in die Variable einfüge, wird mir der gewünschte Inhalt auch korrekt ausgegeben.
Also scheint es irgendwie mit der Auslesung des xml-Dokumentes zusammenzuhängen?
Ich würde mich freuen, wenn mir jemand einen Tipp geben könnte
Vielen Dank im voraus!
Andreas
ich möchte aus einer Wikipedia-Seite den ersten Absatz auslesen und verwende dazu den curl-Befehl. Aus der eingelesenen Seite möchte ich den Text rausfiltern, der sich zwischen <p> und </p> befindet. Das funktioniert aber leider nicht.
Folgenden Code benutze ich derzeit:
Code:
$ch = curl_init('https://de.wikipedia.org/w/api.php?format=xml&action=query&prop=extracts&exintro=1&titles=Charles,_Prince_of_Wales'); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $absatz = curl_exec($ch); // laut echo-Befehl ist die Variable $absatz korrekt befüllt preg_match('/(.*?)<p>(.*?)<\/p>/', $absatz, $test); echo $test[2];
Oder wenn ich statt der per curl erzeugten Variable $absatz einfach die o.g. Wikipedia-API-Seite direkt aufrufe und dort den Text in die Zwischenablage kopiere und ihn dann manuell als Text in die Variable einfüge, wird mir der gewünschte Inhalt auch korrekt ausgegeben.
Also scheint es irgendwie mit der Auslesung des xml-Dokumentes zusammenzuhängen?
Ich würde mich freuen, wenn mir jemand einen Tipp geben könnte
Vielen Dank im voraus!
Andreas
Kommentar