Hallo, habe folgendes Problem,
ich möchte ein HTML File parsen und zwar möchte ich jeden INNERTEXT (content) im Body eines HTML Tags ermitteln.
Bsp HTML File:
meine erwartete Ausgabe für mein PHP Script ist:
* das ist ein Test
* blabla
* Link1
* Link2
* test
Das ganze versuche ich so zu realisieren:
ich möchte einfach alle Tags beliebig tief durch iterieren
Der Code funktioniert nur in erster Ebene, wie könnte ich nun das Problem mit der verschachtelung lösen?
ich stehe gerade ein bischen auf dem schlauch...
bekomme da gerade auch kein rekursiven Algorithmus hin.
Aber vielleicht hat jemand ne Idee oder es gibt ne einfachere Möglichkeit mit PHP Simple HTML DOM Parser.
Hier ist die API Beschreibung von PHP Simple HTML DOM Parser -> PHP Simple HTML DOM Parser
Vielen Dank.
berryone
ich möchte ein HTML File parsen und zwar möchte ich jeden INNERTEXT (content) im Body eines HTML Tags ermitteln.
Bsp HTML File:
Code:
<html> <head><titel>Test</titel></head> <body> <b>das ist ein Test <i>blabla <a href="http://www.google.de">Link1</a> </i> </b> <a href="http://www.web.de">Link2</a> <br> <p>test</p> </body> </html>
* das ist ein Test
* blabla
* Link1
* Link2
* test
Das ganze versuche ich so zu realisieren:
ich möchte einfach alle Tags beliebig tief durch iterieren
PHP-Code:
$html = str_get_html('html file');
foreach($html->find('body') as $element)
{
$result = $element;
}
foreach($result->children() as $innerElement)
{
if($innerElement->innertext) echo htmlentities($innerElement->innertext)."<br>";
if($innerElement->children())
{
// noch keine logik drin
}
}
ich stehe gerade ein bischen auf dem schlauch...
bekomme da gerade auch kein rekursiven Algorithmus hin.
Aber vielleicht hat jemand ne Idee oder es gibt ne einfachere Möglichkeit mit PHP Simple HTML DOM Parser.
Hier ist die API Beschreibung von PHP Simple HTML DOM Parser -> PHP Simple HTML DOM Parser
Vielen Dank.
berryone
Kommentar