Hey php Gemeinde

bin zwar nicht ganz Anfänger in PHP, aber ich tue mir da irgendwie schwer mit.
Aufjedenfall habe ich mir schon so einiges angeschaut, komme allerdings nicht von der Stelle.

Folgendes Problem:

Ich will viel HTML Code mit dem PHP HTML Parser parsen.
So sieht mein HTML Code aus :

Code:
<html>
<head>
</head>

<body>
<h1>Herzlich Willkommen</h1>

<font size="2" color="green"><u>Kursiver King Kong Text</u></font><br>

<a href="www.google.de"><font face="Arial" size="3" color="red">>Google Link</font></a><br>
<a href="www.ccc.de">>ccc</a><br>

<p style="margin-left:0px;"><span style="color:#000000;"><u>Ueberschrift:</u></span></p>

<a href="/mypage1">>Hello World!</a>
<a href="/mypage2">>Another Hello World!</a>

<b> KING KONG muss dick sein </b>
<img src="king.png" alt="kingkong">
</body>

</html>

Zu verwenden ist einmal:

- PHP HTML Parser
- PHPword Library => Um ausgelesene Inhalte in ein Word Dokument hineinzuschreiben

Ich will das die HTML Seite sowie sie im Browser aussieht auch in einem Word Dokument geschrieben wird. Dazu wird PHPword Library verwendet.

Allerdings wie man im HTML Code sehen kann gibt es viele INLINE Elemente z.B bei links können auch mal fonts eingestellt werden. Diese ganzen Einstellungen z.B Schriftgröße, Farbe, ... will ich mit parsen können, sodass ich diese nachher einfach dem phpword mitgeben kann.

Ich verstehe nur nicht wie das mit den ganzen childnotes zu 100 % funktioniert.

Kann jemand mir mal lieberweise ein Musterbeispiel zeigen wie ich eine HTML File nach allen ihren wesentlichen Tags und inline Elementen durchparse ???

Hier das ist mein Anfang :

PHP-Code:
// ----------------------------------------------------------------- //
// Use Library PHPword to write in word/ office documents
// ----------------------------------------------------------------- //

// Binding PHPword library
require_once 'PHPWord_0.6.2_Beta\PHPWord.php';

// Create a new PHPword Object
$phpWord = new phpWord();

// Every tag you want to append to the word document is placed in a section. 
$section $phpWord->createSection();

// Binding PHP HTML Parser 
$doc = new DOMDocument();
$doc->loadHTMLFile("file.txt");

$tags $doc->getElementsByTagName('*');
$tags $doc->getElementsByTagName('html');
$tags $doc->getElementsByTagName('body');
$tags $doc->getElementsByTagName('table');
$tags $doc->getElementsByTagName('div');
$tags $doc->getElementsByTagName('p');
$tags $doc->getElementsByTagName('b');
$tags $doc->getElementsByTagName('a');

if(!
is_null($tags)) 
{
    
// get tags //

    
foreach($tags as $tag)
    {
    
    
// check what tag comes
    
switch($tag->nodeName
    {
    case 
"a":
        
        echo 
$tag->nodeName "\n";
        
           
$nodes $tag->childNodes;
foreach (
$nodes as $node)
 {
           echo 
$node->nodeValue"\n";
echo 
$tag->getAttribute('href') . "\n";
        
        break;
    case 
"b":
    
        echo 
$tag->nodeName "\n";
        
        break;
    case 
"p":
        echo 
$tag->nodeName":";
        break;
// switch

Lieben Dank schon mal vorab