Ankündigung

Einklappen
Keine Ankündigung bisher.

Mit PHP-HTML Parser html Tags durchparsen

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Mit PHP-HTML Parser html Tags durchparsen

    Hey php Gemeinde

    bin zwar nicht ganz Anfänger in PHP, aber ich tue mir da irgendwie schwer mit.
    Aufjedenfall habe ich mir schon so einiges angeschaut, komme allerdings nicht von der Stelle.

    Folgendes Problem:

    Ich will viel HTML Code mit dem PHP HTML Parser parsen.
    So sieht mein HTML Code aus :

    Code:
    <html>
    <head>
    </head>
    
    <body>
    <h1>Herzlich Willkommen</h1>
    
    <font size="2" color="green"><u>Kursiver King Kong Text</u></font><br>
    
    <a href="www.google.de"><font face="Arial" size="3" color="red">>Google Link</font></a><br>
    <a href="www.ccc.de">>ccc</a><br>
    
    <p style="margin-left:0px;"><span style="color:#000000;"><u>Ueberschrift:</u></span></p>
    
    <a href="/mypage1">>Hello World!</a>
    <a href="/mypage2">>Another Hello World!</a>
    
    <b> KING KONG muss dick sein </b>
    <img src="king.png" alt="kingkong">
    </body>
    
    </html>

    Zu verwenden ist einmal:

    - PHP HTML Parser
    - PHPword Library => Um ausgelesene Inhalte in ein Word Dokument hineinzuschreiben

    Ich will das die HTML Seite sowie sie im Browser aussieht auch in einem Word Dokument geschrieben wird. Dazu wird PHPword Library verwendet.

    Allerdings wie man im HTML Code sehen kann gibt es viele INLINE Elemente z.B bei links können auch mal fonts eingestellt werden. Diese ganzen Einstellungen z.B Schriftgröße, Farbe, ... will ich mit parsen können, sodass ich diese nachher einfach dem phpword mitgeben kann.

    Ich verstehe nur nicht wie das mit den ganzen childnotes zu 100 % funktioniert.

    Kann jemand mir mal lieberweise ein Musterbeispiel zeigen wie ich eine HTML File nach allen ihren wesentlichen Tags und inline Elementen durchparse ???

    Hier das ist mein Anfang :

    PHP-Code:
    // ----------------------------------------------------------------- //
    // Use Library PHPword to write in word/ office documents
    // ----------------------------------------------------------------- //

    // Binding PHPword library
    require_once 'PHPWord_0.6.2_Beta\PHPWord.php';

    // Create a new PHPword Object
    $phpWord = new phpWord();

    // Every tag you want to append to the word document is placed in a section. 
    $section $phpWord->createSection();

    // Binding PHP HTML Parser 
    $doc = new DOMDocument();
    $doc->loadHTMLFile("file.txt");

    $tags $doc->getElementsByTagName('*');
    $tags $doc->getElementsByTagName('html');
    $tags $doc->getElementsByTagName('body');
    $tags $doc->getElementsByTagName('table');
    $tags $doc->getElementsByTagName('div');
    $tags $doc->getElementsByTagName('p');
    $tags $doc->getElementsByTagName('b');
    $tags $doc->getElementsByTagName('a');

    if(!
    is_null($tags)) 
    {
        
    // get tags //

        
    foreach($tags as $tag)
        {
        
        
    // check what tag comes
        
    switch($tag->nodeName
        {
        case 
    "a":
            
            echo 
    $tag->nodeName "\n";
            
               
    $nodes $tag->childNodes;
    foreach (
    $nodes as $node)
     {
               echo 
    $node->nodeValue"\n";
    echo 
    $tag->getAttribute('href') . "\n";
            
            break;
        case 
    "b":
        
            echo 
    $tag->nodeName "\n";
            
            break;
        case 
    "p":
            echo 
    $tag->nodeName":";
            break;
    // switch

    Lieben Dank schon mal vorab

Lädt...
X