Ankündigung

Einklappen
Keine Ankündigung bisher.

Inhalt von einer webseite kopieren

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Inhalt von einer webseite kopieren

    Hi

    ich suche schon seit monaten nach solch einer loesung.

    Auf der folgenden webseite ist eine liste von filmen
    The movie starting with AA toALL

    Wenn man auf denn link des jeweiligen Filmes clickt bekommt folgende daten

    AA AB LAUT CHALEN (1999)
    Aakshey Khanna, Rajesh Khanna, Aishwarya Rai
    Suman Ranganathan, Navin Nischol, Satish Kaushik
    Directed By: Rishi Kapoor
    Produced By: Randhir Kapoor, Rishi Kapoor, RajivKapoor
    Music By: Nadeem Shravan

    1. Zeile: titel in der klammer () das release jahr
    2-3. Zeile: Schauspieler liste
    4. Regisseur
    5. Produzent
    6. Musik Regiseur

    jedoch sind das zuviele links und ich moechte das nicht als eintippen ueber 12000 filme. Dauert monate. Ich schaffe es einfach nicht ein script zu schreiben welches einfach denn jweiligen link durchgeht und denn inhalt in die mysql datenbank schreibt

    ist das irgendwie ueberhaupt moeglich ?? Gibt es evtl schon ein script welches das kann und ich es modifizieren kann ?

    bitte dringend um hilfe

    Indian


  • #2
    Ja das ist technisch möglich.

    Das ist aber nicht nur eine technische Frage sondern auch 'ne rechtliche oder moralische Darfst du die Liste kopieren? Falls ja, einfach mal fragen, ob sie das auch in einem einfacher kopierbaren Format haben. (CSV, MySQL-Dump...).

    Falls kein einfacheres Format zur Verfügung steht:
    Seite einlesen (fopen(), fread() oder file_get_contents()) entsprechende Links mit z.b. preg_match(), scanf oder strpos() rausparsen und wiederum deren Inhalte öffnen, parsen und speichern...
    Create your own quiz show.

    Kommentar


    • #3
      thanks

      aber meine php kentnisse sind nicht so gut.. dachte es gibt etwas aehnliches was ich modifizieren kann


      hab das was du aufgezaehlt hast probiert bekomme es leider nicht hin

      Kommentar


      • #4
        Und die Betreiber der Site bieten Dir kein geeignetes Datenformat für einen Export an?

        Kommentar


        • #5
          nein... die haben selbst kein datenformat angelegt sondern jeden film in eine eigene html seite gespeichert (ca 6000 dateien) und die weitere Entwicklung eingestellt.

          Kommentar


          • #6
            Zitat von indian Beitrag anzeigen
            nein... die haben selbst kein datenformat angelegt sondern jeden film in eine eigene html seite gespeichert (ca 6000 dateien) und die weitere Entwicklung eingestellt.
            Das ist wohl selbsterklärend

            Kommentar


            • #7
              Das sind sehr spezielle Anforderungen. Migrationsskripte wie dieses sind eigentlich immer grundlegende Arbeit. Da wirst du um die Einarbeitung nicht drum rum kommen glaube ich.

              So etwas vorgefertigt zu finden und dann auch noch etwas beisammen haben das dir zeitersparnis bringt (im Gegensatz zum selber programmieren) halte ich für schwierig.

              Kommentar


              • #8
                mist dachte das es irgendwas aehnliches schon gibt

                ich weiss nicht mal wo ich anfangen soll.. da ich fast null information habe wie ich das realisieren soll

                naja danke fuer die Info.

                Indian

                Kommentar


                • #9
                  Hier ein kleiner Anfang:
                  PHP-Code:
                  $adr 'http://faculty.ist.unomaha.edu/pdasgupta/allmovies/movies_aa.htm';
                  if (
                  $fp fopen($adr'r')){
                      
                  $txt '';
                      while (!
                  feof($fp)) {
                          
                  $txt .= fgets($fp128);
                      }
                      
                  fclose($fp);
                  //    echo $txt;
                      
                  $txt preg_replace('|<body>(.+)</body>|i'"\$1"$txt); 
                      
                  $adr_txt preg_match_all('|.*<a\s*href=[\'"]?(http.+)[\'"]>.*|iU'$txt$found);
                  $i 0;
                      echo 
                  "<table border='1'>\n";
                      echo 
                  "<tr><th>Title</th><th>Artists</th><th>Dircted by</th><th>Produced By</th><th>Music By</th></tr>";
                      foreach (
                  $found[1] as $link){
                          echo 
                  "$link<br>";
                          
                  $prod $dir $music '';
                          echo 
                  "<tr>";
                          
                  $lar file($link);
                          
                  $title strip_tags($lar[5]);
                          echo 
                  "<td>$title</td>";
                          
                  $artists strip_tags($lar[11]);
                          for (
                  $i 12;strpos($lar[$i], ' By') === false;$i ++){
                              
                  $artists .= strip_tags($lar[$i]);
                          }
                          echo 
                  "<td>$artists</td>";
                          for (;
                  $i count($lar);$i ++){
                              if (
                  stripos($lar[$i], 'Produced By') !== false){
                                  
                  $prod trim(str_replace('Produced By:'''strip_tags($lar[$i])));
                              }
                              elseif(
                  stripos($lar[$i], 'Directed By') !== false){
                                  
                  $dir trim(str_replace('Directed By:'''strip_tags($lar[$i])));
                              }
                              elseif(
                  stripos($lar[$i], 'Music By') !== false){
                                  
                  $music trim(str_replace('Music By:'''strip_tags($lar[$i])));
                              }
                          }
                          echo 
                  "<td>$dir</td><td>$prod</td><td>$music</td></tr>\n";
                      }
                      echo 
                  "</table>\n";

                  Musst du natürlich noch weiter entwickeln. Zuerst muss wahrscheinlich als oberste Ebene http://faculty.ist.unomaha.edu/pdasg...llmovies/index.html analysiert werden. usw.
                  Gruss
                  L

                  Kommentar


                  • #10
                    Probier doch mal die Amazon API, da hast du auch Zugriff auf Filmdaten.
                    "Mein Name ist Lohse, ich kaufe hier ein."

                    Kommentar


                    • #11
                      Zitat von indian Beitrag anzeigen
                      aber meine php kentnisse sind nicht so gut..
                      [ironie]
                      Achso deswegen schreibst du in "PHP Profis", versteht
                      [/ironie]

                      Beitrag verschoben

                      Kommentar

                      Lädt...
                      X