Hi
ich suche schon seit monaten nach solch einer loesung.
Auf der folgenden webseite ist eine liste von filmen
The movie starting with AA toALL
Wenn man auf denn link des jeweiligen Filmes clickt bekommt folgende daten
AA AB LAUT CHALEN (1999)
Aakshey Khanna, Rajesh Khanna, Aishwarya Rai
Suman Ranganathan, Navin Nischol, Satish Kaushik
Directed By: Rishi Kapoor
Produced By: Randhir Kapoor, Rishi Kapoor, RajivKapoor
Music By: Nadeem Shravan
1. Zeile: titel in der klammer () das release jahr
2-3. Zeile: Schauspieler liste
4. Regisseur
5. Produzent
6. Musik Regiseur
jedoch sind das zuviele links und ich moechte das nicht als eintippen ueber 12000 filme. Dauert monate. Ich schaffe es einfach nicht ein script zu schreiben welches einfach denn jweiligen link durchgeht und denn inhalt in die mysql datenbank schreibt
ist das irgendwie ueberhaupt moeglich ?? Gibt es evtl schon ein script welches das kann und ich es modifizieren kann ?
bitte dringend um hilfe
Indian
Ankündigung
Einklappen
Keine Ankündigung bisher.
Inhalt von einer webseite kopieren
Einklappen
Neue Werbung 2019
Einklappen
X
-
Inhalt von einer webseite kopieren
Stichworte: -
-
Zitat von indian Beitrag anzeigenaber meine php kentnisse sind nicht so gut..
Achso deswegen schreibst du in "PHP Profis", versteht
[/ironie]
Beitrag verschoben
-
Probier doch mal die Amazon API, da hast du auch Zugriff auf Filmdaten.
Einen Kommentar schreiben:
-
Hier ein kleiner Anfang:PHP-Code:$adr = 'http://faculty.ist.unomaha.edu/pdasgupta/allmovies/movies_aa.htm';
if ($fp = fopen($adr, 'r')){
$txt = '';
while (!feof($fp)) {
$txt .= fgets($fp, 128);
}
fclose($fp);
// echo $txt;
$txt = preg_replace('|<body>(.+)</body>|i', "\$1", $txt);
$adr_txt = preg_match_all('|.*<a\s*href=[\'"]?(http.+)[\'"]>.*|iU', $txt, $found);
$i = 0;
echo "<table border='1'>\n";
echo "<tr><th>Title</th><th>Artists</th><th>Dircted by</th><th>Produced By</th><th>Music By</th></tr>";
foreach ($found[1] as $link){
echo "$link<br>";
$prod = $dir = $music = '';
echo "<tr>";
$lar = file($link);
$title = strip_tags($lar[5]);
echo "<td>$title</td>";
$artists = strip_tags($lar[11]);
for ($i = 12;strpos($lar[$i], ' By') === false;$i ++){
$artists .= strip_tags($lar[$i]);
}
echo "<td>$artists</td>";
for (;$i < count($lar);$i ++){
if (stripos($lar[$i], 'Produced By') !== false){
$prod = trim(str_replace('Produced By:', '', strip_tags($lar[$i])));
}
elseif(stripos($lar[$i], 'Directed By') !== false){
$dir = trim(str_replace('Directed By:', '', strip_tags($lar[$i])));
}
elseif(stripos($lar[$i], 'Music By') !== false){
$music = trim(str_replace('Music By:', '', strip_tags($lar[$i])));
}
}
echo "<td>$dir</td><td>$prod</td><td>$music</td></tr>\n";
}
echo "</table>\n";
}
Einen Kommentar schreiben:
-
mist dachte das es irgendwas aehnliches schon gibt
ich weiss nicht mal wo ich anfangen soll.. da ich fast null information habe wie ich das realisieren soll
naja danke fuer die Info.
Indian
Einen Kommentar schreiben:
-
Das sind sehr spezielle Anforderungen. Migrationsskripte wie dieses sind eigentlich immer grundlegende Arbeit. Da wirst du um die Einarbeitung nicht drum rum kommen glaube ich.
So etwas vorgefertigt zu finden und dann auch noch etwas beisammen haben das dir zeitersparnis bringt (im Gegensatz zum selber programmieren) halte ich für schwierig.
Einen Kommentar schreiben:
-
Zitat von indian Beitrag anzeigennein... die haben selbst kein datenformat angelegt sondern jeden film in eine eigene html seite gespeichert (ca 6000 dateien) und die weitere Entwicklung eingestellt.
Einen Kommentar schreiben:
-
nein... die haben selbst kein datenformat angelegt sondern jeden film in eine eigene html seite gespeichert (ca 6000 dateien) und die weitere Entwicklung eingestellt.
Einen Kommentar schreiben:
-
Und die Betreiber der Site bieten Dir kein geeignetes Datenformat für einen Export an?
Einen Kommentar schreiben:
-
thanks
aber meine php kentnisse sind nicht so gut.. dachte es gibt etwas aehnliches was ich modifizieren kann
hab das was du aufgezaehlt hast probiert bekomme es leider nicht hin
Einen Kommentar schreiben:
-
Ja das ist technisch möglich.
Das ist aber nicht nur eine technische Frage sondern auch 'ne rechtliche oder moralische Darfst du die Liste kopieren? Falls ja, einfach mal fragen, ob sie das auch in einem einfacher kopierbaren Format haben. (CSV, MySQL-Dump...).
Falls kein einfacheres Format zur Verfügung steht:
Seite einlesen (fopen(), fread() oder file_get_contents()) entsprechende Links mit z.b. preg_match(), scanf oder strpos() rausparsen und wiederum deren Inhalte öffnen, parsen und speichern...
Einen Kommentar schreiben:
Einen Kommentar schreiben: