php.de

Zurück   php.de > php.de Intern > Off-Topic Diskussionen

Off-Topic Diskussionen Mach mal Pause vom Programmieren!

Antwort
 
LinkBack Themen-Optionen Thema bewerten
Alt 10.11.2009, 17:15  
Neuer Benutzer
 
Registriert seit: 05.10.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
PatrickXX30 befindet sich auf einem aufstrebenden Ast
Standard [Tipp?] Website Crawler der..

Hallo Zusammen,

ich bin auf der Suche nach einer Lösung und m.E. müsste es sowas eigentlich schon geben. Nur weiß ich nicht genau, wonach ich suchen soll bzw. wie ich es finden soll... ich hoffe, ihr versteht, was ich meine...


Ich suche also eine Art Website Crawler, der einen bestimmten Bereich einer fremden Website erfasst und und in eine DB einliest. Allerdings soll nur der relevante Teil einer Website eingelesen werden, also alle Navigation, Header, Footer usw. brauche ich nicht, sondern nur "eine mittleren Teil" mit den für mich wichtigen Informationen.
Dieser "mittlere Teil" wird dann mit einem neuen Header und Footer ausgestattet und abgespeichert, so dass ich dieses HTML-File nutzen kann.

Auf der anderen Seite "erkennt" dieser "Roboter", dass eine Seite nicht mehr existent ist und weisst mich darauf hin bzw. das neue Seiten dazugekommen sind.

Hintergrundidee:
Stellt euch vor eine Seite hat einen "News"-Bereich.
Ich möchte nun diese News spidern und in einem neuen Template wieder online auswerfen. Der ganze "HTML-Krempel" um die News interessiert mich nicht, sondern nur die News-Meldung selbst.
Löscht die fremde Website nun eine News, dann möchte ich das ebenfalls löschen; stellt sie neue News ein, dann benötige ich ebenfalls wieder einen Hinweis, damit ich meine Files up-to-date halten kann...

Meine Frage nun:
Gibt es sowas nicht schon? Wenn ja, wo?

Viele Grüße

P.

____

Geändert von PatrickXX30 (11.11.2009 um 08:03 Uhr).
PatrickXX30 ist offline   Mit Zitat antworten
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 10.11.2009, 17:22  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 35.987
PHP-Kenntnisse:
Fortgeschritten
nikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunft
Standard

Für mich klingt das mehr nach Content-Klau. Das und der dämliche Threadtitel reicht, um den Thread zu schließen.

Für rechtmäßige Lösungen wurde RSS erfunden.


[MOD: Trash][MOD: Reopen]
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--

Geändert von nikosch (10.11.2009 um 18:42 Uhr).
nikosch ist offline   Mit Zitat antworten
Alt 11.11.2009, 08:03  
Neuer Benutzer
 
Registriert seit: 05.10.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
PatrickXX30 befindet sich auf einem aufstrebenden Ast
Standard

Hallo Nikosch,

nein, das hat mit Contentklau nichts zu tun.

Ich habe Kunden, die Unmengen an Daten produzieren, wir - als Dienstleister - bereiten diese Daten auf, veredeln sie und verteilen sie an verschiedene Anbieter wieder weiter.

Bislang funktioniert alles per Email.
Allerdings können wir "größere" Kunden nicht mit diesem OldSchool-Mail-System stemmen. Diese benutzen ein Redaktionssystem, dass die Meldungen auf deren Website publiziert und damit immer Tagesaktuell sind. Diesen Großkunden zuzumuten, die Meldungen zusätzlich per Mail zu senden ist unmöglich. Daher müssen wir Großaufträge immer ablehnen, weil wir die "Distribution" nicht hinbekommen.

Mit Datenklau hat das nichts zu tun. Die Kunden bezahlen uns dafür - wir suchen nur einem eleganteren Weg, damit wir unsere "Service"-Arbeit machen können.

Wäre schön, wenn man den Beitrag wieder veröffentlichen könnte?!

Gruß
P.
PatrickXX30 ist offline   Mit Zitat antworten
Alt 11.11.2009, 08:57  
Erfahrener Benutzer
 
Registriert seit: 06.11.2008
Beiträge: 212
stayInside befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von nikosch Beitrag anzeigen
Für mich klingt das mehr nach Content-Klau. Das und der dämliche Threadtitel reicht, um den Thread zu schließen.

Für rechtmäßige Lösungen wurde RSS erfunden.


[MOD: Trash][MOD: Reopen]
RSS! ist optimal dafür!
stayInside ist offline   Mit Zitat antworten
Antwort


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Probleme mit meiner Website! TYRICON Beitragsarchiv 4 18.08.2009 18:43
[Suche] Freiwilligen für eine Website Chrisu20 Beitragsarchiv 2 26.05.2009 07:31
[Erledigt] Ermitteln einer eindeutigen Website? Fruchtzwerk PHP Tipps 2009 6 19.03.2009 18:10
Daten von Website zu Website übertragen beta02 PHP Tipps 2009 17 13.01.2009 22:19
[Erledigt] Formulareintrag zur Website verschicken Blitzo PHP Tipps 2008 3 25.08.2008 20:24
Captcha in Website einbauen Dartgott PHP Tipps 2008 9 23.04.2008 15:53
Idee: Website mit uncrackbarem Serial Broadcast PHP Tipps 2007 13 23.02.2007 22:59
[Erledigt] komplette Website als Grafik speichern PHP-Fortgeschrittene 68 08.03.2006 21:29
[Erledigt] Mit Yahoo Mess. mit Usern auf Website ohne account chatten PHP-Fortgeschrittene 10 18.09.2005 22:02
Website auf php programmiert PHP Tipps 2005 3 07.02.2005 15:20
[Erledigt] spezielle schrift in der website HTML, Usability und Barrierefreiheit 23 12.12.2004 12:02
[Erledigt] schriften für website HTML, Usability und Barrierefreiheit 2 15.10.2004 09:57
Daten aus einer externen Website lesen via PHP Locutus007 PHP Tipps 2004 4 29.09.2004 17:20
[Erledigt] Browser und MSG Box HTML, Usability und Barrierefreiheit 4 17.08.2004 18:40
[Erledigt] Fehlermeldung auf der Website nach dem Veröffentlichen PHP Tipps 2004 6 10.07.2004 15:03

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
website crawler, crawler programmieren, webseiten crawler, crawler programmieren php, content crawler, websitecrawler, crawler php, crawler website, php site crawler, php content crawler, website-crawler, php crawler, php website crawler, website crawler programmieren, content crawler php, fremde websites crawlen, website crawler php, http://www.php.de/off-topic-diskussionen/61070-tipp-website-crawler-der.html, php html crawler, site crawler

Alle Zeitangaben in WEZ +2. Es ist jetzt 14:53 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum