php.de

Zurück   php.de > Webentwicklung > JavaScript, Ajax und mehr

JavaScript, Ajax und mehr dynamisches Scripten und Interaktion auf Clientebene

Antwort
 
LinkBack Themen-Optionen Thema bewerten
Alt 14.12.2009, 12:23  
Erfahrener Benutzer
 
Registriert seit: 06.03.2009
Beiträge: 166
PHP-Kenntnisse:
Anfänger
strgg ist zur Zeit noch ein unbeschriebenes Blatt
Standard Verständnisfrage Javascript zu PHP

Hallo zusamme

Verständnisfrage Ajax/JS

Durch Firebug ist mir schon lange aufgefallen, dass der Quelltext/Browser einer Webseite markant reduziert ist im Vergleich zu der Darstellung im Firefox bezogen auf Javascript & Ajax-Elemente.

Als konkretes Beispiel JS-timed div's: im Sourcecode vom Browser sind diese versteckt bis zum Eventtrigger. Nimmt man hingegen den Firebug und analysiert/bearbeitet den kompletten body, so kriegt man bereits eine Voransicht der faktisch im "Sourcecode-Browser" inhärent lauernden Prozesse/Schnippsel.

Warum denke ich, dass dies in gewissen Fällen von Bedeutung ist?
Crawling
Ich frage mich nun, welche Ansicht unser Crawler vorgesetzt bekommt oder ob diese gar, das richtige Know-how vorausgesetzt, der vollumfänglichen Ansicht von Firebug nahe kommt. Ich für meinen Teil konnte bisher noch nie solche Elemente vorzeitig inspizieren/crawlen

Theoretisch sollte man ja die Trigger oder Events mit PH-CURL/Xpath ansprechen können oder gar überschreiben, nur befürchte ich das dies wahrscheinlich extrem kompliziert werden wird.

Wäre interessant zu erfahren, ob dieser Bereich ev. gar nich so schlimm ist (für Anfänger) und wie sich die Abgrenzung Ajax/JS-Crawling zu PHP-Crawling, falls überhaupt, vollzieht.

Grüsse
strgg ist offline   Mit Zitat antworten
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 14.12.2009, 13:36  
Erfahrener Benutzer
 
Registriert seit: 21.12.2004
Beiträge: 5.234
PHP-Kenntnisse:
Fortgeschritten
mepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblick
mepeisen eine Nachricht über ICQ schicken mepeisen eine Nachricht über Skype™ schicken
Standard

Sortiere bitte deine Gedanken und stelle deine Fragen nochmal. Der Crawler sieht das, was du siehst. Firebug zeigt dir immer den aktuellen Stand an inklusive aller potentieller Änderungen über JavaScript. Der Crawler sieht das nur, wenn er das JavaScript ausführt bzw. sich um dieses JavaScript verstehen würde.
__________________
www.php-maven.org PHP und Maven vereint: Build/Deploy/Produktion/Konfiguration, Projekt Management, CI, PHPUnit, zahlreiche Frameworks
Twitter @ https://twitter.com/#!/mepeisen und Facebook @ http://t.co/DZnKSUih
mepeisen ist offline   Mit Zitat antworten
Alt 14.12.2009, 14:49  
Erfahrener Benutzer
 
Benutzerbild von Dark Guardian
 
Registriert seit: 10.10.2009
Beiträge: 2.630
PHP-Kenntnisse:
Fortgeschritten
Dark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekannt
Standard

Der Crawler sieht das was du siehst wnen du in dienem Browser auf "Quelltext anzeigen" klcikst.

Außer er führt das JavaScript aus...
__________________
"Alles im Universum funktioniert, wenn du nur weißt wie du es anwenden musst".
Dark Guardian ist offline   Mit Zitat antworten
Alt 14.12.2009, 15:04  
Erfahrener Benutzer
 
Registriert seit: 06.03.2009
Beiträge: 166
PHP-Kenntnisse:
Anfänger
strgg ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Der Crawler sieht das was du siehst wnen du in dienem Browser auf "Quelltext anzeigen" klcikst.
Und eine Library/Module das wie ein Browser JS interpretiert existiert für einen Crawler nicht?

Ich denke nur, dass es einfacher wäre wenn der Crawler, anstatt die Events einzeln zu laden, die ganze Umgebung bereits wie ein Browser, welcher Javascript interpretiert, präsentiert kriegt. Da sollte es doch was geben wie ein Javainterpetierendes Modul/Webbrowser für PHP. Zumindest jedoch eine Library welche alle nur bekannten Javascript-triggers automatisch durchgeht und auslöst.

Oder etwa nicht??

Zitat:
Sortiere bitte deine Gedanken
Ist in Planung


Thanks

Geändert von strgg (14.12.2009 um 15:08 Uhr).
strgg ist offline   Mit Zitat antworten
Alt 14.12.2009, 15:17  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 35.987
PHP-Kenntnisse:
Fortgeschritten
nikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunftnikosch hat eine strahlende Zukunft
Standard

Welchen Sinn sollte das haben? Javascript wird vorwiegend verwendet, um Nutzeraktionen und zeitlich versetzte Aktionen zu steuern. Beides macht für eine Maschine, die Plaintext abgreift keinen Sinn. Oder wie lange soll der Crawler denn bitte warten, bis etwas passiert?
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist offline   Mit Zitat antworten
Alt 14.12.2009, 15:25  
Moderator
 
Benutzerbild von robo47
 
Registriert seit: 03.09.2004
Beiträge: 11.792
PHP-Kenntnisse:
Fortgeschritten
robo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz seinrobo47 kann auf vieles stolz sein
Standard

Zitat:
Zitat von strgg Beitrag anzeigen
Und eine Library/Module das wie ein Browser JS interpretiert existiert für einen Crawler nicht?
wie welcher browser ? in welcher version ? es gibt durchaus standalone-implementierungen von javascript wie mozillas rhino. Und was hindert einen via z.b. Selenium oder ähnlichem einen echten browser fernzusteuern ? :P
Und wo ist für einen crawler eigentlich das problem ? der hat doch den kompletten html-quelltext vor sich, den interessiert display: none; doch in keinster weise oder ? Und alles weitere was via ajax durch klicks und so reinkommt, da muss man vorsichtig sein wenn der crawler nicht weis was er da tut beim ausführen


Zitat:
Ich denke nur, dass es einfacher wäre wenn der Crawler, anstatt die Events einzeln zu laden, die ganze Umgebung bereits wie ein Browser, welcher Javascript interpretiert, präsentiert kriegt. Da sollte es doch was geben wie ein Javainterpetierendes Modul/Webbrowser für PHP. Zumindest jedoch eine Library welche alle nur bekannten Javascript-triggers automatisch durchgeht und auslöst.
JAVA != JavaScript !!
Und was ist ein "bekannter Javascript-trigger" ?

Ein crawler der einfach alle javascript-funktionen die er findet , on-click/submit-events und soweiter ausführt ? sehr schön wenn dann z.b. post-requests dadurch getriggert werden in form von kontaktanfragen, suchen, anträge zum sperren von beiträgen oder sonstwas ... so einen crawler wollte ich auf meiner seite nicht, um sowas umzusetzen bräuchte der wohl ne gute KI die erkennen kann was sie da macht und ich denke das ist aktuell noch sehr unrealistisch
robo47 ist offline   Mit Zitat antworten
Alt 14.12.2009, 15:37  
Erfahrener Benutzer
 
Registriert seit: 06.03.2009
Beiträge: 166
PHP-Kenntnisse:
Anfänger
strgg ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Welchen Sinn sollte das haben? Javascript wird vorwiegend verwendet, um Nutzeraktionen ...
Die Entwicklung scheint klar dahin zu gehen, dass Ajax und Javascript zunehmende Verwendung bei Webprojekten findet/finden wird (GoogleA, Web2.0).

Ich stimme zu, dass der grösste Nutzen wenigen "Randdisziplinen" wie z.B. dem Crawlen vorbehalten ist, ansonsten dafür keine Notwendigkeit besteht.
Stichwort Tabs & Slides, Google Maps, Onclickevents, etc. halten in bedeutendem Masse Content für Crawler zurück in sofern dieser nicht mühsam mit den einzelnen Triggern mühsam interagiert.

Wundert mich halt, hinsichtlich der Segnung von komfortablen Klassen und Modulen für PHP, ob hier nicht auch welche für existieren. Wäre natürlich schön
strgg ist offline   Mit Zitat antworten
Alt 14.12.2009, 15:45  
Erfahrener Benutzer
 
Registriert seit: 21.12.2004
Beiträge: 5.234
PHP-Kenntnisse:
Fortgeschritten
mepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblickmepeisen ist ein wunderbarer Anblick
mepeisen eine Nachricht über ICQ schicken mepeisen eine Nachricht über Skype™ schicken
Standard

Robots.txt ist das Stichwort, das du suchst. Ansonsten gibt es für dererlei Dienste immer gut dokumentierte XML-Schnittstellen und eigenständige PHP-Bibliotheken.
__________________
www.php-maven.org PHP und Maven vereint: Build/Deploy/Produktion/Konfiguration, Projekt Management, CI, PHPUnit, zahlreiche Frameworks
Twitter @ https://twitter.com/#!/mepeisen und Facebook @ http://t.co/DZnKSUih
mepeisen ist offline   Mit Zitat antworten
Alt 14.12.2009, 16:07  
Erfahrener Benutzer
 
Benutzerbild von Dark Guardian
 
Registriert seit: 10.10.2009
Beiträge: 2.630
PHP-Kenntnisse:
Fortgeschritten
Dark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekanntDark Guardian ist jedem bekannt
Standard

Zitat:
Zitat von strgg Beitrag anzeigen
Wundert mich halt, hinsichtlich der Segnung von komfortablen Klassen und Modulen für PHP, ob hier nicht auch welche für existieren. Wäre natürlich schön
Selbst wenn sie existieren würden wäre das alles andere als "schön". Grund genug per Robots.txt alle Crawler auszuschließen die so etwas tun.

Google hat in Zukunft vor, Ajax Anfragen mit in die Crawler einzubeziehen, aber nur speziell solche die dafür gekennzeichnet sind. Wie robo47 schon bemerkt hat würd eein Crawler der blind jedes JS durchläuft eher Probleme auslösen als "helfen".


Demnächst kommen Crawler die einfach alle Formular 200 mal abschicken um zu sehen ob sie auf einer Seite mit "wertvollem" Content landen......
__________________
"Alles im Universum funktioniert, wenn du nur weißt wie du es anwenden musst".
Dark Guardian ist offline   Mit Zitat antworten
Alt 14.12.2009, 16:12  
Erfahrener Benutzer
 
Registriert seit: 06.03.2009
Beiträge: 166
PHP-Kenntnisse:
Anfänger
strgg ist zur Zeit noch ein unbeschriebenes Blatt
Standard

Zitat:
Robots.txt ist das Stichwort, das du suchst.
Muss zugeben, kenne ich bisher nur im Zusammenhang mit Crawlern aussperren mittels disallow.
Zitat:
Ansonsten gibt es für dererlei Dienste immer gut dokumentierte XML-Schnittstellen und eigenständige PHP-Bibliotheken.
Klingt gut, Danke mepeisen. In XML und Xpath hab ich mich bereits eingelesen, falls Du jedoch Links oder Literatur, auch zu anderen XML-Schnittstellen, hast freue ich mich sehr darüber.

Links zu PHP-Bibliotheken sehr gerne falls möglich, genau was ich gesucht habe

Irgendwie fasziniert mich halt dieses Teilgebiet. Danke für alle Hinweise

Grüsse


Zitat:
Demnächst kommen Crawler die einfach alle Formular 200 mal abschicken um zu sehen ob sie auf einer Seite mit "wertvollem" Content landen......
Da hast Du mich klar auf Deiner Seite. Denoch bin ich der Überzeugung, dass KI bei der Selektion von programmierten Triggern dem Menschen nicht viel nachstehen sollte. Schlussendlich durchforsten wir selbst ja auch den Code nach vorgelegten Mustern und selbst die Namensgebung der div's dient nicht der Interpretation sondern allein der Identifikation.

Beim Crawlen gibt es sehr viele Gebiete die vom Anbieter erwünscht sind (API) z.B. finanzdaten excerpt von google-finance, yahoo-finance, pokerhistories, datamining im allgemeinen, Indizierungen von Branchen, anonymisierte Statistiken, Youtube-embedding.

Ist halt faszinierend was mit PHP alles möglich ist auch wenn Crawling effizienterweise i.m.o in anderen EU wie Perl oder Ruby stattfinden sollte.

Geändert von strgg (14.12.2009 um 16:41 Uhr).
strgg ist offline   Mit Zitat antworten
Antwort


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
timing Probleme bzw Zusammenspiel PHP Javascript thica PHP Tipps 2009 2 19.02.2010 19:06
[Erledigt] Ersatz für Javascript Mort1ferus JavaScript, Ajax und mehr 6 12.10.2009 09:35
Wie lade ich ein Javascript nach einer AJAX Abfrage neu? da.eXecutoR JavaScript, Ajax und mehr 3 21.09.2009 11:15
[Erledigt] Ist das ok, wenn eine Webseite nur in PHP ist und komplett auf JavaScript coffeyn Off-Topic Diskussionen 15 21.08.2009 15:11
[Erledigt] JavaScript Weiche bei Formular? markus228 JavaScript, Ajax und mehr 1 09.08.2009 14:16
[Erledigt] Variable von Javascript mit 1x1px-Bild an PHP übergeben beneblack PHP Tipps 2009 18 03.05.2009 22:40
JS: Einführung - Javascript im Schichtenmodell nikosch Tutorials 4 11.04.2009 17:06
[Erledigt] Javascript in PHP Aufrufen coyboc PHP Tipps 2009 17 10.04.2009 15:28
1101: 10x JavaScript und kein Ende ist abzusehen… Nikolaus 2.0 Adventskalender 2008 9 13.12.2008 20:11
PHP + Javascript + MYSQL socke PHP Tipps 2006 4 02.04.2006 22:02
Variable wird geändert bei Übergabe an Javascript PHP Tipps 2007 4 17.12.2005 16:53
JavaScript in JavaScript geschriebene Html-Datei einbinden. woods HTML, Usability und Barrierefreiheit 6 06.09.2004 18:33
Javascript HTML, Usability und Barrierefreiheit 5 31.08.2004 18:30
php + Javascript, Variablenübergabe PHP Tipps 2004 14 28.07.2004 15:42

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
\javascript: trigger()\, javascript trigger, schwerer javascript oder php, crawler triggern, crawler aussperren liste java curl, ajax javascript trigger, php crawler javascripts interpret, javascript triggern, javascript trigger auslösen, was ist schwerer javascript oder php, maschinen steuerung mit ajax js php, crawler.js, google javascript crawler, crawler javascript formular prüfung, javascript crawler

Alle Zeitangaben in WEZ +2. Es ist jetzt 10:56 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum