|
|
|
|
|
|
|
#1 (permalink) |
|
Neuer Benutzer
Registriert seit: 23.07.2009
Beiträge: 4
PHP-Kenntnisse: Fortgeschritten ![]() |
Hallo php-Forum, ich bin frisch angemeldet und hoffe auf Unterstützung.
Ich möchte für eine Plattform die Möglichkeit implementieren, Fotos über Twitter einzureichen. Die Software muss also in einem Stream von Twitter-Nachrichten die Links auswerten und die entsprechenden Bilder finden. Das Problem: Es gibt eine Vielzahl verschiedener Dienste, die Bilder hosten und dann den Link darauf auf Twitter posten. Das verlinkte Bild wird selbstverständlich nicht direkt angezeigt, sondern eingebunden in eine Website, mit weiteren Thumbnails, Werbung, etc. (Beispiel Another for @shawnelledge on Twitpic ) Die Aufgabe ist also: Dem Link folgen und herausfinden, hinter welchem img-Tag das wichtigste Bild steckt. Man könnte die Struktur der Seiten manuell analysieren, das ist aber wegen der vielen verschiedenen Dienste eher auswegslos. Mein Ansatz ist bisher: Das eigentliche Bild wird sehr wahrscheinlich die größte Grafik auf der Seite sein. Also muss ich auf der Seite (wie dem oben verlinkten Beispiel) das img-Tag finden, das am größten angezeigt wird. Es gibt PHP-Skripte für Zugriff auf das DOM einer Seite (PHP Simple HTML DOM Parser), sowie für die CSS-Deklarationen (CSS parser - PHP Classes) Diese beiden so zu kombinieren, dass auch verschachtelte Elemente etc. zuverlässig erkannt werden, sodass für jedes img-Tag die Größe ausgelesen werden kann, wird aber kompliziert. Nach der langen Vorred also meine Fragen: - kennt jemand eine Bibliothek, die HTML und CSS parsen kann und dann für jedes Element Zugriff auf die Formatierungen bietet? - Oder gibt es vielleicht noch eine bessere Strategie, um mein Ziel zu erreichen, also das Bild auf so einer Seite zu erkennen? |
|
|
|
|
|
|
|
PHP Code Flüsterer
Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten
|
|
|
|
#2 (permalink) | |
|
Erfahrener Benutzer
Registriert seit: 05.04.2009
Beiträge: 291
PHP-Kenntnisse: Anfänger ![]() |
Zitat:
Mein Vorgehen wäre, durch alle IMG-SRC zu iterrieren und jeweils einen Head-Request abzusetzen, um die physikalische Bildgröße zu ermitteln. Vermutlich ist das bytemäßig größte Bild auch das Bild mit den größten Dimensionen (width/height). Im Zweifel kann unter den Favoriten noch mittels Remote-getimagesize() ausgesiebt werden. War jetzt nur so eine erste naive Idee von mir. Ein Emulator für eine Browser-Engine wäre natürlich perfekt. |
|
|
|
|
|
|
#5 (permalink) |
|
Neuer Benutzer
Registriert seit: 23.07.2009
Beiträge: 4
PHP-Kenntnisse: Fortgeschritten ![]() |
@yab:
Die Idee mit der Bilddateigröße ist eine gute Alternative, danke. Da es sich fast immer um Fotos handeln dürfte, wird es wohl auch kaum passieren, dass da irgendwo mal ein Bild dabei ist, das plötzlich super komprimiert werden kann und damit die Regel sprengt... getimagesize() hatte ich auch noch gar nicht im Auge, schätze mal, dass das auch die rechen- und bandbreitenintensivste Variante ist. @fritz_07: Ja, die ganzen SimpleXML-Funktionen helfen beim HTML parsen. Aber siehst du eine Möglichkeit, darüber auch auf die Attribute aus dem CSS-Stylesheet zuzugreifen? Geändert von joux (24.07.2009 um 12:07 Uhr). Grund: Bildgröße meint Bilddateigröße... |
|
|
|
|
|
#6 (permalink) |
|
moderatives Dielektrikum
Registriert seit: 21.05.2008
Beiträge: 21.192
PHP-Kenntnisse: Fortgeschritten ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Über CSS kannst DU das imho vergessen. Ein Bild in Vollgrösse muss nicht zwingend CSS Angaben gesetzt haben, oder?
__________________
-- „Eins ist Fakt: Gescannt wird nackt!“ Privatsphäre 2.0 - Nacktscanner mit Eyetracking. Unser Flugzeug darf kein geschlechtsfreier Raum sein. -- |
|
|
|
|
|
#7 (permalink) |
|
Supermoderator
Registriert seit: 16.03.2008
Beiträge: 6.051
PHP-Kenntnisse: Fortgeschritten ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Themenmoderation:
[→] Verschoben von Off-Topic Diskussionen
__________________
Programm Bürgerschutz: Geistiges Eigentum: alles ist käuflich! ― Kinderschutz: haltet die Eltern fern! ― Einbruchsprävention: sperrt den Weihnachtsmann weg! |
|
|
|
|
|
#8 (permalink) | |
|
Neuer Benutzer
Registriert seit: 23.07.2009
Beiträge: 4
PHP-Kenntnisse: Fortgeschritten ![]() |
Zitat:
Also, danke für die Aufmerksamkeit. |
|
|
|
|
|
| Themen-Optionen | |
| Thema bewerten | |
|
|
Ähnliche Themen
|
||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| zugriff auf mysql von aussen. | nieselfriem | Datenbanken | 7 | 25.12.2008 22:00 |
| Zugriff mit session auf Ordner begrenzen | Diego1978 | PHP Tipps 2008 | 1 | 08.07.2008 06:38 |
| Zugriff beschränken | paper | PHP Tipps 2008 | 9 | 04.05.2008 12:13 |
| Direkten Zugriff auf Datenbank verhindern | heyho | PHP Tipps 2008 | 7 | 07.02.2008 11:41 |
| Zugriff auf eine ORACLE DB die Daten in eine MYSQL schreiben | Cheesy | PHP Tipps 2007 | 5 | 12.06.2007 15:36 |
| Zugriff auf Objekte anderer Klassen | nieselfriem | PHP Tipps 2007 | 7 | 14.05.2007 12:48 |
| Zugriff verweigert...? | amenhotheb | PHP Tipps 2006 | 4 | 11.07.2006 16:23 |
| Zugriff auf postgresql-db mit php | PHP Tipps 2006 | 6 | 25.01.2006 09:29 | |
| gleichzeitiger Zugriff auf 2 Datenbanken | dh1sbg | PHP-Fortgeschrittene | 3 | 27.12.2005 12:41 |
| Objektorientierter Zugriff auf Multidimensionale Arrays | PHP-Fortgeschrittene | 31 | 26.11.2005 21:46 | |
| Verzeichnis (Dateien) schützen aber per PHP zugriff zulassen | Server, Hosting und Workstations | 2 | 16.10.2005 10:13 | |
| Wie Ordner und Inhalt vor unberechtigten Zugriff schützen | Riot | PHP Tipps 2005-2 | 30 | 06.10.2005 21:18 |
| Zugriff auf phpmyadmin | PHP Tipps 2005 | 1 | 28.02.2005 18:41 | |
| [Erledigt] Letzter zugriff von Datei anzeigen | PHP Tipps 2005 | 13 | 17.01.2005 18:20 | |
| .htaccess verweigert meinen zugriff | HTML, Usability und Barrierefreiheit | 4 | 22.09.2004 17:28 | |