php.de

Zurück   php.de > Webentwicklung > PHP-Fortgeschrittene

PHP-Fortgeschrittene Arbeiten mit PHP ohne Einschränkungen

Antwort
 
LinkBack Themen-Optionen Thema bewerten
Alt 13.11.2010, 20:18  
Erfahrener Benutzer
 
Benutzerbild von serious-cool
 
Registriert seit: 12.09.2008
Beiträge: 154
PHP-Kenntnisse:
Fortgeschritten
serious-cool befindet sich auf einem aufstrebenden Ast
Standard [Erledigt] PDF Analyse

Hallo,
ich suche eine lib mit der ich PDF Dateien analysieren kann. Ich möchte feststellen wie viele Seiten farbig sind und ob das Dokument leere Seiten enthält.

PDFlib TET scheint das für ca. 1000 Euro zu können Wäre schön wenn es auch eine freie Variante gäbe...

Habt Ihr Vorschläge womit ich das umsetzen könnte?
__________________
Ein Klauenhammer ist kein Schraubendreher, auch wenn beide das Problem ,,Schraube-Wand" bidirektional lösen können.
serious-cool ist offline   Mit Zitat antworten
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 14.11.2010, 16:24  
Erfahrener Benutzer
 
Benutzerbild von serious-cool
 
Registriert seit: 12.09.2008
Beiträge: 154
PHP-Kenntnisse:
Fortgeschritten
serious-cool befindet sich auf einem aufstrebenden Ast
Standard

Über einen normalen fopen Durchlauf komme ich problemlos an die Metadaten und Klarschriften ran...

Aber wie komme ich an die Eigenschaften der
Code:
<</Filter/FlateDecode/Length 1573>>stream
Tags ran?

Wisst Ihr vielleicht wie, oder womit die Inhalte Codiert sind? Decodiermaßnahmen?
__________________
Ein Klauenhammer ist kein Schraubendreher, auch wenn beide das Problem ,,Schraube-Wand" bidirektional lösen können.
serious-cool ist offline   Mit Zitat antworten
Alt 14.11.2010, 22:36  
erc
Erfahrener Benutzer
 
Registriert seit: 02.01.2009
Beiträge: 730
PHP-Kenntnisse:
Fortgeschritten
erc wird schon bald berühmt werden
Standard

Ich glaube das einfachste ist die PDF in Bilder umzuwandlen und dann Pixel für Pixel zu schauen ob die Seiten bunt oder leer sind.


Zitat:
Zitat von serious-cool Beitrag anzeigen
Aber wie komme ich an die Eigenschaften der
Code:
<</Filter/FlateDecode/Length 1573>>stream
Tags ran?

Wisst Ihr vielleicht wie, oder womit die Inhalte Codiert sind? Decodiermaßnahmen?
Adobe hat vor Jahren das Format offengelegt. Mit ein wenig Googlen findest du schnell die offiziellen Spezifikationen dafür.
erc ist offline   Mit Zitat antworten
Alt 15.11.2010, 11:02  
Erfahrener Benutzer
 
Benutzerbild von serious-cool
 
Registriert seit: 12.09.2008
Beiträge: 154
PHP-Kenntnisse:
Fortgeschritten
serious-cool befindet sich auf einem aufstrebenden Ast
Standard

Die Spezifikationen von Adobe sind für mich eher Bahnhof Mir fehlt es da noch etwas an Erfahrung...

Die Idee mit den JPGs klingt allerdings vielversprechend. Bin mal gespannt was die Performance macht, wenn das Dokument 300 Seiten hat.
__________________
Ein Klauenhammer ist kein Schraubendreher, auch wenn beide das Problem ,,Schraube-Wand" bidirektional lösen können.
serious-cool ist offline   Mit Zitat antworten
Alt 16.11.2010, 21:12  
Erfahrener Benutzer
 
Benutzerbild von serious-cool
 
Registriert seit: 12.09.2008
Beiträge: 154
PHP-Kenntnisse:
Fortgeschritten
serious-cool befindet sich auf einem aufstrebenden Ast
Standard

Also... In der Theorie funktioniert das ganze. Allerdings ist die Serverlast enorm. Als ,,quick-and-dirty" Lösung habe ich mir ein JAVA Programm gebastelt welches die Analyse übernimmt...
__________________
Ein Klauenhammer ist kein Schraubendreher, auch wenn beide das Problem ,,Schraube-Wand" bidirektional lösen können.
serious-cool ist offline   Mit Zitat antworten
Alt 16.11.2010, 22:02  
erc
Erfahrener Benutzer
 
Registriert seit: 02.01.2009
Beiträge: 730
PHP-Kenntnisse:
Fortgeschritten
erc wird schon bald berühmt werden
Standard

Wie machst du es jetzt? PDF in Rastergrafik umwandeln und dann Pixel für Pixel durchgehen? Wenn ja... dann skalier das Bild/er vorm analysieren mal Stark runter. Selbst mit 50x80Pixeln pro Seite sollte man zuverlässig feststellen können ob Inhalt vorhanden ist.
erc ist offline   Mit Zitat antworten
Alt 16.11.2010, 22:15  
Erfahrener Benutzer
 
Benutzerbild von serious-cool
 
Registriert seit: 12.09.2008
Beiträge: 154
PHP-Kenntnisse:
Fortgeschritten
serious-cool befindet sich auf einem aufstrebenden Ast
Standard

Ja, genau so! Allerdings mit 400x400 Px. Wenn ich weiter runter gehe verliere ich zu viele Farbinformationen. Evtl. werde ich die Skalierung noch dynamisch errechnen lassen.

Anforderungen waren: PDFs bis 200MB und Format A3-A5. Wenn ich die Analyse von PHP machen lasse ist da Sense.

Mein JAVA Prog. macht im Prinzip das selbe, nur die Serverlast lässt sich dank Threads besser im Zaum halten und die Performance ist wesentlich besser.

(Leider Closed-Source sonst würde ich das ganze posten )
__________________
Ein Klauenhammer ist kein Schraubendreher, auch wenn beide das Problem ,,Schraube-Wand" bidirektional lösen können.
serious-cool ist offline   Mit Zitat antworten
Alt 18.11.2010, 11:51  
erc
Erfahrener Benutzer
 
Registriert seit: 02.01.2009
Beiträge: 730
PHP-Kenntnisse:
Fortgeschritten
erc wird schon bald berühmt werden
Standard

Zitat:
Zitat von serious-cool Beitrag anzeigen
Mein JAVA Prog. macht im Prinzip das selbe, nur die Serverlast lässt sich dank Threads besser im Zaum halten und die Performance ist wesentlich besser.
Wie wandelst du die PDF mit Java in eine Rastergrafik um? Nimmst du was externen wie Ghostscript, Imagemagick, usw. oder gibts da eine sinnvolle Java Lib für?
erc ist offline   Mit Zitat antworten
Antwort


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Aufräumarbeiten - Analyse / Strukturübersicht / Zusammenhänge Arminius PHP-Fortgeschrittene 7 26.02.2010 15:17
Prepared Statements immer einsetzen? Sangreal PHP-Fortgeschrittene 10 19.10.2009 09:28
analyse im hintergrund? Screeze PHP Tipps 2009 6 01.03.2009 21:15
Analyse von eingehenden E-Mails PHP Tipps 2005 4 17.05.2005 16:55

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
pdf analysieren, pdf analyse, php pdf analysieren, php analyse pdf, automatisch pdf analysieren, php pdf analyse, pdf analysieren php, php analyze pdf, pdf dokumente mit php analysieren, pdf analyse php, pdf-analyse, pdf analysieren java, analyse pdf java, wie viele seiten farbig in pdf, java pdf analyse, pdf analyse java, php analyse pdf file, imagemagick pdf analysieren, analyse pdf php, grafiken in pdf datei analysieren

Alle Zeitangaben in WEZ +2. Es ist jetzt 01:15 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum