| | | | |
| |||||||
| PHP-Fortgeschrittene Arbeiten mit PHP ohne Einschränkungen |
|
| | LinkBack | Themen-Optionen | Thema bewerten |
| | |
| PHP Code Flüsterer Registriert seit: 21.08.2005 Beiträge: 4682 PHP-Kenntnisse: Fortgeschritten | |
| | |
| Neuer Benutzer Registriert seit: 17.10.2008
Beiträge: 21
PHP-Kenntnisse: Fortgeschritten ![]() | Hallo, zunächst ein Hinweis - ich empfinde es nicht als sehr klug, die Daten zunächst in einem Array zu halten und dann anschließend wegzuschreiben. Ok sagen wir es mal so - es ist abhängig von der Datenmenge. Bei sehr großen CSV Dateien kann es dann aber schnell ans Memory Limit gehen und dann ist aus die Maus. Bei kleinen CSV Dateien ist das jedoch kein Problem. ok nun mal zu deiner Lösung: PHP-Code: Ich würde die Daten jedoch direkt in die DB schreiben und innerhalb der Funktion mit einer DB Abfrage arbeiten. Grüße Robsen Geändert von Robsen (17.10.2008 um 23:44 Uhr). |
| | |
| | |
| Neuer Benutzer | Hallo Robsen, die Sache mit dem Memory Limit habe ich schnell erfahren, leider ist es mir nicht erlaubt Daten direkt in die Datenbank zu schreiben, das Script laeuft Lokal und liest die Daten aus einer Online DB, meine Abhilfe bisher war einfach die CSV Datein zu verkleinern und das Memory Limit zu erhöhen. Mein Skript sah letzendlich wie folgt aus, versuche aber das aber jetzt nochmal an hand von deinen Tipps zu optimieren PHP-Code: PHP-Code: |
| | |
| | |
| Moderator Registriert seit: 11.05.2008
Beiträge: 6.065
![]() ![]() ![]() ![]() ![]() ![]() ![]() | Gehts dir also jetzt nurnoch um die Performance oder klappt das ganze Skript nicht? CSV in die MySQL druecken: MySQL :: MySQL 5.0 Reference Manual :: 12.2.6 LOAD DATA INFILE Syntax Levenshtein als STORED PROCEDURE: codejanitor Levenshtein Distance as a MySQL Stored Function |
| | |
| | |
| Neuer Benutzer | Geht mir nur noch um die Performance, mit den Ergebnissen des Skripts bin ich sehr zufrieden, meine Vorgehensweise ist das ich mir alle möglichen Dubletten auflisten lasse, um dann anschliessend Manuell zu entscheiden was eine Dublette ist. Schaue mir das mit dem MySql auch nochmal an, theoritisch waere möglich das ich die CSV in eine Temporaere Tabelle einlese um dann von dort aus weiter zu arbeiten, muss ich mal mit dem Admin klaeren. Danke. |
| | |
|
| Themen-Optionen | |
| Thema bewerten | |
|
|
| Besucher kamen über folgende Suchanfragen bei Google auf diese Seite |
| php array dubletten entfernen, php array dubletten, sql dubletten finden, mysql dublettensuche, csv dublettensuche, php dubletten aus array entfernen, php array doubletten, http://www.php.de/php-fortgeschrittene/47696-dublettensuche.html, php array dubletten löschen, php dubletten in array, dupletten aus array entfernen, dublettensuche sql, mysql dubletten löschen, array php dubletten, mysql dubletten entfernen, dublettensuche mysql, sql dubletten, sql dubletten anzeigen, php array dubletten filtern, php dublettensuche |