Hallo, ich suche ein php tool, um auf Postadressen, die sich in ihrer Schreibweise unterscheiden, eine Dublettenprüfung anzuwenden. Gibt es so etwas fertig oder hat jemand so etwas schon mal gemacht?
Ankündigung
Einklappen
Keine Ankündigung bisher.
Dubletten check für Postadressen
Einklappen
Neue Werbung 2019
Einklappen
X
-
Ich kenne Non-PHP Tools dafür, würden dir die was bringen?
IMHO gibt es keine Tools in PHP dafür, ein Doublettencheck ist nicht trivial und extrem Speicherintensiv - ich denke, je nach Adressbestand wird der Speicher von PHP nicht mehr ausreichen (das Tool, was wir benutzen, belegt für 100.000 Adressen schonmal gerne einige hundert MB RAM)
Wenn du es tatsächlich selber programmieren willst, meld dich nochmal hier, dann kann man Details durchgehen.. ich würds allerdings nicht unbedingt empfehlen, sondern für etwas fertiges plädieren.Über 90% aller Gewaltverbrechen passieren innerhalb von 24 Stunden nach dem Konsum von Brot.
-
Gast
-
Sinnvollerweise sollte man die Daten erstmal atomar halten, das wäre schon die halbe Miete.[COLOR="#F5F5FF"]--[/COLOR]
[COLOR="Gray"][SIZE="6"][FONT="Georgia"][B]^^ O.O[/B][/FONT] [/SIZE]
„Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
[URL="http://www.php.de/javascript-ajax-und-mehr/107400-draggable-sorttable-setattribute.html#post788799"][B]Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“[/B][/URL][/COLOR]
[COLOR="#F5F5FF"]
--[/COLOR]
Kommentar
-
Ich würde mal eher sagen 1/4 Miete
Ich dachte jetzt spontan an Kölner Phonetik, aber bin mir nicht sicher, ob das in diesem Zusammenhang zu gebrauchen ist. Gerade wenn ich mir einen Hochhausblock vorstelle, in dem es tatsächlich eine S. Meier und eine S. Mayer gibt. Außer natürlich man beschränkt sich beim Normalisieren der Adressen auf Dinge wie Str. vs Straße vs Strasse.
Kommentar
-
Gerade wenn ich mir einen Hochhausblock vorstelle, in dem es tatsächlich eine S. Meier und eine S. Mayer gibt.[COLOR="#F5F5FF"]--[/COLOR]
[COLOR="Gray"][SIZE="6"][FONT="Georgia"][B]^^ O.O[/B][/FONT] [/SIZE]
„Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
[URL="http://www.php.de/javascript-ajax-und-mehr/107400-draggable-sorttable-setattribute.html#post788799"][B]Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“[/B][/URL][/COLOR]
[COLOR="#F5F5FF"]
--[/COLOR]
Kommentar
-
Mit der Kölner Phonetik habe ich einen halben Tag herumgedoktort. Dieser Algorhythmus ist nicht zu gebrauchen.
Beim Dublettencheck in Adressenlisten geht es vor allem darum, Haushaltsdubletten zu eliminieren. Wenn man zu den o.g. Kriterien noch weitere Erfassungsmerkmale hinzunimmt, dann kann man aber auch die beiden Frau Mayer/Meyer im gleichen Hochhaus noch unterscheiden.[PHP]if ($var != 0) {
$var = 0;
}[/PHP]
Kommentar
-
Mit der Kölner Phonetik habe ich einen halben Tag herumgedoktort. Dieser Algorhythmus ist nicht zu gebrauchen.
Ich würde ne reine Buchstabenanalyse machen. Vorher noch die üblichen Verdächtigen (Str. oder Strasse statt Straße) abfangen und nicht alphanum. Zeichen komplett rauswerfen.[COLOR="#F5F5FF"]--[/COLOR]
[COLOR="Gray"][SIZE="6"][FONT="Georgia"][B]^^ O.O[/B][/FONT] [/SIZE]
„Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
[URL="http://www.php.de/javascript-ajax-und-mehr/107400-draggable-sorttable-setattribute.html#post788799"][B]Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“[/B][/URL][/COLOR]
[COLOR="#F5F5FF"]
--[/COLOR]
Kommentar
-
http://mcsodbrenner.blogspot.com/
Serpent PHP Template Engine: http://code.google.com/p/serpent-php-template-engine/
Kommentar
Kommentar