php.de

Zurück   php.de > Webentwicklung > PHP Einsteiger > PHP Tipps 2005

 
 
LinkBack Themen-Optionen Thema bewerten
Alt 17.05.2005, 13:06  
Gast
 
Beiträge: n/a
Standard Analyse von eingehenden E-Mails

Hallo

ich möchte eingehende E-Mails dahingehend analysieren, ob sie aggressiv oder sehr aggressiv sind.

Wie ich das umzusetzen habe ist mir eigentlich klar:

- man muss eine Reihe von Stichwörtern zusammentragen, nach der die E-Mail durchsucht wird
- man muss den Stichwörtern ein Ranking oder eine Punktzahl zuweisen
- dann muss man den Body der Nachricht successive nach den Stichwörtern durchforsten. Bei jedem Treffer wird der Score entsprechend der Punktzahl des Stichwortes erhöht.

Als Stichwort dient quasi alles was den Puls steigen lässt:

- Schimpfwörter
- Art der Ansprache (z.b. "Herr Mustermann!" statt "Sehr geehrter Herr Mustermann")
- Art des Abschieds (z.B. "auf nimmer wiedersehen!" statt "Mit freundlichen Grüßen")
- Bedrohende Stichwörter (z.B. "mein Anwalt", "meinem Anwalt", "guten Anwalt", "vor Gericht", "gerichtliche Schritte", "rechtliche Schritte", "gegen Sie")

Der Sinn des ganzen: Der E-Mail Client soll bereits im Vorfeld, vor dem lesen der Nachricht darauf aufmerksam machen, das einem diese E-Mail die gute Laune verderben könnte
Ausserdem soll die E-Mail in einem speziellen Modus gelesen werden können, in dem alle diese Faktoren die einem aufs Gemüt schlagen abgedämpft werden, in dem z.B. erst einmal die Schimpfwörter durch freundliche Begriffe ersetzt werden.

In diesem Thread würde ich gerne mit euch darüber diskutieren was die eleganteste Art wäre, eine E-Mail auf "aggressivität" hin zu untersuchen, und welches die wichtigsten Begriffe und Strings sind die man abdecken muss. Sowie natürlich die Gewichtung bzw. die Punktzahl. Ein "Sie verdammtes A....loch!" hat einen höheren Score als "Sie sind ein Schelm!".

Schimpfwörter sind in diesem Forum nicht erlaubt, soweit ich weis werden die sogar in nette Begriffe umgesetzt... also am besten Punkte dazwischen setzen :P
 
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 17.05.2005, 13:29  
Matthias959
Gast
 
Beiträge: n/a
Standard

Schau mal hier: http://www.schimpfwoerter.de/index.php

Zum Suchen der Schimpförter und der "bedrohenden Szichwörter" würde ich preg_match_all() verwnden ( http://de2.php.net/manual/de/functio...-match-all.php )
Am besten wäre es die Wörter in einer DB abzuspeichern, da man so neu Wörter am leichtesten hinzufügen könnte.

Wird aber auf jeden Fall nicht einfach werden! :wink:
 
Alt 17.05.2005, 14:04  
Gast
 
Beiträge: n/a
Standard

Danke für den Link

Zitat:
Zum Suchen der Schimpförter und der "bedrohenden Szichwörter" würde ich preg_match_all() verwenden
um etwas zu finden, was zwischen zwei Begriffen steht? Nenn mal Beispiele...

ich hatte mir das etwa so gedacht: In der DB stehen alle Strings (Schimpfwörter, Begriffe im Kontext) zusammen mit der Punktzahl. Das Skript holt sich alle Begriffe aus der DB und scannt für jeden Begriff den mailbody. Ein match zählt den Score dann entsprechend hoch. Zum ersetzen gegen freundlichere Dinge müsste man dann mit preg_replace arbeiten, wo man ja gleichzeitig prüfen kann ob ein replace stattgefunden hat.

Die Idee ist vielleicht gar nicht so abwegig, oder?: Beim lesen der Nachricht bewertet man diese anschließend selbst mit "freundlich, neutral, aggressiv, sehr aggressiv". Die gefundenen Begriffe / Strings gehen als Input zusammen mit dem Score und der Bewertung an ein neuronales Netz, welches man auf diese Weise trainiert. Das trainierte Netz wird wieder abgespeichert, und bei der nächsten Mail ist es bereits ein stückchen schlauer geworden. Die gefundenen Begriffe gehen mit dem Score als Input rein, und der Output wäre die Bewertung. Denn jeder interpretiert solche Begriffe ja anders. Frage mich aber gerade wieviel Speicher das kosten wird.
 
Alt 17.05.2005, 16:20  
Matthias959
Gast
 
Beiträge: n/a
Standard

Zitat:
Zum ersetzen gegen freundlichere Dinge müsste man dann mit preg_replace arbeiten, wo man ja gleichzeitig prüfen kann ob ein replace stattgefunden hat.
Stimmt! Habe mich geirrt.

Zitat:
Frage mich aber gerade wieviel Speicher das kosten wird.
Kommt ganz darauf an wie viele User das System benutzen und ob du die Mail einmal in "zensierter" Form und in normaler oder nur in einer der beiden Formen speicherst.
 
Alt 17.05.2005, 16:55  
Gast
 
Beiträge: n/a
Standard

Zitat:
Kommt ganz darauf an wie viele User das System benutzen und ob du die Mail einmal in "zensierter" Form und in normaler oder nur in einer der beiden Formen speicherst.
die Zensur würde ich immer "on the fly" machen; Die Bewertung würde ich dagegen speichern. Oder sowas in der Art: Man klickt auf eine Mail, und falls sie "böse" ist erscheint erst ein Fenster mit einer Warnung. Dann hat man die Wahl ob man erstmal die zensierte Version lesen will. Beim Antworten wird natürlich immer die Original-Version dran gehängt, sonst fühlt sich der betreffende vielleicht veräppelt.

Das System wird von mehreren Usern benutzt... etwa 500 soll es ab können.
 
 


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
HILFE: zurücksenden von Mails deren Mailadresse falsch ist PHP Tipps 2006 3 01.05.2006 12:50
Interne Mails ver-/entschlüsseln wegen Datenschutz PHP Tipps 2006 2 28.01.2006 21:36
Mails an PHP übergeben und Inhalt auslesen? ThaRider PHP Tipps 2006 16 16.01.2006 21:59
Kann keine Mails verschicken! b++ PHP Tipps 2007 10 29.12.2005 18:17
[Erledigt] Exim --- Mailserver empfängt keine Mails Server, Hosting und Workstations 4 23.12.2005 18:28
Mails kommen nicht an mit Hamster/Mercury bicpi PHP-Fortgeschrittene 10 26.10.2005 15:03
IMAP: Mails dekodieren DirkHo PHP Tipps 2005-2 0 12.07.2005 15:51
mail() versucht die Mails als wwwrun an den SMTP Server zu l Server, Hosting und Workstations 3 15.06.2005 11:25
Timeout beim Mails versenden PHP-Fortgeschrittene 5 08.03.2005 15:48
Mails mit PHP empfangen themonk PHP Tipps 2005 11 04.01.2005 20:09
mails aus kmail exportieren dws Server, Hosting und Workstations 0 21.12.2004 22:32
mails los werden Spyker Server, Hosting und Workstations 3 02.09.2004 19:46
Server verschickt keine Mails mehr PHP Tipps 2004 14 12.07.2004 14:25
[Erledigt] Mails und MySQL Datenbanken 2 10.06.2004 13:25

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
auf eingehende e mail aufmerksam machen

Alle Zeitangaben in WEZ +2. Es ist jetzt 13:52 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum

Creative Commons License
Dieser Inhalt ist unter einer Creative Commons-Lizenz lizenziert.