php.de

Zurück   php.de > Webentwicklung > Datenbanken

Datenbanken SQL und Co

Antwort
 
LinkBack Themen-Optionen Thema bewerten
Alt 09.07.2009, 11:26  
Neuer Benutzer
 
Registriert seit: 09.07.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
phpstudent befindet sich auf einem aufstrebenden Ast
Standard SEARCH deutsche Alternative für PorterStemmer algorithmus?

Hier (auf www.roscripts.com) habe ich ein gutes Tutorial zum erstellen einer Suchfunktion gefunden, die auch für kleine Seiten geeignet sein soll (was bei der Boolean Full-Text Search nicht der Fall sein soll, so das Tutorial). Durchsucht werden die Inhalte einer Datenbank.

Im Code integriert wird der sogenannte Porter Stemmer algorithm, der Worte auf ihren Stamm reduziert, um mehr Hits bei einer Suche zu erreichen. Der Algorithmus ist für Suchen auf ENGLISCH gedacht.

Meine Frage:
- Ist er dennoch auf für DEUTSCH brauchbar?
- Gibt es eine Alternative, die für DEUTSCH gedacht und irgendwo frei erhältlich ist?
phpstudent ist offline   Mit Zitat antworten
Sponsor Mitteilung
PHP Code Flüsterer

Registriert seit: 21.08.2005
Beiträge: 4682
PHP-Kenntnisse:
Fortgeschritten

Alt 09.07.2009, 11:41  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 34.255
PHP-Kenntnisse:
Fortgeschritten
nikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz sein
Standard

Ich könnte mir vorstellen, dass Deutsch etwas komplizierter ist;
Hier der php Code zum Forschen

http://tartarus.org/~martin/PorterStemmer/php.txt
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist gerade online   Mit Zitat antworten
Alt 09.07.2009, 12:53  
Neuer Benutzer
 
Registriert seit: 09.07.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
phpstudent befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von nikosch Beitrag anzeigen
Ich könnte mir vorstellen, dass Deutsch etwas komplizierter ist;
Hier der php Code zum Forschen

http://tartarus.org/~martin/PorterStemmer/php.txt
Ich habe mir den Code mal etwas angesehen: Es sind sehr viele sprachspezifische Angaben (Standard-Endungen etc) darin enthalten, was ihn wohl für Deutsch defititiv unbrauchbar macht. Um den Code für Deutsch umzuschreiben sind vermutlich gute Sprachkenntnisse von Nöten oder mindestens von Vorteil. Da ich das selbst nicht bieten kann, wär's natürlich toll, wenn sich bereits jemand die Mühe gemacht hätte...

Ja, ich vermute auch, dass Deutsch etwas komplizierter sein könnte!
phpstudent ist offline   Mit Zitat antworten
Alt 09.07.2009, 12:58  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 34.255
PHP-Kenntnisse:
Fortgeschritten
nikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz sein
Standard

Yepp. Kein Grund, es nicht zu versuchen, oder? Du würdest sicher auch Hilfe hier erfahren.

Alternativ müsste man mal nach ner (guten) deutschen Stemmer Algorithmus Implementierung suchen. Die Programmiersprache ist da ja erstmal zweitrangig. Portiert bekommt man das dann schon.

Ich hätte an der Lösung auch unmittelbares Interesse, brauche demnächst auch eine Website-Suche.

Googlespucke:
http://kontext.fraunhofer.de/haenelt...g/stemming.pdf
http://snowball.tartarus.org/algorit...n/stemmer.html
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--

Geändert von nikosch (09.07.2009 um 13:09 Uhr).
nikosch ist gerade online   Mit Zitat antworten
Alt 09.07.2009, 13:59  
Neuer Benutzer
 
Registriert seit: 09.07.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
phpstudent befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von nikosch Beitrag anzeigen
Yepp. Kein Grund, es nicht zu versuchen, oder? Du würdest sicher auch Hilfe hier erfahren.

Alternativ müsste man mal nach ner (guten) deutschen Stemmer Algorithmus Implementierung suchen. Die Programmiersprache ist da ja erstmal zweitrangig. Portiert bekommt man das dann schon.

Ich hätte an der Lösung auch unmittelbares Interesse, brauche demnächst auch eine Website-Suche.

Googlespucke:
http://kontext.fraunhofer.de/haenelt...g/stemming.pdf
German stemming algorithm
Ein Versuch ist es bestimmt wert, allerdings eher längerfristig und nicht unbedingt sofort. In meinem aktuellen Webprojekt haben andere Funktionen höhere Priorität und mein Zeitbudget ist eher knapp.

Danke für die Links!
Das PDF-File ist hilfreich für die Basics und bei snowball.tartarus.org werde ich mich möglichst bald genauer umschauen!

Im allgemeinen haben bestimmt noch einige Leute an dieser Such-Variante Interesse. Insofern ist's schon beinahe verwunderlich, dass es das noch nicht fix-fertig gibt... oder ich hab's bloss noch nicht gefunden
phpstudent ist offline   Mit Zitat antworten
Alt 09.07.2009, 14:16  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 34.255
PHP-Kenntnisse:
Fortgeschritten
nikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz sein
Standard

Ich habe einen Foreneintrag woanders gefunden, die Quelle existiert aber nicht mehr. Kannst den Thread ja nochmal anstossen, wenn Du soweit bist

[edit]
Es gibt ein Drupalmodul, das eine deutsche PHP Implementierung im prozeduralen Stil enthält:

http://webscripts.softpedia.com/scri...oad-47530.html

Habs noch nicht getestet.

[edit2]

Habs jetzt getestet yund auch noch eine Stoppwortliste aus http://feya.solariz.de/wp-content/uploads/stopwords.txt drangehängt. Funktioniert, zum Einschätzen wie gut fehlt mir ein hinreichender Vergleich.
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--

Geändert von nikosch (09.07.2009 um 15:46 Uhr).
nikosch ist gerade online   Mit Zitat antworten
Alt 09.07.2009, 15:44  
Neuer Benutzer
 
Registriert seit: 09.07.2009
Beiträge: 4
PHP-Kenntnisse:
Anfänger
phpstudent befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von nikosch Beitrag anzeigen
Ich habe einen Foreneintrag woanders gefunden, die Quelle existiert aber nicht mehr. Kannst den Thread ja nochmal anstossen, wenn Du soweit bist

[edit]
Es gibt ein Drupalmodul, das eine deutsche PHP Implementierung im prozeduralen Stil enthält:

German Stemmer Download - Softpedia

Habs noch nicht getestet.
Danke auch für diesen Hinweis! Für heute mach ich schluss mit Programmieren, doch "I'll be back!"
phpstudent ist offline   Mit Zitat antworten
Alt 07.03.2010, 21:31  
Neuer Benutzer
 
Registriert seit: 07.03.2010
Beiträge: 4
PHP-Kenntnisse:
Anfänger
Newbie befindet sich auf einem aufstrebenden Ast
Standard texte stemmen

hallo community!

ich muß für die uni den stemmer verwenden, um texte zu stemmen. leider bin ich totalen neuling auf diesem gebiet. ich müßte den code doch auch verwenden können, welche das porter stemming umsetzt. fehlt dann nur noch die anbindung fürs texte aus datei einlesen und als neuen text ausgeben.

könnt ihr mir da weiter helfen? wäre mega! leider ist programmieren garnicht so mein fall
Newbie ist offline   Mit Zitat antworten
Alt 07.03.2010, 21:32  
moderatives Dielektrikum
 
Benutzerbild von nikosch
 
Registriert seit: 21.05.2008
Beiträge: 34.255
PHP-Kenntnisse:
Fortgeschritten
nikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz seinnikosch kann auf vieles stolz sein
Standard

Und was willst Du jetzt für Hilfe von uns?

PS: Bitte achte auf Deine Rechtschreibung! Wir stemmen die Postings hier nämlich nicht. Das wird alles von Menschen gelesen.
__________________
--
One pixel is still too big. Please make it smaller. ASAP.

Initiative Mittelstand.
Die wichtigste Gestaltungsregel im Screendesign ist Pi mal Daumen des Arbeitgebers.
--
nikosch ist gerade online   Mit Zitat antworten
Alt 07.03.2010, 21:51  
Neuer Benutzer
 
Registriert seit: 07.03.2010
Beiträge: 4
PHP-Kenntnisse:
Anfänger
Newbie befindet sich auf einem aufstrebenden Ast
Standard

Erstmal wissen, ob ich den Code für Drupal einfach so in meine PHP Entwicklungsumgebung als Datei einfügen und verwenden kann und dann, wie das Texte einlesen und abspeichern aussehen müßte.

Waren da bis auf Groß- und Kleinschreibung Fehler drin? Hab ich garnicht gesehen
Newbie ist offline   Mit Zitat antworten
Antwort


Themen-Optionen
Thema bewerten
Thema bewerten:

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are an
Gehe zu

Besucher kamen über folgende Suchanfragen bei Google auf diese Seite
stemming deutsch, stemming german, stoppwortliste deutsch, porter stemmer deutsch, porter stemmer german, php stemmer german, php snowball stemmer german, stemmer deutsch, php stemming german, php stemmer deutsch, stemming deutsch php, german stemmer php, stemming php german, php stemming deutsch, porter stemmer deutsch php, php porter stemmer german, porter stemmer php deutsch, deutsch stemming, porter stemmer german php, stemming php deutsch

Alle Zeitangaben in WEZ +1. Es ist jetzt 20:30 Uhr.




Powered by vBulletin® Version 3.7.2 (Deutsch)
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0
Aprilia-Forum, Aquaristik-Forum, Liebeskummer-Forum, Zierfisch-Forum, Geizkragen-Forum