Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] Suchbegriffe sinnvoll auslesen

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] Suchbegriffe sinnvoll auslesen

    Hi

    Ich habe die Freude und Ehre unentgeltlich für eine Verband das User-Interface zu einer Informationsdatenbank zu modifizieren.

    Die Datenbank speichert u. a. Suchbegriffe,

    die manuell von unterschiedlichen Usern für jedes einzelne Infodokument (PDFs)
    eingepflegt worden sind. Nun ist das Problem aufgekommen, dass die User, die nur suchen und selber nicht einpflegen, nur selten auf die richtigen Suchbegriffe kommen, nach denen man suchen könnte.

    Also soll ich jetzt dem User eine Liste mit allen möglichen Suchbegriffen einblenden, damit er es schneller peilt.

    Dummerweise sind die Suchbegriffe nicht einheitlich eingetragen:

    1) Subvention Hausbauer
    2) Bundesgrichtshof VIII Senat latente Steuern Drohverlustrückstellung
    3) Bundesgrichtshof zur Abschreibung von Perücken
    4) Umsatzsteuer, Massenmailings,

    Soll heißen es gibt Mehrfachnennungen, Trennung durch Leerzeichen und Komma, durch Leerzeichen zusammenhängende Begriffe etc.

    Jetzt mal abgesehen von einem neuen Datenbankdesign (ich werde nicht bezahlt), wie würdet Ihr die Begriffe möglichst sinnvoll auslesen, so dass die
    Suchbegriffauswahl halbswegs zusammenhängend und ohne Mehrfachnennungen rauskommt.

    Mein aktueller Ansatz wäre den ganzen Käse doppelt exploden mit einmal Komma und einmal Leer und dann per array_unique die doppelten rausfiltern.
    Das ist inhaltlich nicht direkt, was es sein soll und wahrscheinlich auch nicht sehr performant aber hm....
    Es ist schon alles gesagt. Nur noch nicht von allen.


  • #2
    Ich wüde mal eher sagen, da muss jemand vorher die Datenbasis normalisieren.
    --

    „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
    Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


    --

    Kommentar


    • #3
      Suchbegriffe...

      Zitat von nikosch Beitrag anzeigen
      Ich wüde mal eher sagen, da muss jemand vorher die Datenbasis normalisieren.
      Wäre schön, wenn das so einfach ginge.

      Will aber wie angedeutet eine weniger aufwendige Lösung, die ruhig ein paar Schönheitsfehler haben darf...
      Es ist schon alles gesagt. Nur noch nicht von allen.

      Kommentar


      • #4
        Ich gehöre eher zur Fraktion: Lieber einmal richtig machen. Von wievielen Datensätzen reden wir denn?
        --

        „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
        Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


        --

        Kommentar


        • #5
          Zitat von nikosch Beitrag anzeigen
          Ich gehöre eher zur Fraktion: Lieber einmal richtig machen. Von wievielen Datensätzen reden wir denn?
          Es geht aktuell um ca. 100 Datensätze mit rund 500 Schlagworten.

          Du hast natürlich recht. Ich sähe das grundsätzlich genauso, wenn mir nicht der homo oeconomicus in mir sagen würde: "Du rödelst Dich da wieder ab für Lulu, während auf der anderen Seite wichtige Aufgaben auf Dich warten, bei denen Du auch was verdienst." Ich bin nunmal eine One-Man-Show.

          Also, habe es inzwischen auf die dreckige Weise erledigt ungefähr wie eingangs beschrieben. Mal sehen, was die ewigen Verbandsnörgler dazu sagen werden... und wie gesagt, Du hast ja Recht.
          Es ist schon alles gesagt. Nur noch nicht von allen.

          Kommentar


          • #6
            Die Sache ist, 100 Datensätze sind in Excel oder für uns im Klartexteditor Rubbel-die-Katz normalisiert und alles wäre schick (ja, vielleicht noch der DB-Umbau und die zwingende Eingabe für die folgenden Anwendungsfälle). Zeigst Du ihnen dagegen, dass es irgendwie einigermassen funktioniert, signalisierst Du „hey, ist nur ein technisches Problem“ (was es definitiv nicht ist) und legst Deine eigenen Fußangeln damit aus. Stichwort [WIKI]Broken-Windows-Theorie[/WIKI]
            --

            „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
            Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


            --

            Kommentar


            • #7
              ...Rubbel-die-Katz normalisiert und alles wäre schick (ja, vielleicht noch der DB-Umbau und die zwingende Eingabe für die folgenden Anwendungsfälle)...
              In der vorletzten PHP-User habe ich gelesen, dass man in Untersuchungen festgestellt hat, dass Softwareentwickler bis zu einem Faktor 4 den Aufwand für eine bestimmte Arbeit zu positiv einschätzen. Also, wie gesagt. Bin Deiner Meinung, bleibe in diesem Fall aber hartnäckig dabei, erst gar nicht rauszufinden zu wollen, wieviel Aufwand das wirklich ist
              Es ist schon alles gesagt. Nur noch nicht von allen.

              Kommentar


              • #8
                Faktor 4? Heißt was?
                --

                „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
                Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


                --

                Kommentar


                • #9
                  Zitat von nikosch Beitrag anzeigen
                  Faktor 4? Heißt was?
                  Du sagst als Entwickler: "Naja, wird wohl so einen Tag dauern."
                  Tatsächlich brauchst Du dann aber vier Tage.
                  Es ist schon alles gesagt. Nur noch nicht von allen.

                  Kommentar


                  • #10
                    Ja das kenn ich. Und abrechnen kann ich dann doch nur 1 1/2, weil Cheffe sonst an die Decke geht.
                    --

                    „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
                    Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“


                    --

                    Kommentar


                    • #11
                      Zitat von nikosch Beitrag anzeigen
                      Ja das kenn ich. Und abrechnen kann ich dann doch nur 1 1/2, weil Cheffe sonst an die Decke geht.
                      Kenn ich auch. Ist mir genau so passiert. Ich war damals nur nicht von einem Tag ausgegangen, sondern von eh, das ist jetzt doch peinlich...
                      Na viel mehr halt.
                      Es ist schon alles gesagt. Nur noch nicht von allen.

                      Kommentar

                      Lädt...
                      X