Ankündigung

Einklappen
Keine Ankündigung bisher.

Wie kann ich einen mathematischen Algorithmus filtern und speichern?

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Wie kann ich einen mathematischen Algorithmus filtern und speichern?

    Hi Forum,

    habe nur eine simple Frage und ein winziges Problem aus Sicht der Programmierung:

    Mein Algorithmus durchsucht das gesamte Internet nach relevant eingegeben Daten.

    Nun ist der Algo so logisch aufgebaut, dass er viele Daten filtert, aber nicht so wie ich es haben will.. Kann auch fast kein Algo. Mathematisch gesehen bin ich schon nahe an der Wahrheit.

    Aber wie kann ich dem Algo sagen, dass er bestimmte Daten die ausgefiltert werden, dennoch separat speichert, in derselben Datenbank. Also trotz des Algo nicht alle unrelevanten Daten löscht, da ich die evtl. ja doch noch brauche?

    Also ich wollte ein 5 Stufen System erstellen. Indem die Daten halt gefiltert werden (wie ein Kaffeefilter, der in seiner Struktur immer feiner wird) Kaffeefilter 1 soll Daten löschen, Kaffefilter 2 soll Daten zwischenspeichern und mit Kaffefilter 3
    vergleichen. Alle überflüssigen Daten aus 2-3 werden gelöscht. Dann dasselbe mit Kaffeefilter 4, der soll Daten aus Ergebniss von 2-3 prüfen und überflüssiges löschen. Kaffeefilter 5 speichert alles, da dies die Mainstream-Daten sind.

    Also wie kann ich diese Filterung in einer Algo einsetzen, ohne Monatelang auf eine Auswertung zu warten? Denn mein Algo arbeitet sehr langsam, weil er viele Daten im First Step filtert. Das muss ich ändern.

    Eine Quellcode muss ja für diese Idee nicht gepostet werden. Kann in posten, bringt ja aber nichts. Da ich ja nur nach der Logik hinter dem System suche. Also Codes braucht ihr nicht zu posten, sondern
    nur einen Denkanstoss, wo mein Denkansatz falsch ist.

    Beispiel: Ich suche nach einer Küchenzeile 270cm Breite, rechts das Spülbecken, mit Abluft, in Eiche, Preis bis 1000 Euro, Kühlschrank inklusie? E-Herd inklusive? Oder Nicht und Kühlschrank dabei oder nicht (als and or usw... ), Effizientklasse, Bewertung aller Teile, Bewertung einzelner Teile, Material, Lieferkosten, Aufbaukosten usw... alles muss gefiltert werden.

    Und sie müssen wie gesagt "gesiebt" werden. Jeglicher Datenmüll muss raus. z.b. Zwei-Zonen-Solaranlage, Schieberegler, dingsbum, das und dies, und noch unwichtigeres, und das auch noch...

    Versteht ihr das?


  • #2
    Zitat von blueavenue Beitrag anzeigen
    Mein Algorithmus durchsucht das gesamte Internet nach relevant eingegeben Daten.
    einige Zettabyte zu durchsuchen wird schon etwas länger dauern....

    Kommentar


    • #3
      Na ja, du nimmst nach jedem Filterdurchlauf den Kaffeesatz und legst ihn dir in eine Plastikdose.

      Kommentar


      • #4
        Zitat von blueavenue Beitrag anzeigen
        Versteht ihr das?
        Wie soll man das denn bitte verstehen? Du schreibst da etwas von 5 Filtern, Mainstreamdaten und Ziwschenspeichern. Manchmal wirken die Filter gleichzeitig (Tipp: in dem Moment sind es nicht mehr 2 sondern nur noch 1 Filter). Und gewisse Filter filtern gar nicht sondern speichern stattdessen.
        Hast du vielleicht zu oft das Wort "Filter" benutzt und meinst eher sowas wie "Verarbeitungsschritt"?

        Dass überflüssige Daten gelöscht werden ist übrigens auch klar, musst du nicht zu jedem Schritt dazu schreiben.

        Versuch das nochmal zu beschreiben und denk dieses mal daran, dass wir keine Ahnung haben worum es dir eigentlich geht. Führ am besten das Beispiel mit der Küchenzeile weiter aus.
        Relax, you're doing fine.
        RTFM | php.de Wissenssammlung | Datenbankindizes | Stay fit

        Kommentar


        • #5
          MOD: Verschoben von PHP-Einsteiger
          PHP.de Wissenssammlung | Debugging: Finde DEINE Fehler selbst! | mysql_* ist veraltet! | Gegen Probleme beim E-Mail-Versand | Sicheres Passwort-Hashing | Includes niemals ohne __DIR__ | Kein Support per PN

          Kommentar


          • #6
            Ich wollte das so ähnlich wie Amazon in der erweiterten Suche haben. Dort kann man auch nach Preis, Kategorien, Größen, usw. suchen (die haben ja aber auch eine interne Datenbank und müssen nicht Zettabyte Daten durchforsten). Habs daher nun anders gelöst. Thread kann geschlossen werden.

            Kommentar


            • #7
              Also doch nicht mit Plastikdosen?

              Kommentar


              • #8
                Zitat von blueavenue Beitrag anzeigen
                Habs daher nun anders gelöst.
                Und wie? Mich interessiert brennend, wie man das "ganze Internet" innerhalb 9 Tagen durchsucht....

                Kommentar


                • #9
                  Ich hab einfach ein Suchskript programmiert, welches nur die Daten finden soll, dich vorher eingegeben haben. Ohne Filterung. Wieso auch alles Filtern, wenn man Daten die man selbst eingibt einen Bereich einschliessen, vorhanden sind und alles anderen Daten ausschliessen? Diesen Denkansatz hatte ich bei der Fragestellung gar nicht, ist aber total logisch. Ich brauche die anderen Daten ja später doch nicht mehr. Und 9 Tage hat es nicht gedauert, eher 0,9 Sekunden mit dem Skript..

                  Kommentar


                  • #10
                    Zitat von kaminbausatz Beitrag anzeigen

                    Und wie? Mich interessiert brennend, wie man das "ganze Internet" innerhalb 9 Tagen durchsucht....
                    Die Spitze hat er nicht verstanden.
                    Google braucht glaube ich nur 8 Tage, frag die mal.

                    Kommentar

                    Lädt...
                    X