Ankündigung

Einklappen
Keine Ankündigung bisher.

[Erledigt] Konzept Newssammler

Einklappen

Neue Werbung 2019

Einklappen
X
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Erledigt] Konzept Newssammler

    Hallo,

    ich bin gerade dabei mir eine Klasse auszudenken, mit der ich News von verschiedenen Seiten einfach "klauen" kann. Natürlich nur solche News, die dazu gedacht sind übernommen zu werden, sprich von Presseagenturen oder derartigen Einrichtungen.

    Neben einer schlichten Klasse, die Text, Datum, Autor und Titel speichert, ist das schwierigste wohl eine vernünftige Klasse zum Suchen neuer News zu erstellen.

    Die Seiten, wo die News herzuholen sind, sind vorgegeben und werden vorher eingelesen.

    Jetzt der kniffelige Teil.
    Da viele der Seiten ja RSS-Feeds anbieten würde ich darüber abfangen, welche News neu sind. Dann kann ich mir eine Einleseprozedur über eine ganze Homepage sparen.
    RSS-Feeds sind ja mit einem Link ausgestattet, mit dem ich zu der vollen News komme.

    Da würde ich dann Ansetzen wollen, die News mit einem regulären Ausdruck abfangen und speichern.

    Das Handwerkszeug für diese Lösung bietet mir PHP ja , aber gibt es vielleicht eine elegantere Lösung oder hat jemand eine bessere Idee, wie man sowas nachrichtenverlustfrei realisieren kann?

    Vielen Dank fürs Lesen

  • #2
    Die Frage ist: Wozu die News, die gut als Feed aufbereitet sind überhaupt komplett auslesen? Wieso nicht das Feed XML nutzen und mit der xml Datei arbeiten? Du willst doch hoffentlih nur die Reader "klauen", nicht die kompletten Inhalte?
    [COLOR="#F5F5FF"]--[/COLOR]
    [COLOR="Gray"][SIZE="6"][FONT="Georgia"][B]^^ O.O[/B][/FONT] [/SIZE]
    „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
    [URL="http://www.php.de/javascript-ajax-und-mehr/107400-draggable-sorttable-setattribute.html#post788799"][B]Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“[/B][/URL][/COLOR]
    [COLOR="#F5F5FF"]
    --[/COLOR]

    Kommentar


    • #3
      Ne, es geht um die Inhalte.
      Und meistens sind die Feeds ja nur mit Links bestückt, damit man auch die Seiten besucht.


      Das ganze läuft schon Rechtens ab, also es geht nicht um Inhalteklau in dem Sinne.

      Kommentar


      • #4
        Wenn die Anbieter wollen dass ihre Inhalte genutzt werden, bieten sie das doch entweder als full-feed (rss, atom) an oder bieten eine api dafür an.

        Weil mit nem einheitlichen regex wirst du es wohl nicht schaffen die inhalte aus verschiedenen Seiten zu extrahieren, vor allen was ist mit werbung und co ? Willst du die auch einfach übernehmen ? inkusive markup und so ?

        Irgendwie kann ich mir nicht vorstellen, dass wenn die Inhalte so wie du es sagst genutzt werden dürfen, sie nicht auch in einem passenden Format zur Verfügung gestellt werden. Weil wenn du die inhalte selbst extrahieren willst, heißt das für JEDE seite anpassungen und es heißt auch wenn der anbieter irgendwas an seinem layout/markup ändert, dass dein automatisiertes Tool unter umständen nicht mehr funktioniert, mist ausliest etc.
        [URL="http://www.robo47.net"]robo47.net[/URL] - Blog, Codeschnipsel und mehr
        | :arrow: [URL="http://www.robo47.net/blog/192-Caching-Libraries-and-Opcode-Caches-in-php-An-Overview"]Caching-Klassen und Opcode Caches in php[/URL] | :arrow: [URL="http://www.robo47.net/components"]Robo47 Components - PHP Library extending Zend Framework[/URL]

        Kommentar


        • #5
          Warum wird hier eigentlich über die Rechtmäßigkeit diskutiert.
          Wenn ich sage, dass ich hier nichts Illegales vorhabe, dann ist das auch so.

          Kommentar


          • #6
            Das heißt
            1. nicht, dass Du Dich gleich aufregen mußt
            2. nicht zwingend, dass das stimmt
            3. nicht, dass das deswegen rechtlich ok ist.

            Wenn ich urheberrechtl. geschützte Filme kopiere(n würde), muß ich auch nichts unrechtes damit vorhaben und begehe trotzdem eine Rechtsverletzung.
            Und wenn Du bspw. die Inhalte irgendwo im Netz anbietest, wäre das in jedem Fall problematisch.
            [COLOR="#F5F5FF"]--[/COLOR]
            [COLOR="Gray"][SIZE="6"][FONT="Georgia"][B]^^ O.O[/B][/FONT] [/SIZE]
            „Emoticons machen einen Beitrag etwas freundlicher. Deine wirken zwar fachlich richtig sein, aber meist ziemlich uninteressant.
            [URL="http://www.php.de/javascript-ajax-und-mehr/107400-draggable-sorttable-setattribute.html#post788799"][B]Wenn man nur Text sieht, haben viele junge Entwickler keine interesse, diese stumpfen Texte zu lesen.“[/B][/URL][/COLOR]
            [COLOR="#F5F5FF"]
            --[/COLOR]

            Kommentar


            • #7
              Weil es hier genug Leute schon gab die sowas behauptet haben, ich es meistens nicht überprüfen kann und ich nicht dem xten Content-Dieb helfen will.

              Es stellt sich eben bei sowas einfach die logische Frage warum Content der für den Zweck genutzt werden soll nicht auf einem vernünftigen und vor allem einheitlichen weg weitergegeben wird.
              [URL="http://www.robo47.net"]robo47.net[/URL] - Blog, Codeschnipsel und mehr
              | :arrow: [URL="http://www.robo47.net/blog/192-Caching-Libraries-and-Opcode-Caches-in-php-An-Overview"]Caching-Klassen und Opcode Caches in php[/URL] | :arrow: [URL="http://www.robo47.net/components"]Robo47 Components - PHP Library extending Zend Framework[/URL]

              Kommentar


              • #8
                Okay, dann brauch ich deine Hilfe nicht und mach es auf meine Art.
                Schönen Tag noch.

                Kommentar


                • #9
                  Dann bitte noch das Thema als [Erledigt] markieren. Danke.
                  [B]Mfg Tomtaz[/B]
                  [I]"Es soll jetzt diese Erfindung geben.... Kugel oder so heißt die. Ist so eine Art Suchmaschine..." [/I]:!::shock:

                  Kommentar

                  Lädt...
                  X