Frage zu Archivierung von Webseiten

PlatinSecurity

Dabei seit: 02.09.2015

Beiträge: 322
#1

Frage zu Archivierung von Webseiten

23.04.2019, 11:19

Moin zusammen,

ich hätte da einige Fragen zur Webseiten Archivierung.
Es gibt ja im Netz einige Seiten die Webseiten jeden Monat Archivieren und Anzeigen können.

Meine Frage/n dazu sind folgende:
- Wie funktioniert so ein System?
- Wie speichert er die komplette Seite und gibt diese wieder aus?
- Ist das überhaupt legal?

Ich habe ja immer so meine eigenen Theorien, aber ob die dann stimmen mag ich mal zu bezweifeln. :'D

Wäre für Hilfe sehr dankbar.
Stichworte: -
hausl

Moderator

Dabei seit: 03.08.2010

Beiträge: 13743
#2

23.04.2019, 11:21

MOD: Verschoben von PHP-Einsteiger

The string "()()" is not palindrom but the String "())(" is.

Debugging: Finde DEINE Fehler selbst! | Gegen Probleme beim E-Mail-Versand | Sicheres Passwort-Hashing | Includes niemals ohne __DIR__
PHP.de Wissenssammlung | Kein Support per PN
1 Likes
Kommentar
hellbringer

Moderator

Dabei seit: 09.08.2015

Beiträge: 11978
#3

23.04.2019, 11:23
Zuletzt geändert von hellbringer; 23.04.2019, 11:29.

Zitat von PlatinSecurity Beitrag anzeigen

- Wie funktioniert so ein System?

Wohl auf eine ähnliche Art wie Suchmaschinen. Nur ohne Indexierung, dafür mit Datenbank- oder Dateispeicherung.

Zitat von PlatinSecurity Beitrag anzeigen

- Wie speichert er die komplette Seite und gibt diese wieder aus?

Web-Crawler + Web-Server.

Zitat von PlatinSecurity Beitrag anzeigen

- Ist das überhaupt legal?

Das fragst du am besten einen Anwalt. Für rechtliche Fragen ist dieses Forum nicht zuständig.
1 Likes
Kommentar
protestix

Dabei seit: 30.06.2016

Beiträge: 7719
#4

23.04.2019, 11:26

Zitat von PlatinSecurity Beitrag anzeigen

- Wie funktioniert so ein System?
.

Frage die Betreiber. Du kannst aber eine HTML-Seite als Datei betrachten und genauso damit umgehen, also laden und speichern.
Die Frage nach dem Ausgeben erübrigt sich dann wohl.
1 Likes
Kommentar
PlatinSecurity

Dabei seit: 02.09.2015

Beiträge: 322
#5

23.04.2019, 12:20

Zitat von hausl Beitrag anzeigen

MOD: Verschoben von PHP-Einsteiger

Ups... Danke dir.
----
Und danke auch an dich hellbringer für die Ausführlichen Antworten.
Hat mir sehr geholfen.

Ich vermute mal das es am rande der Legalität ist?!
Aber Anwalt Fragen kostet ja nichts
Mach ich einfach mal.
Kommentar
tomBuilder

Dabei seit: 22.05.2017

Beiträge: 4684
#6

23.04.2019, 13:03

Zitat von PlatinSecurity Beitrag anzeigen

Meine Frage/n dazu sind folgende:
- Wie funktioniert so ein System?
- Wie speichert er die komplette Seite und gibt diese wieder aus?
- Ist das überhaupt legal?

archive.org bspw. nuzt wohl heritrix3

https://github.com/internetarchive/heritrix3

dort steht auch eine info für webmasters:
https://github.com/internetarchive/h...iki#webmasters
1 Likes
Kommentar
protestix

Dabei seit: 30.06.2016

Beiträge: 7719
#7

23.04.2019, 13:13

Die Webmaster-Information sagt aber nichts dazu, ob es im eingesetzten Land legal ist und was man mit den Daten machen darf. Lediglich das der crawler die üblichen Robots-Hinweise der Webseite beachtet.
Kommentar
PlatinSecurity

Dabei seit: 02.09.2015

Beiträge: 322
#8

23.04.2019, 14:16

Zitat von tomBuilder Beitrag anzeigen

archive.org bspw. nuzt wohl heritrix3

Auch ne tolle Hilfe. Danke dir.
Kommentar
tomBuilder

Dabei seit: 22.05.2017

Beiträge: 4684
#9

23.04.2019, 15:07

Zitat von protestix Beitrag anzeigen

Die Webmaster-Information sagt aber nichts dazu, ob es im eingesetzten Land legal ist und was man mit den Daten machen darf. Lediglich das der crawler die üblichen Robots-Hinweise der Webseite beachtet.

Ja,
eine legal notice gibt es bei archive.org für die daten bei archive org.
informationen über urherberechlich geschützte daten sowie deren veröffentlichung gibt einem eh nur der anwalt, welcher einen nachher vertreten muss
es ging mir hier eher um eine art fair play. ^^

Zudem kann man das archivieren bei archive beantragen oder mit verschiedenen tools die archivierten pages bei mehren artchivierern durchsuchen.

nur zum spiegeln reicht einem auch:

Code:

wget --mirror --convert-links --adjust-extension --page-requisites https://example.com
Kommentar

Ankündigung

Frage zu Archivierung von Webseiten

Neue Werbung 2019

Frage zu Archivierung von Webseiten

Kommentar

Kommentar

Kommentar

Kommentar

Kommentar

Kommentar

Kommentar

Kommentar