Startsida - Mer läsning - WayBack Machine eller Archiwwwe

WayBack Machine eller archiwwwe?

Vi får ibland frågan hur Archiwwwe skiljer sig från WayBack Machine. De flesta tjänster som använder sig av robotinsamling av webbplatser använder liknande tekniker men det finns betydande skillnader.

1.1

Introduktion

WayBack Machine (WBM) är en produkt som skapats av Internet Archive, en organisation baserad i San Francisco. Sedan 1996 samlar de in arkivkopior från hela webben. De är nu upp i mer än 500 miljarder webbsidor. Deras vision är arkivera ”hela internet” – en mycket spännande tanke. WayBack Machine är en fascinerande och imponerande produkt.

1.1.1

Något helt annat än Archiwwwe

WayBack Machine är dock något helt annat än Archiwwwe. Vi får ibland frågan hur Archiwwwe skiljer sig från WayBack Machine. Vi förklarar i listan nedan.

  • WBM säkrar inte hela webbplatsen. Arkiven innehåller luckor i högre grad än när arbetet är gjort av Archiwwwe.
  • WBM gör bara en grov gallring inför arkiveringen, endast utifrån vad som skrivits i robots.txt. Systemet känner inte till webbtjänstens egna strukturerade gallring, utan dess robot respekterar blint de argument vilka är definierade i robots.txt. Det kan betyda att stora delar av webbplatsen exkluderas. Archiwwwe arkiverar utifrån en kundanpassad gallringsprocess.
  • WBM lagrar arkiven i formatet WARC. Det är inte accepterat av Riksarkivet. Archiwwwe levererar uteslutande webbarkiv som statiska arkiv med metoden SIM (Statisk Inkrementell Metod). Detta innebär att användaren inte är beroende av en speciell mjukvara för att öppna arkiven.WBM konverterar inte filer till långtidssäkra format. Det betyder att de inte möter kraven på långtidsbevarande. Det finns mycket som inte går att öppna idag på WayBack Machine av denna anledning.
  • WBM har inga kontrollsummor på sina arkiven. Det betyder att de inte kan autenticeras.
  • WBM är ett automatiskt system som inte har kontakt med kunden, och vet därför inget om planerade förändringar (byte av domän, subdomän mm.). Det gör att även mindre förändringar av en webbplats kan medföra att arkiven blir obrukbara över tid.
  • WBM lagrar naturligtvis data på sitt eget sätt och i USA. Data arkiverat av Archiwwwe finns lagrat i Sverige.
  • WayBack Machine äger sin arkivkopior. Hos Archiwwwe är det tydligt att det är våra kunder som äger sin data, även när de ligger på våra system Våra uppdragsgivare kan när som helst exportera sina data till sina egna system.