Att arkivera en webbplats blir mer och mer utmanande i takt med att mängden information kontinuerligt ökar. Vi använder oss av molnbaserad så kallad ”harvesting”-teknik som följer länkar, sparar all publicerad information inkrementellt och konverterar filerna till format för långtidsbevarande.

Filosofin bakom tekniken i Archiwwwe är att minska antalet beroenden i så många led som möjligt. Vår miljö är placerad hos City Networks City Cloud och är skalbar. Archiwwwe är en molntjänst (SaaS) och ställer inga mjukvarukrav på dina system. Det ställs inte heller några krav på insatser från er interna IT-grupp. Arkiven är åtkomliga från ett webbgränssnitt där du kan söka och leta dig fram till den information du söker.

Genomsökning, struktur och bearbetning

Vår mjukvara söker igenom och sparar allt innehåll som är publikt och åtkomligt enligt e-delegationens rekommendationer på den angivna URL:en. När alla sidor är sparade konverteras samtliga länkar för att återspegla webbplatsens struktur.

http://www.domän.se/kategori/sida
file://www.domän.se/kategori/sida/index.html

Filerna som skapas är oberoende av mjukvara och kan öppnas i en vanlig webbläsare. Nedan visas hur strukturen speglas när den är sparad.

Filformat för långtidsbevarande

En av de stora utmaningarna är att kontinuerligt konvertera filer och dokument till format som går att öppna i framtiden. Därför följer Archiwwwe de framtagna rekommendationerna och standarder för långtidsbevarande som finns idag. Många webbplatser idag innehåller filer som vi måste konvertera till ett lämpligt format. Exempel på filformat för kontorsfiler som uppfyller kraven för långtidsbevarande är PDF-A1 (ISO 19005), ODF (ISO 26300). Se ytterligare information om filformat för långtidsbevarande.

Typ Beskrivning
Databärare Hårddisk
Periodicitet Dagligen (05:00 CET)
HTML-format ISO/IEC 15445
Textkodning Unicode 6.0 (UTF-8)
Bild SS-ISO 10918, ISO/IEC 15948:2004
Media (ljud och video) MPEG-2, WAV (LPCM)

Styrker autenticiteten med kontrollsiffra

För att styrka autenticiteten av ett arkiv och kunna bevisa att arkivet inte har manipulerats förser vi arkivet med en kontrollsumma (med algoritmen SHA-1, en kryptografisk hash-funktion). Om minsta ändring görs i arkivet kommer kontrollsumman inte stämma och arkivet inte validera. Därför behåller vi alltid originalet när vi konverterar filer. På så sätt behålls spårbarheten och arkivets autenticitet styrks. Med denna metod kan man kontrollera ett datum och innehållet i en fil som sparats i ditt arkiv. Med samma metod kontrollerar vi hela arkivet så att ingen fil har ändrats sedan avbildningen.

Archiwwwe låser inte in kunden

Du kan när som helst flytta din arkiv till din egna miljö. Du kan få ditt arkiv levererat i som råa kopior (komprimerade arkiv, ett för varje avbildningstillfälle) eller i ett WARC-format för att med mjukvara köra i din egna miljö.