SIARD (Software Independent Archiving of Relational Databases)
Från Sydarkiveras Wiki
Introduktion
Ibland är det lämpligt att bevara information digitalt genom att exportera hela relationsdatabasen, det vill säga datalagret som hör till ett verksamhetssystem. På den här sidan finns information om standarden SIARD och de olika specifikationer och programvaror som används för att exportera databaser för digitalt bevarande. Det finns andra sätt att hantera slutarkivering av register och databaser. Många verksamhetssystem har inbyggda funktioner för att skapa arkiveringsuttag.
Läs mer på sidorna:
Vad är SIARD?
SIARD, eller Software Independent Archiving of Relational Databases, är en öppen internationell standard för långsiktigt bevarande av databaser oberoende av databashanterare och ursprunglig programvara. När man i framtiden vill komma åt den arkiverade informationen behöver man inte ha tillgång till ursprungsprogramvaran utan kan öppna det i valfri SIARD-kompatibel programvara. Eftersom SIARD-standarden är öppen är man inte bunden till någon särskild leverantör, vare sig av programvara eller tjänster.
Användning
Sydarkivera har testat flera olika arbetssätt tillsammans med förbundsmedlemmarna. Detta har skett både för testöverföringar i samband med leveransutredningar och för skarpa arkivleveranser. Ett arbetssätt är att överföra backup-fil, läsa in i databashanterare och därifrån skapa export. Detta går att göra förutsatt att man har tillgång till den databashanterare som stödjs. Ett annat arbetssätt är att tekniker hos förbundsmedlem genomför SIARD-export med hjälp av programvaran Database Preservation Toolkit (DBPTK). Det går att konstatera att det finns utmaningar framförallt med komplexa databaser.
Resultatet av databasarkiveringen blir varierande beroende på hur väl datalagret avspeglar den informationstyp som hanteras. Det är inte ovanligt att en databas som skapats för ett specifikt ändamål används för att utveckla verksamhetssystem med funktioner och användargränssnitt som i hög grad skiljer sig från det ursprungliga användningsområdet. Det saknas inte sällan relationer och vyer i databaserna vilket för med sig arbete med manuell analys och att komplettera databaserna med dokumentation och vyer för enklare sökning.
Exportformat som är stödjs av leverantören är att föredra när det gäller mer komplexa verksamhetssystem. Uttag från system med patientjournaler eller sociala akter kan inte ske med hjälp av databasarkivering. Dels på grund av att det kan finnas tvingande krav om gallring och dels på grund av att information behöver vara möjlig att lämna ut på ett specifikt sätt.
SIARD används ofta till andra standarder. Vill du se en komplett lista över standarder som finns beskrivna på Sydarkiveras Wiki, gå vidare till samlingssidan för standarder
Läs mer på sidan:
Beskrivning av standarden
SIARD är ett öppet filformat för långsiktigt bevarande av relationsdatabaser där data paketeras för överföring och lagring i ett format baserat på XML. Både strukturen och innehållet översätts till SIARD-formatet, för att göra det möjligt att säkerställa bevarande även efter att den ursprungliga databashanteraren inte längre fungerar att använda.
Förvaltning och utveckling
Standarden har utvecklats av Schweiziska Bundesarchiv för paketering och arkivering av relationsdatabaser. Det finns erfarenhet av SIARD i flera länder i Europa där standarden används. Standarden är även fastställd som eCH standard (eCH är den Schweiziska standardiseringsorganisationen för e-förvaltning) vilket medför att detta är en internationellt vedertagen standard.
Sedan 2020 utvecklas och förvaltas SIARD i öppet forum genom arbetsgruppen DILCIS Board. DILCIS Board förvaltar en intressegrupp för databasarkivering Relational Database Archiving Interest Group som syftar till att underlätta kommunikationen mellan alla som arbetar med databasarkivering. Det finns en e-postlista som man kan anmäla sig till för att ställa frågor om SIARD, tillhörande specifikationer och programvaror, byta erfarenheter och användningsfall med mera.
Vad SIARD baseras på
SIARD-formatet bygger på ISO standard SQL (ISO/IEC 9075) och det är en viktig förutsättning för att kunna hantera ett stort antal databashanterare. SIARD-standarden möjliggör export av databaser till ett generellt format som innehåller nödvändig metadata för att kunna återskapa en relationsdatabas. Version 2.1. baseras på SQL 2008. Det tidigare formatet SIARD 1.0 baseras på en äldre version av SQL. Formatet definierar tabeller, kolumner, primärnycklar och främmande nycklar. SIARD kan även definiera databasscheman. Förutom SQL används de internationellt erkända standarderna XML, UNICODE och ZIP 64.
Specifikationer
CITS SIARD
CITS SIARD (Content Information Type Specification for Relational Databases using SIARD) är en specifikation som används vid långtidsbevarande av relationsdatabaser. Specifikationen beskriver hur man paketerar och bevarar databaser för att de ska vara tillgängliga i framtiden. Detta görs genom att lägga in SIARD-filer i ett informationspaket (IP) som följer CSIP (Common Specification Information Package), en specifikation baserad på gemensamma regler för alla informationspaket.
Dokumentation för CITS SIARD finns publicerad via DILCIS Board:
https://dilcis.eu/content-types/cs-siard
Följande resurser finns att använda:
- Specifikation CITS SIARD v1.0.0
- Vägledning
- Exempelfiler
- Intressentgrupp
- Dokumentation av exempel på implementering
Inspelat webinarium med presentation av standarden finns tillgänglig via Youtube: CEF eArchiving Webinar #10 Relational database archiving using SIARD
FGS Databas (Baserad på SIARD)
Riksarkivarien meddelade 2021-06-28 beslut att fastställa FGS Databas baserad på SIARD (Riksarkivets dnr RA-KS 4.2-2021/27).
FGS Databas (Baserad på SIARD) beskriver användning av standarden SIARD version 2.1 och består av följande dokument:
- Förvaltningsgemensam specifikation för relationsdatabaser baserad på SIARD (Specifikation), RAFGS6V1.0
- Förvaltningsgemensam specifikation för relationsdatabaser baserad på SIARD (Specifikation Tillägg), RAFGS6V1.0A20210628
Dokumentationen finns publicerad via Riksarkivets webbplats:
https://riksarkivet.se/faststallda-kommande-fgser
Projektet FGS Databas
Specifikationen FGS Databas (Baserad på SIARD) togs fram i samband med projektet FGS Databas som Riksarkivet initierade 2017. Projektets mål var att utveckla och fastställa Förvaltningsgemensam specifikation (FGS) för databaser. Tillsammans med Riksarkivet deltog Sydarkivera, Statens Servicecenter (SSC) och Arkivnämnden i Göteborg i arbetsgrupp och testgrupp. Projektet hade en referensgrupp där framför allt statliga myndigheter deltog. Arbetet med SIARD startade i december 2019. En remiss för att samla in synpunkter genomfördes juni-september 2020 och det kom in fyra svar på remissen (från ett regionarkiv och tre statliga myndigheter). Efter bearbetning av underlaget genomfördes sluttestning i enlighet med av framtagen testmetodik. Förberedelserna för testning startade i november 2020. En statlig myndighet genomförde testningen och skickade in dokumentation i januari 2021. Sydarkivera producerade kompletta underlag med introduktion, specifikation och tillägg för Förvaltningsgemensam specifikation för databas baserad på SIARD som överlämnades till Riksarkivet 2021-06-09. De beslutade dokumenten baserades helt på det slutliga utkast som producerats av Sydarkivera.
Remissammanställning och testdokumentation finns att ladda ner från Riksarkivets webbplats:
Riksarkivets webbsida för FGS-remisser
För genomförandet användes av Riksarkivet framtagna vägledning "Vägledning för arbetet med förvaltningsgemensamma specifikationer – Att utveckla, förvalta, och införa FGS:er" (RAFGS1D20171025) med tillhörande Utvecklingsprocess och Testmetodik. Dokumenten finns att ladda ner från Riksarkivets webbplats:
https://riksarkivet.se/fgs-dokument
Programvaror
Sydarkivera har testat två olika fria verktyg som automatiserar SIARD-exporten. Det finns även andra alternativ och stöd för SIARD i olika kommersiella produkter.
- Database Preservation Toolkit DBPTK utvecklat av KEEP Solutions, (DBPTK tillhandahålls fritt och ingår i programvaruportföljen för eArkivering Byggnadsblocket.)
- SIARD Suite utvecklat av det Schweiziska Riksarkivet. Programmet tillhandahålls fritt och ingår i den av SFA tillhandahållna programvaruportföljen.
Av de fria verktygen är det DBPTK som har ett grafiskt användargränssnitt och har stöd för flest förekommande databashanterare. Sydarkivera använder DBPTK för kontrollera, analysera och förbereda SIARD-exporter för slutarkivering. Det är möjligt att använda andra produkter i överenskommelse med Sydarkivera, men förbundsmedlem behöver då själv ansvara för att skaffa den kunskap och förutsättningar som krävs för att skapa en SIARD-export som validerar. DBPTK Desktop är en av de programvaror som hör till Förbundsmedlems verktygslåda.
Läs mer på sidan:
Database Preservation Toolkit (DBPTK)
Database Preservation Toolkit (DBPTK) är ett verktyg för att bevara databaser. Programmet är licensierat med öppen källkod och är fritt att använda utan kostnad. Det finns en aktiv och levande förvaltning av programvaran som vidareutvecklades i anslutning till E-ARK. Programvaran finns både med grafiskt användargränssnitt (för Windows, MacOS och Linux) och som kommandobaserade gränssnitt som stödjer schemaläggning av körningar.
Det finns tre olika versioner för olika användningsområden:
- DBPT Desktop – Skapar SIARD-fil, validerar SIARD-filen och gör det möjligt att söka i innehållet.
- DBPTK Enterprise – Webbapplikation, fleranvändarversion, som gör det möjligt att navigera och söka i innehållet i arkiverade databaser. I denna version går det att styra vilken information som visas upp för användaren.
- DBPTK Developer – Kommandobaserat verktyg för utveckling och för att kunna intergera funktioner i automatiserade processer.
DBPTK har stöd för att ansluta till de vanligaste förekommande databashanterarna för att skapa SIARD-exporter. Det finns generiskt stöd för JDBC för andra förekommande lösningar som baseras på SQL.
DBPTK har stöd för att ansluta till de vanligaste förekommande databashanterarna:
- Microsoft Access
- MS SQL Server
- MySQL
- Oracle
- PostgreSQL
- Progress Openedge
- Sybase
Det finns därutöver generiskt stöd för JDBC för andra förekommande lösningar som baseras på SQL.
DBPTK Desktop
DBPTK Desktop är den programvara som används för att göra databasexpoterna och skapa SIARD-fil. Verktyget används av den som ska göra en databasexport inför överföring till Sydarkivera.
Programvaran har stöd för följande funktioner:
- Skapa Siard-fil genom att ansluta till vald databashanterare.
- Validera Siard-fil mot specifikation samt mot flera olika kontrollpunkter.
- Lägga till kompletterande beskrivande metadata om tabeller och kolumner.
- Navigera och söka i innehållet.
- Skapa och spara vyer för att presentera innehåll och underlätta sökning.
Kod och dokumentation
Kod och dokumentation finns öppet publicerad:
- Informationssida för Database Preservation Toolkit: https://database-preservation.com/
- Database Preservation Toolkit på GitHub: https://github.com/keeps/
Introduktionsutbildning
Inspelat webinarium med presentation av programvaran finns tillgänglig via Youtube: CEF eArchiving webinar series 2020: #6 DBPTK – an eArchiving solution for database archiving.
SIARD Suite
SIARD Suite är en programvara som har utvecklats av det Schweiziska Riksarkivet för att förenkla arkivering av relationsdatabaser. Verktyget används i över 50 olika länder runt om i världen. Lösningen som Schweiziska Riksarkivet använder själva är baserad på filformatet SIARD och programvaran SIARD Suite.
Verktyget har stöd för följande databashanterare:
- Oracle
- Microsoft SQL Server
- MySQL
- DB/2
- Microsoft Access
SIARD Suite hanterar uttag från relationsdatabas och lagrar informationen i SIARD-format för långsiktigt digitalt bevarande i leverantörsoberoende format. Vid behov skapas en ny databas för att söka och använda informationen som långtidslagras.
Kod och dokumentation finns publicerad:
Testa Siard-verktygen
Vad behövs för att kunna använda verktygen?
- En relationsdatabas (valfri databashanterare)
- Konto med läsrättigheter till databasen
- Möjlighet att installera vald programvara
- Tillräckligt med lagringsutrymme för att spara ner en arkivkopia av databasen
- Någon med kunskaper om verksamhetssystemet och informationen som ska bevaras
- Någon med grundläggande kunskaper om SQL
- Ett par arbetsdagar att avsätta för att lära sig programvaran och testa att göra en export
Hur kan du förbereda dig?
Kommunalförbundet Sydarkivera erbjuder en testbädd där där förbundsmedlemmar kan testa olika programvaror i en leverantörsoberoende och kontrollerad miljö. Detta medför att du småskaligt kan prova på innan du bestämmer dig för att använda en programvara. Förbundsmedlem kan även ta del av utbildning, demonstration och gemensamma övningar i samband med Verkstad på webben.
Läs mer om Sydarkiveras externa testbädd
- Kommunala och regionala bolag
- Plan, bygg och miljö
- Teknik och anläggning
- Hälsa och socialt stöd
- Kommun- och regionledning
- Kultur och fritid
- Skola och utbildning
- Trygghet och säkerhet
- Planerad tillsyn
- Självvärdering arkivlokaler
- Självvärdering arkivansvarig
- Utvärdering för arkivombud
- Händelsestyrd tillsyn
Digitalisering - digitalt arbetssätt
Säkerhetsskyddsklassificerade uppgifter
- Informationshanteringsplan
- Hålla ordning
- Postöppning
- Registrering
- Klassificeringsstruktur
- Informationssäkerhetsklassning
- Projekt
- Gallra och rensa (slänga)
- Städa i mappar och filer
- Allmän handling
- Lämna ut allmän handling
- Offentlighet och sekretess
- Söka i arkiven
- Låna ut och avhända
- Tillgängliggöra och levandegöra arkiv
- Myndighet
- Registrator
- Nämndsekreterare
- Handläggare
- Arkivmyndighet
- Arkivansvarig
- Arkivombud
- Arkivarie
- Arkivföreståndare
- Arkivassistent
- Kontaktperson
- Leveranskoordinator
- Medlemssamordnare
- Ämnesansvarig
- Rutin för att lämna ut sekretess
- Rutin vid förfrågan om fastighetshandlingar
- Rutin vid betygsförfrågningar
- Hantera släktforskningsärenden
- Fotografier och bilder
- Kartor och ritningar
- Ljud och rörlig bild
- Mappar och filer
- Webbarkivering
- Äldre digitalt material
- Ärende- och dokumenthantering
Hittar du inte vad du letar efter?
Testa på Alla Sidor