XML (eXtensible Markup Language)

Från Sydarkiveras Wiki

Gräva.png

Denna sida är under konstruktion!
Denna sida är under uppbyggnad och därmed är innehållet inte komplett.
Sidan uppdateras efter hand.

Introduktion

Vad är XML?

XML, eller eXtensible Markup Language, är ett märkspråk som används för att strukturera och klassificera information. XML används bland annat för att utbyta information mellan olika system. En fördel när det gäller långsiktigt digitalt bevarande är att texten tillsammans med taggarna i filerna är självförklarande och förhållandevis lätt att läsa för en människa. XML är ett format för till exempel information som finns i databaser eller som kommer in via e-tjänster.

Beskrivning av formatet

Grundläggande struktur

XML-deklaration och teckenkodning

I den allra första raden i ett XML-dokument står det för det första att det är ett XML-dokument, därefter vilken version som dokumentet är skrivet i och vilken teckenkodning/teckenuppsättning som används. För att datorn ska kunna visa ett dokument korrekt, behöver den veta vilken teckenuppsättning som ska användas. Annars kan det bli till exempel fel tecken eller underliga symboler på skärmen.

En XML-deklaration kan se ut så här:

<?xml version='1.0' encoding='utf-8'?>

UTF-8 står för Unicode Transformations Format åtta-bitars. En delmängd av den här teckenuppsättningen är ISO-standarden ISO-8859-1 Latin-1/West European character set.

Element

Ett XML-dokument är en textfil med olika element (taggar) som bygger upp strukturen. De olika elementen i strukturen kan innehålla andra element och/eller text. Tecknen < > används för att markera vilken text som är elementets namn. Till exempel elementet "namn" som beskrivs nedan. Ett snedstreck / som alltid placerat i början av elementnamnet markerar att elementet är slut.

Ett element kan se ut så här:

<namn>Alvesta</namn>

Det första elementet i dokumentet kallas rotelement och talar om vad det är dokumentet beskriver. Rotelementets sluttagg måste finnas på sista raden. En lista som radar upp flera kommuner kan se ut så här:

Attribut

Elementen kan också ha attribut som innehåller information som är viktig för att bearbeta data, men som inte behöver synas i användargränssnittet. Attributet har ett namn och värdet anges inom citationstecken ". I det här fallet hanteras kommunkod som ett attribut till elementet kommun.

Ett attribut kan se ut så här:

<namn kod="0764">Alvesta</namn>

Kommentarer

Meddelanden till andra som läser ett XML-dokument skrivs som kommentarer. Att det är en kommentar markeras av de inledande tecknen !--.

En kommentar kan se ut ungefär så här:

<!-- Det här är en lista med kommuner -->

Grundläggande kontroller

Välutformat

Ett XML-dokument som följer de grundläggande reglerna som beskrivs ovan säger man är välutformat (well formed). Detta kan kontrolleras av en XML-editor.

Validerar mot XML-Schema

För att lättare får en enhetlig struktur på dokumenten och för att kontrollera att de är korrekta används olika typer av scheman med regler och begränsningar. Antingen i själva XMLdokumentet eller i ett externt schema (XSD) eller dokumenttypsdefinition (DTD). För scheman som är (eller skulle kunna vara) gemensamma i ett internationellt sammanhang används engelska som språk för elementen.

Schemat tas fram för att det ska vara möjligt att göra automatiska kontroller så att informationen är strukturerad och formaterad i enlighet med specifikationen. XML-scheman kan skrivas på flera olika sätt för att nå fram till samma resultat.

Programvaror

Texteditor

Det går också att använda en vanlig texteditor som till exempel Microsoft Anteckningar. Texteditorn visar XML-dokumentet med sina element och attribut utan någon formatering eller funktioner för att kontrollera formatet.

Webbläsare

De flesta webbläsare kan användas för att titta på ett XML-dokument. Webbläsaren formaterar XML-dokumenten så att de blir lättare att läsa med till exempel olika färger för att enklare se vad som är element och innehåll. Webbläsare ger också en enkel navigering så att det går att fälla ihop eller expandera de olika elementen. Tänk på att webbläsare i sig i bland begränsar visningen av XML. Du kan till exempel behöva välja "visa källa" eller motsvarande funktion för att se XML-dokumentet. För att transformera informationen till ett visningsformat med hjälp av XSLT så kan du behöva göra inställningar och också placera dokumentet så att sökvägen inte blir för lång.

XML-editor

Det finns olika XML-editorer som gör att det går att redigera och samtidigt kontrollera om dokumenten är korrekta.

Ytterligare resurser

http://dh.obdurodon.org/#xpath

http://dh.obdurodon.org/functions.xhtml

https://martin-honnen.github.io/xml-workbench/

https://ebeshero.github.io/UpTransformation/schedule.html

https://www.cranesoftwrights.com/training/index.htm#ptux

▼ HANDBOKEN ▲

Verksamhetsområden

Arkivleveranser

Arkivredovisning

Arkivtillsyn

Digitalisering - digitalt arbetssätt

Hantera, lagra och förvara

Säkerhetsskyddsklassificerade uppgifter

Informationshantering

Insyn och åtkomst

Organisation och roller

Praktiskt arbete i arkivet

Standarder

Systemförvaltning

Särskilda informationstyper

Hjälpsidor

External testbed / Extern testbädd

VerkSAM Arkivredovisning

Hittar du inte vad du letar efter?
Testa på Alla Sidor