Interoperabilitet och vidareutnyttjande av digitala resurser

Inledning

Öppna data utgör en interaktionsgräns för delning, utbyte och kombination av digitala resurser mellan offentlig sektor, medborgare, företag och idéburna organisationer. För att öppna data skall bli en viktig resurs som kan användas för att skapa samhällsvärde räcker det inte med vilja och målsättning att tillgängliggöra data direkt från interna IT-system. Arbetet måste vägledas av grundläggande designprinciper som möjliggör delning, utbyte och kombinering av data och information utan behov av integration mellan IT-system för enskilda ändamål. En av dessa grundprinciper är att skapande av interoperabilitet för utbyte, vidareutnyttja och kombinera digital resurser.

Interoperability -Relating to systems, especially of computers or telecommunications, that are capable of working together without being specially configured to do so. Källa: The Free Dictionary

Principer om interoperabilitet berör alla aspekter av hantering av data och information för att motverka fragmenterade och vertikala systemlösningar inom en verksamhet. Bristen på interoperabilitet skapar inte bara hinder för att vidareutnyttja digitala resurser internt, det gör det också kostsamt och tidsödande att integrera mot externa resurser. Flera organisationer lever med fragmenterade och vertikala systemlösningar eftersom beslut om anskaffande av IT-system ofta ensidigt fokuserar på lösningar. Därför är det viktigt att offentliga organisationer och myndigheter säkerställer interoperabilitet så att digitala resurser kan vidareutnyttja internt, externt och för olika ändamål och verksamheter.

Genom att förädla, sammanställa och på andra sätt använda information kan olika aktörer skapa nya kommersiella och ideella tjänster och därmed ge förutsättningar för samhället att tillgodogöra sig det värde informationen kan ha när den används för andra ändamål än myndighetens egen verksamhet. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 22)

Principer som gör det möjligt att vidareutnyttja och kombinera digitala resurser med varandra behöver genomsyra alla systemlösningar i en verksamhet. En central princip för att möjliggöra interoperabilitet är att nyttja öppen källkod. Varför detta är viktigt finns att läsa om på sidan om öppen källkod och standard. För att det ska ske en förändring behövs det en attitydförändring och kunskap om öppen källkods fördelar för de som utformar upphandling och avtal inom offentliga organisationer. Om offentliga medel i större utsträckning investerades i öppen källkod och standarder kan flera organisationer få tillgång till viktig IT-infrastruktur som möjliggör effektivisering genom att digitala resurser kan vidareutnyttjas och kombineras över organisationsgränserna.

Innovationsupphandling och innovationspartnerskap är i sammanhanget viktiga verktyg liksom medveten användning av lösningar av öppen källkod, standarder och testbäddar. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 25)

Förutom designprinciper behövs det ledarskap inom offentlig sektor med kompetens om vad som krävs för att utveckla IT-infrastruktur och tillgängliggöra digitala resurser som kan vidareutnyttjas för olika ändamål för att införliva digitaliseringens potential.

För de statliga myndigheterna bör behovet av strategisk digital kompetens beaktas vid förordnande av ledamöter i myndighetsstyrelser, nämnder och insynsråd – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 15)

För att göra data ändamålsenlig för fler tillämpningsområden behövs strategier som nyttjas inom hela verksamheten för hur data lagras, hanteras och struktureras. Dessa designprinciper behöver ingå i direktiv som beslutas av ledningen för att visa på betydelsen av att nyttja goda designprinciper och praxis för hantering av data så den kan vidareutnyttjas horisontellt inom offentlig sektor, företag, sociala och idéburna organisationer. Detta innebär att data behöver vara enkel att läsas och tolkas av maskiner, enkel att hitta, lätt att kombinera med annan data genom öppna standarder och format.

Offentlig sektor bör även bli bättre på att återanvända sin egen data, inom och mellan myndigheter, på ett sätt som möjliggör nya tjänster och ökad flexibilitet i kontakten med människor och företag, exempelvis med hjälp av artificiell intelligens. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 22-23)

Data som strategisk resurs

Som nämndes i inledningen ger öppna data möjligheten att samarbeta över organisationsgränser med andra aktörer för att dela och kombinera digitala resurser. Om öppna data inte hanteras som en strategisk resurs finns det risk att frågan inte prioriteras och arbetet kring att tillhandahålla data styrs av tillfälliga insatser. Om det inte finns nationella målsättningar att tillgängliggöra samhällsviktig data, kan insatser att öppna upp data istället styras av det som är tekniskt enkelt att tillhandahålla eller vara mindre politisk känsligt. Detta kan leda till att den fulla potentialen av digitaliseringen inte infrias och att resurser går förlorade. Därför behövs digitala resurser ses en strategisk viktig resurs oavsett om det skall användas internt eller tillgängliggöras för externa användare. Annars kan detta få stora implikationer, vilket vi såg när Transportstyrelsen outsourcade sin IT-infrastruktur som hanterade samhällsviktig data.

Dataformat och metadata

Beslut om vilka format som skall användas för att tillgängliggöra data behöver insikt och kännedom om vad som är ändamålsenligt för det tilltänkta användningsområdet. Det finns många olika dataformat med olika för och nackdelar, och det finns inget optimalt format som passar för allt. Däremot finns det format som både är maskinläsbara och enkla att läsa för människor som dessutom har utmärkt stöd för metadata, som exempelvis JSON och XML. Båda formaten är öppna och har en hieratisk struktur, det vill säga att data kan kategoriseras i olika nivåer och undergrupper – vilket gör det enkelt för användaren att transformerar mellan formaten beroende på vilket som passar bäst. JSON och XML har stöd för metadataschema vilket möjliggör beskrivning av objekt, datatyper för attribut och validering av möjliga värden. Metadataschema gör livet mycket lättare för utvecklare som vill vidareutnyttja data utan att behöva tolka och gissa vilka datatyper och värden som är rimliga. Länken visar ett exempel på hur ett schema ser ut för ett XML-schema. JSON och XML är anpassningsbara format och utgör grunden för de flesta standarder som används på nätet. Dessutom har de flesta webb och programmeringsmiljöer utmärkt stöd för att hantera och behandla data som tillgängliggörs i JSON och XML.

Metadata är lika viktigt som data om det det skall användas av andra än dig själv eftersom det beskriver för användare vilka egenskaper, struktur och hur det skall tolkas. För att göra en liknelse, föreställ dig att du är intresserad av en bil som står parkerad utanför en bilförsäljare, men som saknar information angående pris, miltal, årtal, bensin/diesel- och annan viktig fakta angående bilens beskaffenhet. Avsaknaden av fakta kring bilens egenskaper kommer antagligen göra att du som spekulant tappar intresse eftersom bilförsäljaren verkar oseriös. En rapport från European Data Portal (2016) visar att endast 26 procent av öppen data i Sverige tillgängliggörs i maskinläsbara format som JSON och XML. Att så mycket data och information tillgängliggörs i format som inte är läsbara av maskiner betyder att mycket tid och resurser går förlorade eftersom användare inte enkelt kan vidareutnyttja, kombinera och länka det men annan data.

Käll: European Data Portal – Sweden Overview (2016)

Att tillgängliggöra data utan metadata kommer begränsa vidareutnyttjande och möjligheten att kombinera det med annan data. Kommaseparerade filer (CVS) är ett öppet maskinläsbart format, men saknar möjligheten att definiera metadata och lämnar över ansvaret att tyda, transformera och validera data till användaren. Detta gör formatet mindre användbart för användare som behöver kombinera många olika datakällor. Bra metadata definitioner erbjuder alla användare stöd oavsett om man är bekanta med datasetet eller inte. Tabellen visar på vanliga dataformat och stöd för metadata definition.

FormatMetadata stödBeskrivning
ZIP (komprimerad fil)IngetInget stöd för metadata.
CSV (kommaseparerad fil)IngetInget stöd för metadata, första raden kan innehålla namn på kolumn
PDFBegränsatMetadata om skapare och datum.
Kalkylark (Excel)BegränsatMetadata om skapare, datum, format och datatyper. För att extrahera metadata behövs specialprogram eller moduler. Metadata är inte en naturlig del och formatet är proprietärt
JPG, PNGFullgottMetadata om skapare, datum, licensregler, geografisk plats, samt kamerainställningar med mera
JSON, XMLFulländatMetadata strukturer för beskrivning av, ägare, datum, tidszoner, komplexa datatyper och validering av tillåtna värden. Formaten innehåller metadataschema för beskrivning av taxonomier som innehåller objekt och hierarkier

Dataresurser på nätet

WC3 är en medlemsorganisation som driver viktiga öppna standardiseringar och ser till att webben fungerar som den gör idag. Grundaren Tim Berners-Lee skapade första versionen av hypertext standarden 1991 (HTTP och HTML), som möjliggjorde sammanlänkning av text, bilder och video på nätet. W3C och Tim Berners-Lee (TED talk) har varit en förespråkar sedan mitten av 2000-talet av ett paradigmskifte från att publicera text – till att publicera data på nätet. Protokollet som gör detta möjligt är uniform resource identifier (URI) och publicerades i sin nuvarande version (RFC 3986) redan 2005. De flesta är mest bekanta med URL (uniform resource locator) delen av standarden för adresser till webbplatser. Genom att nyttja hela URI standarden blir det möjligt att skapa en unik identifierare (URI) och publicera dataresurser på nätet. URI:er kan användas för att publicera data och information om fysiska och abstrakta resurser på nätet som exempelvis skolor, vägar eller regionindelning. Det är upp till den som publicerar data att säkerställa att (URI) identifierarna är både unika och beständiga över tid, vilket möjliggör förtroende mellan tillhandahållare och användare av data resurser på nätet.

En av fördelarna med URI protokollet är att det redan används idag för att publicera innehåll på webben. Protokollets regler för unika identifierare och dess inbyggda stöd för begreppsmodeller möjliggör beskrivning av komplexa samband och egenskaper som möjliggör interoperabilitet och vidareutnyttjande av data och information med bibehållen betydelse mellan organisationer och över nationsgränser. Stycket nedanför beskriver designprinciper för URI:er och grunden för länkad data, begreppsmodeller och den semantiska webben. W3C som tillhandahåller standarderna är en öppen medlemsorganisation för företag och verksamheter som vill delta i standardiseringsarbetet med någon av de för närvarande 95 standarder som ligger under organisationens paraply.

URI design

Med hjälp av unik identifierare (URI) kan data enklare vidareutnyttjas och länkas med annan data på nätet. URI:er kan användas för att publicera data och information om fysiska och abstrakta resurser på nätet som exempelvis skolor, vägar eller regionindelning. För att referera till resurser behöver identifierare och adresser vara beständiga över tid och vara logiskt strukturerade. Länken nedanför är en URI som beskriver länet Kent syd-ost om London, som är länkat till andra resurser som exempelvis regioner, vägar och geografiska egenskaper för att skala geografisk kontext.

http://data.ordnancesurvey.co.uk/doc/7000000000018210

URI:n för länet Kent följer riktlinjer för hur offentliga organisationer bör publicera dataresurser på nätet i Storbritannien (designing URI sets for the UK public sector). Att tillgängliggöra data och information som resurser på nätet kan vara ett omfattande arbete som bör göras iterativt eftersom det troligen kräver tillpassning och av både arbetssätt och IT-stöd. Därför rekommenderar W3C att börja publicerat data som har stort samhällsvärde och som kan vidareutnyttjas inom offentlig sektor. Att strukturera och publicera resurser med beständiga URI:er är en del av rekommendationen för publicering av länkad data som beskrivs i stycket nedanför.

Länkad data

Innan hypertext (HTML & HTTP) lanserades var inte existerande elektroniska dokument länkade med varandra på ett standardiserat sätt, vilket gjorde det svårt att referera till varandras dokument och skapa sammanhang. I dag står vi inför en liknande problematik med mängder av fristående datakällor på nätet som inte nyttjar standardiserade format och protokoll för att göra data mer användbar och tillgänglig. Precis som dokumenten på internet, behövs data länkas med varandra för att enklare kunna hittas och skapa kontext. Länkad data tillsammans med semantiska modeller, möjliggör att data blir överförbar mellan system, organisationer och landsgränser med bibehållen betydelse.

Länkad data nyttjar samma protokoll som används för att adressera webbsidor på nätet. Uniform Resource Identifier (URI) används för att identifiera unika resurser på nätet. Webbplatser använder oftast bara Uniform Resource Locator (URL) av protokollet för att identifiera unika platser. Styrkan med länkad data är att data kan kopplas ihop med annan data över organisationsgränser genom att använda beprövad teknik som redan är tillgänglig. Att publicera data med unik identifierare (URI) kräver lite mer förberedelse gentemot att publicera HTML-sidor, eftersom unika identifierare (URI) behöver vara kopplade till nycklar som används av interna IT-system. Unika identifierare behöver också skapas utifrån en konvention och process som kan förstås av människor och maskiner, som exempelvis Storbritanniens designriktlinjer för URI:er. Detta är viktigt för att göra URI:erna beständig över tid och möjliggöra vidareutnyttjande av digitala resurser som är länkade med varandra. Verktyg som femstjärnig modell för länkad data kan bidra med att visa vilka steg som behöver göras. Modellen är inte ett praktiskt verktyg, utan fungerar som motivation och indikation på nivå av mognad för implementering av länkad data. Det är först vid steg fyra och fem som arbetet med länkad data börjar generera större värden.

Källa: 5 ★ Open Data

Semantisk webb och begreppsmodeller

Skapande av unika identifierare (URI) för digitala resurser är startskottet för att bygga den semantiska webben och webben 3.0. Detta nya paradigm innebär publicering av data och information i standardiserade format som är avsedda att läsas av maskiner istället personer. Länkad data skapar global interoperabilitet mellan system genom att nyttja av format (RDF, JSON-LD) som länkar ihop viktiga resurser på nätet. Och som blir självförklarande för maskiner genom nyttjande av semantiska modeller som består av taxonomier (RDFS, OWL) och regler för att bygga begrepp- kunskapsmodeller. Modeller brukar innehålla språkanpassningar som gör det möjligt att terminologier och begrepp kan flyttas över landsgränser. När komponenterna för den semantiska webben finns på plats kan artificiell intelligens (AI) och självlärande system bidra till att effektivare och automatisera stora delar av transportsystemet. Bilden nedanför visar vilka format, standarder och protokoll som ligger till grunden för den semantiska webben.

Källa: Wikipedia (en)

SPARQL används för att ställa frågor på digitala resurser som är länkat till en eller flera begreppsmodeller vilket möjliggör interoperabilitet mellan system. Om skoldata och information var publicerad som länkad data och semantisk webb, skulle det gå att ställa frågor om all elevers skolresultat inom EU förutsatt att man nyttjar samma begreppsmodell för att beskriva skolresultat. Exempelvis skulle det vara möjligt att ställa frågor om vilka kommuner, regioner och länder som har elever med medel över betygsnivå B. Om skolresultat var länkat till fakta om elevers demografiska bakgrund, skulle det var möjligt att fråga om föräldrarnas medelinkomsten och vilket område de kommer ifrån.

För att enklare hitta och automatiskt indexera publicerad data finns standarder som DCAT-AP, GeoDCAT-AP som bygger på syntax från formatet RDF som används för länkad data och semantiska webben. DCAT-AP kan också använda för data som inte är sammanlänkad (XLS, CVS, PDF), men då går meningen förlorad med att skapa interoperabilitet mellan system och tillgängliggjorda digitala resurser. EU kommissionens finansierar flera stora program (ISA) inom Europa för att skapa interoperabilitet mellan system och automatisera administration.

Semantiska modeller gör det möjligt att definiera data med bibehållen betydelse över organisation och landsgränser, samtidigt som det minimerar möjligheterna till feltolkning. Modeller kan också länkas med varandra för att utgöra en större helhet. Detta är användbart för att definiera terminologier och begrepp för större verksamhetsområden. Flera branscher använder semantiska modeller idag för att beskriva komplexa förhållande och relationer mellan objekt. Exempelvis finns det modeller för medicinskt terminologi som beskriver kliniska behandlingar av sjukdomar, diagnostik och läkemedel som kallas SNOMED CT(Socialstyrelsen). Projektet är ett internationellt samarbete som har ett antal lokala anpassningar för olika språk som alla länkar tillbaka till en övergripande begreppsmodell. Detta medför att behandling och diagnostik av patienter som flyttas över landgränser blir entydig och minimerar risken för felbehandling beroende på tolkningsfel. En del av arbetet med att modellera semantiska modeller utgörs av att kategorisera och definiera relationen mellan begrepp. Bilden nedan representerar ett exempel av en enkel topologi av relationer mellan några däggdjur och egenskaper de besitter.

Källa: Semantic network – Wikipedia

Implementering av länkad data

Att styra över fokus från att publicera webbsidor till att publicera länkad data på webben kommer vara en process som behöver tid, kunskap och förståelse eftersom det troligen behövs förändringar av både verksamhetsprocesser och IT-arkitektur. W3C rekommenderar att man börjar med digitala resurser som har stort samhällsvärde och geografisk positioner som kan länkas samman med exempelvis postkoder, kommun och regions indelningar på nationell nivå. Detta eftersom det potentiella samhällsvärdet det skulle kunna skapa i relation till kostnader för att underhålla och skapa semantiska modeller. W3C ger förslag på hur semantiska modeller kan skapas och utvecklas iterativt genom att tillämpa en livscykelprocesser. Förslag nedanför visar på en iterativ process som består av; 1) specificera 2) modellera 3) generera 4) publicera och 5) exploatera.

Källa: Best Practices for Publishing Linked Data

Sammanfattning

För att myndigheter och offentliga organisationer skall lyckas med den digitala transformeringen och maximera nyttan som teknologin erbjuder behövs en kontinuerlig inhämtning av kunskap och kompetens av ledare och ansvariga. Om inte goda designprinciper och praxis utnyttjas inom offentlig verksamhet kommer det digitala kunskapsgapet att leda till att offentliga medel kommer berika privata företag som vill upprätthålla leverantörsberoende. Det digitala kunskapsgapet exemplifieras i dag av att fåtal privata leverantörer idag äger stora globala digitala plattformar som låser in privatpersoners data för egen vinning.

Datakvalitet

Inledning

Datakvalitet betyder olika saker beroende på syfte och målsättning. För att värdera och uppskatta datakvalitet behövs minst en tilltänkt användargrupp eller tillämpningsområde betraktas vid tillgängliggörande av data. Detta eftersom datakvalitet är kopplat till avsedda användare och vilket dataformat och standarder som används inom olika tillämpningsområden. Datakvalitet är kopplat till kostnader eftersom hög detaljrikedom och noggrannhet oftast kostar mer att tillhandahålla. Oavsett användargrupp eller tillämpningsområde bör all data som tillgängliggörs innehålla metadata som beskriver egenskaper av data, som exempelvis vem som skapat den, när den publicerades, vilka standarder eller enheter som används.

Exempelvis är kalkylblad ett användbart format för finansiell data och PDF dokument passande för offentliga handlingar som skall läsas av människor. Däremot är PDF dokument ett mindre lämpligt format om det skall användas för att publicera mätvärden av exempelvis temperaturobservationer som skall läsas av maskiner.

En kvalitetsaspekt som berör nästan all data oavsett tillämpningsområde är hur aktuell och tidsenlig data är, exempelvis förlorar prognoser om ankommande linjer till en hållplats snabbt sitt värde när avgången inträffat. Länk till principer angående datakvalitet.

Distinktion mellan data och information
Information kan aldrig bli bättre än kvaliteten av den data den härleds ifrån. Enkelt beskrivit är data en enhet fakta som i sig själv inte går att härleda något mening ifrån, däremot kan en mängd data utgöra mening i form av information beroende på hur det tolkas, behandlas och presenteras. En pixel i en bildfil är en  enskild enhet data som inte säger något om vad den representerar. Däremot tillsammans kan de representera en bild om de behandlas och presenteras rätt beroende på om metadata finns tillgängligt i filen vilket beskriver exempelvis färgrymd, bildbehandlingsstandard, datum, totalt antal pixlar med mera. I andra fall är distinktionen inte lika tydlig mellan data och information, exempelvis kan en enskild observation av temperatur tolkas och utgöra viss mening. När data om temperatur kombineras med data om geografisk plats, lufttryck, luftfuktighet med metadata om mätenheter, standarder, tidpunkt, mm. så skapas mening och sammanhang.

Exakthet och Precision

Ett sätt att förhålla sig till datakvalitet är att anpassa behovet av exakthet och precision i förhållande till sitt ändamål. Exakthet är hur väl data återger verkligheten, det vill säga hur väl fakta som finns tillhands kan återskapa den ursprungliga innebörden. Behovet av detaljnivå skall sättas i förhållande till ändamålet. Exempelvis kan en lågupplöst satellitbild vara tillräcklig för att se större byggnader och vägar, men inte tillräckligt detaljerad för att se stigar och mindre vägar. Behovet av detaljnivå behöver också sättas i perspektiv till kostnaden eftersom tillhandahållandet av data med hög detaljnivå är oftast förenligt med större kostnader. Förutom val av detaljnivån är det viktigt att välja maskinläsbart format som är lämpade för maskinell behandling och tolkning, mer om innebörden av maskinläsbart format går att läsa i länken nedanför.

… dataformat som är lämpade för resurssnål databehandling med möjligheter att definiera objekt, attribut och hierarkier så att maskiner kan tolka innehåll och kontext utan manuell handpåläggning. – Artikel om maskinläsbart format (15/03/2017)

Exakthet påverkas av faktafel och om data är inkomplett – det vill säga att poster av data saknas eftersom detta skapar brus och att data kvaliteten försämras. Även transformering av data till andra mätenheter kan påverka exaktheten eftersom detaljnivå kan gå förlorad. Generellt sett är det bättre att data tillhålls komplett och i ursprungliga mätenheter så att användare själv kan transformera och sammanställa efter behov.

Precision är hur väl data kan reproducera liknande resultat och betydelse oberoende av vem som tolkar den. Det vill säga att data med hög precision har hög korrelation för det som avses att mätas eller representeras. Dataformat som erbjuder hög precision är oftast hieratisk strukturerade, som exempelvis XML och JSON. Däremot garanterar inte dataformat precision, utan det förlitar sig på noggrannheten i de processer som mäta och samlar data.

Sammanställningar i form av rapporter och prognoser som inte innehåller underliga detaljer erbjuder låg eller ingen precision, då det inte tillåter andra att härleda resultatet. Exempelvis kan en medeltemperatur över en viss period verka rimlig, men med tillgång till underliggande temperaturobservationer kan användaren se standardavvikelsen och själv avgöra om mätningarna verka rimliga. Bilden nedanför föreställer sambandet mellan exakthet, precision, validitet och kommer från standarden ISO-5725-1. Standard förklarar generellt innebörden av av exakthet,  precision och validitet med gruppering av träffar på en tavla. Validitet är graden av sanning, det vill säga att data mäter det som är avsett att mätas. Exempelvis kan mätningar som avser att mäta utomhustemperaturen påverkas om mätningarna görs nära en byggnad eller bredvid annan värmekälla vilket påverka validiteten.

Låg exakthet, låg precision, och acceptabel validitet.
Hög exakthet, hög precision, och låg validitet

Principer angående datakvalitet

  • Ta reda på vilken detaljnivå av data de tilltänkta användarna är i behov av och motivera kostnaden med att tillhandahålla och underhålla data med ett tydligt syfte och målsättning som är kopplat till verksamhetsmål
    • Prioritera att tillhandahålla några få efterfrågad datakällor med hög kvalitet (exakthet, precision och med hög sanningshalt) istället för många med lägre kvalitet
    • Undvik att använda proprietära format som exempelvis EXCEL, PDF och Shapefile. Använd istället öppna format som inte kontrolleras av enskilda organisationer som exempelvis XML, JSON och GeoJson.
  • Inrätta rutiner och processer för att säkerställa att datakvaliteten upprätthålls löpande och varnar om enheter av data saknas eller att mätvärden överstiger tillåtna gränsvärden
  • Säkerställ att metadata är så komplett och beskrivande som möjligt, data som representerar komplexa objekt, validering och relationer mellan objekt behöver hierarkiska dataformat som XML och JSON, vilket erbjuder länkning till scheman som förklarande objekt, attribut och relationer
    • Inkomplett och felaktig metadata medför att förtroende och användningsområdet för data  minskar
  • Grunddata har flera applikationsområden kontra färdiga sammanställningar, prognoser och rapporter. Förklara istället hur användaren själv kan göra egna sammanställningar
    • Grunddata ger användaren möjlighet att använda egna algoritmer och uträkningar
    • Behåll ursprungliga enheter om mätenheter för grunddata, om transformeras till andra mätenheter görs behöver detta förklaras

Digitalt värdeskapande

INNEHÅLLSFÖRTECKNING

Digitalt värdeskapande

Perspektivet på digitalt värdeskapande principer och mekanismer är hämtat från etablerade forskningsområden som undersöker hur IT-baserade resurser och förmågor användas av företag för att skapa konkurrensfördelar. IT-resurser och förmågor ger upphov till mervärde baserat på hur de används internt och externt för att harmonisera processer och utbyte av information inom verksamheten och med samarbetspartners. Exempel på detta kan vara en just-in-time logistikkedja som bidrar med mervärde genom att processer och IT-stöd anpassas och standardiseras för att effektivisera samarbetet. För att bredda perspektivet används även litteratur som undersöker hur företag investerar och utnyttja varandras resurser inom partnerskap för att skaffa sig konkurrensfördelar.

Mer aktuella studier används för att förstå fenomen där interaktion och samarbete sker på armlängdsavstånd till varandra genom att digitala plattformsägare erbjuder digitala resurser via tjänster, gränssnitt och plattformar. Exempel på en sådan plattform är Apples app store som ger tredjepartsutvecklare tillgång till standardiserade processer och gränssnitt för att publicera egna tjänster och applikationer. Slutligen inkluderas teorier om hur öppen källkod används inom tjänsteutveckling genom att kombinera företagsspecifika immateriella rättigheter med öppna rättigheter och resurser för att utveckla konkurrenskraftiga tjänster.

Resursbaserade teorier

Resursbaserat perspektiv

Resource-based view , resursbaserat perspektiv, är ett sätt att betrakta värdeskapande genom att studera hur företag använder resurser, förmågor, kultur och strukturer för att skaffa sig fördelar på en konkurrensutsatt marknad 1. Perspektivet bygger på att företag använder sina materiella och immateriella resurser som exempelvis infrastruktur, byggnader, företagsstruktur, erfarenhet, kunskap, varumärke med mera för att skaffa sig konkurrensfördelar.

För att resurserna ska ge fördelar behöver de vara svåra att imitera så andra företag inte enkelt kan skaffa sig liknande resurser, exempelvis genom att köpa gängse programmjukvara eller IT-stödsystem på marknaden. Förutom resurser behöver företaget besitta förmåga att nyttja resurser man har tillgång till. Exempelvis kan det vara tillgång till kompetent personal som kan använda beslutsstödssystem och analysverktyg för att skaffa sig fördelar inom taktisk och strategisk beslutsfattning. Bestående konkurrensfördelar kan företag skaffa sig om de har resurser som är svåra att imitera i kombination med förmåga att realisera maximal nytta från båda. Om företaget däremot inte har värdefulla resurser eller förmåga att använda dem, kan det leda till konkurrensnackdelar.

Resursbaserad teori om hur resurser kan leda till bestående konkurrensfördelar. Källa: www.strategicmanagementinsight.com

IT-Affärsvärde

En teori som bygger på resursbaserat perspektiv är IT business value. Teorier kring IT-affärsvärde har utvidgat resursbegreppet till att inkludera resurser som sträcker sig utanför företaget eftersom IT-system gör det enklare att samordna processer över organisationsgränser2. Teorin är också mer fokuserat på immateriella resurser kopplat till informationssystem, där IT-relaterade förmågor och resurser är centrala för att företag ska kunna skaffa sig konkurrensfördelar. Även förmågor hos medarbetare betraktas som en resurs. Wade & Hulland identifierade tre typer IT-förmågor 3.

Tre kategorier av IT-förmågor – Wade & Hulland (2004)

Enligt klassificeringen finns det dels IT-förmågor och resurser som utvecklas från ett internt fokus – inside-out. Motivet att utveckla dessa förmågor och resurser styrs av interna krav för att effektivisera och anpassa sig till marknaden. Det kan vara beslut att köpa in ett nytt affärssystem för att effektivisera intern administration. Ett affärssystem är en resurs som enkelt kan upphandlas, men för att uppnå konkurrenskraft behöver företaget besitta eller hyra in kunskap för att integrera och anpassa systemet till den egna verksamheten. Enligt resursbaserat perspektiv leder inte ett nytt affärssystem till konkurrensfördelar eftersom resursen inte är sällsynt och den är inte speciellt kostsam eller svår att imitera. Kunskapen att anpassa den till olika verksamheter är inte någon unik förmåga, eftersom den troligen finns tillgänglig på den öppna marknaden.

Externa IT-förmågor – outside-in – är kunskapen och färdigheten att anpassa sig till marknaden, kunders och samarbetspartner behov. Externa IT-förmågor är baserat på tidigare erfarenheter av att samarbeta och sköta relationen till externa företag och kunder, som att exempelvis integrera processer och IT-stöd med underleverantörer. En annan extern IT-förmåga är att anpassa IT-strategier beroende på marknadsförändringar. För att anpassa och utveckla IT-strategier behövs förmågan att analysera marknadsförändringar och snabbt kunna förändra interna strategier.

För att jämka dessa två typer av förmågor menar Wade & Hulland att företag behöver gränsöverskridande förmågor – spanning capabilities, för att länka extern kravställning med intern. Gränsöverskridande förmågor visar sig vara viktiga för att skapa synergier i strategiska samarbeten. Dessa förmågor beror på hur väl olika funktioner och avdelningar är integrerade med varandra internt. Det avgör hur snabbt företaget kan anpassa sig till marknaden och externa behov. Företag som har fragmenterade processer och informationssystem har svårare att uppnå synergier genom samarbete med externa parter. En annan viktig gränsöverskridande förmåga är att kunna leda förändringsprojekt som kommer från externa påtryckningar genom att förutse och planera förändringsarbetet utifrån hur marknaden utvecklas, ny teknologi, standarder och direktiv. När interna och externa IT-relaterade förmågor harmoniserar med varandra kan företag förädla och utveckla värdeskapande, svårimiterbara resurser och förmågor, som ger upphov till tillfälliga eller bestående konkurrensfördelar.

Modell för IT-Affärsvärde

Företag påverkas också av externa faktorer som tillgången på kvalificerad personal, lagar och direktiv. Genom att utgå ifrån resursbaserat perspektiv skapade Melville, Kraemer och Gurbaxani (2004) en integrerad modell för IT-affärsvärde som även inkluderade dimensioner utanför företaget som också påverkar möjligheter att skaffa sig konkurrensfördelar. Den ena dimensionen var branschspecifika egenskaper vilket innefattade konkurrensutsatthet, förändringstakt, samt regleringar och direktiv som företag i en specifik bransch måste förhålla sig till. Den andra dimensionen var nationella egenskaper, som exempelvis tillgången till grundläggande nationell IT-infrastruktur, utbildning och forskning, rikstäckande initiativ och utvecklingsnivå. Som komplement till IT-relaterade resurser inkluderade även modellen resurser som företagskultur, policys, organisationsstruktur och rutiner.

Faktorer som påverkar IT-affärsvärde – Melville, Kraemer och Gurbaxani (2004)

Avkastning från partnerskap

Ett annat forskningsområde är relational rent, det vill säga hur unika värden och konkurrensfördelar uppstår genom strategiska partnerskap mellan två företag. Rent syftar på economic rent, det vill säga avkastningen för en begränsad resurs sedan produktionskostnaden dragits av. För att relational rent ska bli tydligt på svenska använder vi begreppet avkastning från partnerskap. Avkastning syftar både på ekonomisk vinst och förbättrade förmågor och strukturer skapade av partnerskapet. Forskningen bygger på studier av hur verksamhetsförmågor och organisationsstrukturer gör det möjligt att bygga långvariga strategiska partnerskap med synergieffekter och unika konkurrensfördelar 4.

Förutsättningen för att ett partnerskap ska leda till avkastning är att båda parter delar med sig av sina resurser, förmågor och erfarenheter. Med tiden förbättras förmågor som exempelvis kunskapsöverföring, koordinering och förståelse för varandras verksamheter. Fungerande partnerskap skyndar på utvecklingen av strukturer som leder till utbyte av operativ och strategisk information, kunskapsöverföring, processintegration och styrning för att följa upp och planera strategiska mål. Strategiska beslut kan fattas snabbare och implementeras över organisationsgränserna. Denna katalyserande effekt och avkastning är svårare att uppnå i samarbeten som inte är strategiska eller långvariga, där parterna inte investerar eller delar interna strategiska resurser, förmågor och strukturer lika målinriktat.

Anledningen till att enbart vissa typer av partnerskap ger avkastning är att det behövs förmåga och erfarenhet av att samarbeta. Förmåga och erfarenhet leder till ännu bättre avkastning när långvariga och djupgående partnerskap skapas. Exempel på förmågor som kan leda till sådana partnerskap är erfarenhet att identifiera viktiga partnerskap, kunskap att länka processer och IT-stöd, attityd – en vilja att samarbeta, och strukturer för att snabbt fatta beslut som kan verkställas av båda parter. Den avkastning som tillfaller parterna kan variera och behöver inte vara likvärdig i form och magnitud. Det är inte en perfekt symmetri mellan typen och storleken av värdet den enskilda parten får av det strategiska partnerskapet.

Studie av partnerskap inom innovations sektorn

En studie av över 400 high-tech företag visar vilka förmågor och strukturer som krävs för att skapa framgångsrika partnerskap inom innovation och utveckling sektorn 5. För att förstå vad som ger upphov till avkastning inom partnerskap granskade studien relationsspecifika variabler och data om bland annat företagens vinster, konkurrenskraft index, marknadsandelar och utvecklingskostnader. Det resulterade i en modell för vilka variabler som påverkar möjligheten till avkastning från partnerskap.

Klassifikation av relationsstrukturer, relationsbevarande egenskaper och relationsförmågor – Zhang, Li & Li (2017)

Relationsstrukturer är enligt studien något företag behöver investera i för att samarbete ska löna sig. Relationsstrukturer handlar om personal som ingår i gemensamma projekt, avtal, förtroende, IT-stöd, ledarskap med mera. Antalet personer i projektet är lika betydelsefullt som att projektmedlemmarna har rätt bakgrundskunskap.

Relationsbevarande egenskaper avgörs av magnituden och styrkan i relationen. Värt att notera är att närhet enligt studien kan vara företag med liknande verksamhetsområde och likvärdiga resurser. Slutligen avgörs relationen mellan parterna av de relationsförmågor som behövs för att bygga ett fungerande partnerskap. Enligt studien handlar relationsförmåga om att koordinera, lära av varandra, förstå den andra parten och att fånga upp kunskap i den egna verksamheten. Förmågan att behålla värdefulla partnerskap kan påverkas om gemensamma projekt bemannas med konsulter som tar med sig erfarenheten när projekt är färdigt.

Studien presenterar ett index som visar på vilka relationsspecifika faktorer som ger avkastning från partnerskap. Betydelsen av de tre delindexen; relationsstrukturer, relationsbevarande egenskaper och relationsförmågor, visade att samtliga var ungefär lika viktiga för att bygga fungerande partnerskap, samt att det är en stark korrelation mellan avkastning och fungerande partnerskap. Det betyder att om företag vill förbättra avkastningen från partnerskap behöver dom bygga bra relationer med sina samarbetspartner. Studien visar också vilka faktorer – i fallande ordning, företag behöver inventera och utveckla för att upprätthålla relation och avkastning från partnerskapet.

Relationsstrukturer

  1. Integrerade IT-system och stöd för gemensamma projekt
  2. Informationsdelningsrutiner för spridning av information till inblandade
  3. Rutiner för identifiering av eventuella samarbetspartner internt och externt

Relationsbevarande egenskaper

  1. Inställning och vilja att samarbete med ett brett spektrum av aktörer, både innanför och utanför sitt verksamhetsområde
  2. Personlig motivation och projekts betydelse för verksamheten
  3. Likhet mellan verksamhetsområde, tidigare gemensamma samarbeten, och hur inflytande och dominant den andre parten är

Relationsförmågor (alla lika betydelsefulla)

  • Nyttja och tillämpa teknologier i partnerskapet,  kombinera och nyttja olika teknologier
  • Identifiering och inhämta viktig strategisk kunskap om teknologier och dess inverkan
  • Integration, utveckling och anpassning av IT-system för gemensamma projekt
  • Projektkoordinering, resursplanering och målstyrning

Förutom relationsspecifika faktorer är avkastning från partnerskap beroende på nivån och längden av samarbete. Den första typen av partnerskap kännetecknas av mer temporära samarbeten genom att använda delar av varandras teknologier och processer. Detta resulterar i marginella och tillfälliga värden och leder inte till att förbättrade de interna förmågorna som behövs för att skapa strategiska samarbeten. Dessa temporära värden kommer i huvudsak från koordinering, effektivisering av tjänst och produktivitetsutveckling.

Typer och nivåer av partnerskap och avkastning – Zhang, Li & Li (2017)

Den andra typen av partnerskap, som 70 procent av de undersökta företagen hade – visar att företagen delade mer av varandras utvecklade teknologier och upphovsrätter. Denna nivå av samarbete visar att företagen utvecklade gemensamma teknologier och processer som kunde användas i egna tjänster och produkter. Vinsterna och upphovsrätterna delades mer likvärdigt. Den andra nivån av partnerskap var också mer långtgående och resulterade i att företaget utvecklade och förbättrade samarbete och relationsförmågor.

Den tredje och minst påträffande typen av partnerskap i studien visade sig ge de bästa samarbetsförmågorna och mest bestående konkurrensfördelarna. Denna nivå av partnerskap gav upphov till förbättrade ledarskapsförmågor, förtroende, delade värderingar och integrerade processer för att styra utveckling och produktion mellan företagen. Företagen upprättade strategiska allianser med varandra och delade i mycket större utsträckning upphovsrätter och vinster i jämförelse med den andra två andra nivåerna.

Övriga teorier – värdeskapande

Gränssnittsresurser

Studier angående gränssnittsresurser undersöker hur plattformsägare tillhandahåller digitala resurser och funktioner via API:er (application programmable interface)  och gränssnitt. Teorin för gränssnittsresurser bygger inte på resursbaserat perspektiv, utan fokuserar på hur samarbete på armlängdsavstånd mellan tillhandahållare och användare – tredjepartsaktörer av immateriella digitala resurser. Det som karaktäriserar samarbetet är att resurserna tillhandahålls via standardiserade gränssnitt och används av en större heterogen användargrupp. Exempel på detta är Google Maps som ger användare möjligheten att använda kartor i appar och webbsidor via ett standardiserat API med avtal som reglerar användarvillkoren. I motsats till teorier för avkastning från partnerskap har inte dessa gränssnitt eller infrastrukturägare en nära relation till sina kunder och användare.

Boundary resources refer to “the software tools and regulations that serve as the interface for the arm’s- length relationship between the platform owner and the application developer” 6

Det finns oftast en konflikt mellan att erbjuda efterfrågad funktionalitet och att behålla kontroll över gränssnitt och plattform. Ett exempel på konflikt kan vara att användare skapar webbsidor på information som inte finns publicerad via plattformsägarens gränssnitt, vilket resulterar i att ägaren antingen måste begränsa tillgången eller publicera informationen via gränssnittet. Ett annat problem som kan uppstå är att stora externa aktörer och grupper kan utöva inflytande för att påverka plattformsägare till sin egen fördel. Studier kring gränssnittsresurser är ett intressant perspektiv för att förstå hur innovationer uppstår mer oväntat genom att använda funktioner via stora etablerade digitala plattformar som exempelvis App Store och Google Play 7. Teorin för gränssnittsresurser tillför ett perspektiv för att förstå hur plattformsägare och användare påverkar varandras möjligheter att skapa innovationer i dynamiska nätverk med heterogena aktörer.

Sociotekniska mekanismer

Öppna data och digitalisering har blivit en universallösning för transparens och effektivisering inom offentlig förvaltning. Flera studier har använt sociala teorier som undersöker samspelet mellan mekanismer på mikro- och makronivå för att förstå hur bestående värde skapas 8. På makronivå ger direktiv, lagar, utbildning, kultur, teknisk infrastruktur som exempelvis bredband, möjlighet för individer på mikronivå att agera med hjälp av till exempel öppna data. Det kan i sin tur transformera och påverka faktorer på makronivån. För att öppna data skall komma till bättre användning har sju olika dimensioner identifierats som betydelsefulla för att bidra till skapande av social och ekonomiska värden 9.

Sju dimensioner för att generera värde med öppna data – Jetzek, T. H. (2015)

För att data ska kunna användas behövs intermediära aktörer som kan bidra med att distribuera, kombinera och paketera data för olika användningsområden. Dessa aktörer har också insikt i vilken data som behövs för specifika ändamål och marknader.

Värdekedja för öppna data – Jetzek, T. H. (2015)

Teorier om öppen källkod, öppna data och öppen innovation

Historiskt har innovation och utveckling varit en aktivitet som företag hållit tätt intill bröstet och inte gärna delat med sig av för att skaffa sig konkurrensfördelar. Däremot har företag alltid hämtat idéer från kunder och andra konkurrenter. Företag har i allmänhet skyddat patent och immateriella rättigheter eftersom det kräver stora investeringar för att utveckla nya produkter och tjänster. En förändring inträffade när gratisprogram och öppen källkod gjorde entré i början av 2000-talet. Redan vid den tiden hade öppen källkod visast sig vara värdefull i många samarbetsprojekt inom universitetsvärlden och vid uppbyggnaden av internet innan millennieskiftet. Flera tidiga förespråkare av öppen källkod menade att offentlig verksamhet hade ett ansvar att investera och använda öppen källkod för att bidra till kollaborativ utveckling istället för att köpa licensbaserad mjukvara.

Många lyckade öppen källkodsprojekt är baserade på frivilligt deltagande i decentraliserade styrda communities, där agendan och aktiviteter koordinerades av grupper och individer som säkerställer att arbetet drivs framåt. Numera finns det också många företag som bidrar med resurser till öppen källkod projekt med olika motiv 10.

Ett av motiven är att företag vill dela kostnaden och riskerna genom att delta i arbetet i en community tillsammans med andra frivilliga och företag. Exempel på detta är Mozillaprojektet som stöder visionen om ett öppet internet (läs mer om deras motiv och vision) och erbjuder webbläsaren Firefox som öppen källkod. Ett annat motiv är att dela immateriella rättigheter och teknologier för mjukvara som företag har svårt att få ut kommersiella värden av. Istället erbjuds rättigheterna öppet för att snabba på användningen av teknologier för att eventuellt i ett senare skede skapa produkter eller sälja tilläggstjänster. Exempel på detta är Sun Microsystem som tillgängliggjorde referensimplantationen – kompilatorer och klassbibliotek av programmeringsspråket Java 2007, så företag och privatpersoner kan delta i utvecklingen av Java genom att vara medlem av Java Community Process (JPC). Den nuvarande ägare av Java, Orcle Corperation har en uppsjö av produkter och tjänster som bygger på Java-teknologier.

Öppna data bygger på samma grundläggande principer som öppen källkod, det vill säga öppenhet, delaktighet och samarbete. Öppna data är ett synsätt som tillkom genom ett möte mellan tongivande personer inom webb 2.0-teknologin och öppen källkod år 2007. Tanken bakom mötet var att kombinera idéer från öppen källkod tillsammans med öppen och transparens inom offentlig sektor. De affärsmodeller som är vanliga inom öppen källkodsprojekt är inte direkt tillämpbara på öppna data eftersom mjukvara innefattar flera komponenter som infrastruktur, standarder, processer och data. Däremot bidrar det med en förståelse av hur öppna resurser kan spela en viktig roll i att skapa sociala och ekonomiska värden i kollaborativ anda.

Forskare inom företagsekonomi och strategiskt ledarskap började intressera sig för hur öppna materiella rättigheter kunde användas för design och utveckling. Detta inspirerade till idéer om öppen innovation där företag kan dra nytta av öppna såväl som egna rättigheter i utvecklingsprocessen 11.

Öppen innovation är ett sätt för företag att inkorporera interna och externa idéer i den egna utvecklingsprocessen. Detta kan vara genom att exempelvis använda, imitera eller kombinera både öppna och egna teknologier. Oavsett om rättigheterna är öppet tillgängliga eller inte, behöver företag som tillämpar nya idéer utifrån besitta interna förmågor för att absorbera och nyttja nya teknologier för eget bruk. Att använda öppen källkod i utvecklingen av företagsprodukter och tjänster är ett exempel på hur en öppen innovationsprocess tillämpas. Teorier för öppen innovation används i projektet för att belysa att företag kan använda olika källor för att arbeta med design och utveckling.

Sammanfattning

Teorierna som används i projektet utgör ett ramverk för att betrakta hur verksamheter skapar unika resurser och förmågor för att vara konkurrenskraftiga på en öppen marknad. Teorin för IT-affärsvärde beskriver hur digitala resurser är en viktig komponent för att skapa mervärde beroende på hur väl det harmoniseras med verksamhetens övriga resurser, förmågor och strukturer. Teorin för avkastning från partnerskap klargör vilka mekanismer som skapar konkurrenskraftiga samarbeten genom att kombinera verksamhetsspecifika resurser, förmågor och strukturer över organisationsgränserna.

De andra teorierna som ingår i ramverket förklarar bland annat hur digitala gränssnitt används som strategisk resurs för att exempelvis skapa globala plattformar och infrastruktur för digital tjänsteutveckling. De förklarar också hur öppen källkod kan användas i den egna utvecklings- och innovationsprocessen för att skapa värdefulla digitala resurser genom delaktighet och samarbete i communities där immateriella rättigheter delas och utvecklas gemensamt. Gemensamt för teorierna är att de visar på mekanismer som förklarar olika perspektiv på hur digitala resurser och förmågor skapar unika värden och bestående konkurrenskraft på en marknad som drivs av teknologisk utveckling. Detta är relevant för alla verksamheter oavsett om de är offentliga eller privata. Exempelvis ersätter redan idag robotar och algoritmer jobb inom offentlig verksamhet.

Socialsekreterare säger upp sig när roboten tar över deras arbetsuppgifter

Sveriges radio P1

Därför är det viktigt att den egna verksamheten har resurser, förmågor och strukturer som enkelt kan anpassas för strategiska samarbeten med aktörer som kan ge upphov till unika resurser och värden.

Test av Trafikverkets API för trafikinformation

Profilbild Trafikverket

Trafikverket tillhandahåller flera öppna datatjänster, en av dessa är API:et för trafikinformation. API:et började som en renodlad tjänst för tåg, vilken senare utökades med vägdata som också finns tillgängligt i datatjänsten Datex. Vår granskning av olika API:er är ett led i arbetet att belysa hinder och behov kring nyttjande av öppna API:er från ett användarperspektiv. Tanken med testerna är att ge konstruktiv feedback till dataägarna när det gäller sådant som kan förbättras, samt visa på bra exempel och lösningar som kan inspirera andra dataägare. Läs mer om bakgrunden till varför vi granskar öppna API:er och öppna datakällor. Läs hela testet

Test av Västtrafiks API för kollektivtrafik

vt-logo-digitala-kanaler

Västtrafik erbjuder flera API:er för att söka och planera kollektivtrafikresor i Västra Götaland som heter Reseplaneraren (version 2). API:erna finns att hitta på Västtrafiks utvecklingsportal, som fungerar som en samlingsplats för deras datatjänster. Att granska öppna data och API-tjänster är ett försök att främja nyttjandet och visa på vanliga problem användare stöter på. Läs mer om bakgrunden till testerna och vad som ligger till grund för de olika kategorierna. Läs hela testet

Ändamålsenlig öppna data och öppna data 2.0

water-dropÖppna data är på väg in i ett nytt paradigm där fokus ligger på användarnas efterfrågan av data i maskinläsbara format, standarder och med öppna licenser som gör den funktionell för sitt tillämpningsområde. På engelska brukar detta benämnas ”liquid information” eller ”liquid data” som går att läsa om i McKinsey’s rapport från 2013. Rapporten visar på vilka potentiella värden som kan uppnås om standarder, format och metadata är funktionella för det avsedda användningsområdet. Ett annat nära besläktat uttryck som förekommer är ”open data 2.0” vilket handlar om att öppna data ska tillgängliggöras utifrån efterfrågan och erbjuda delaktighet där användarna lätt kan rapportera in avvikelser och lämna förbättringsförslag. Läs vidare