Henrik Summanen Rotating Header Image

Uncategorized

Några rader om kulturarvets “masterdata”

En av de stora knäckfrågorna när det gäller digital kulturarvsinformation, är de så kallade auktoriteterna. Eller, uttryckt med ett annat ord, kulturarvets masterdata. Detta är termer som kan behöva lite förklaring. Inom de flesta sektorer finns det information som används av väldigt många aktörer. Det kan handla om listor över hammarmodeller för verkstadsmekaniker, om listor över djurarter för biologer, eller listor över människor för historiker och arkivarier. Dessa listor har funnits i analog form i många av de databaser som byggts upp på olika institutioner, eftersom man har haft ett behov av att hålla reda på att man refererar till samma typ av objekt.

Nu när de digitala nätverken via internet öppnar upp institutionernas data för omvärlden uppstår således problem. Eftersom detta handlar om data som är användbar för många olika aktörer, så finns det också många register med historiska gubbar, och många förvaltare av samma information. Hur ska vi göra för att på ett så enkelt och effektivt sätt som möjligt hantera dessa “huvudposter” inom kulturarvsvärlden?

Detta var faktiskt en av huvudfrågeställningarna som det uppdrogs till DIGISAM att utreda, när sekretariatet tillsattes för ett antal år sedan. DIGISAM skapade projektet DISKA som skulle kunna ge ett svar på problemet. Den 11/2 2014 hade DISKA sitt slutseminarium och redovisade vad de har gjort, tillsammans med andra aktörer inom samma område.

I DISKA har man dels inventerat vilka informationsmängder som finns på institutionerna. Dels valt ut några av dessa för att skapa en representation av objekten som Länkade Öppna Data.  Urvalet handlade om historiska personer från olika institutioner, och personera hade haft lite olika roller –  t ex insamlare eller arkitekter. Man konstaterar att det fortfarande förstås är den förvaltande institutionen som har ansvar för sina respektive personer. Poängen med DISKA-projektet är att de nu även är länkbara med unika identiteter.

Även Kultur-ITs projekt KulturNav presenterade en liknande lösning, där institutioner ges möjlighet att “ladda upp” sina dataset för att användas av andra. MetaSolutions berättade om sin tjänst LODify som skapar Länkade data av dataset. Sen fick vi också höra lite från Wikimedias André Costa angående Wikipedias arbete med framför allt WikiData.

Det är viktigt att dessa frågor lyfts fram, och det är väldigt viktigt att institutionerna publicerar sina vokabulär så att man kan länka till dem. Det måste jag säga först, för nu kommer ett antal funderingar kring vad som händer när man publicerar vokabulär på det här sättet.

För det första: Det har inte förekommit någon diskussion kring ansvar i frågan om digitala auktoriteter. Alla tjänster som presenterats hanterar möjligheter att lägga upp vokabulär. Både inom KulturNav och inom DISKA så handlar detta om att man lägger sina listor sida vid sida. Detta löser givetvis inga problem. Det är först när det utkristalliserar sig en aktör som är villig att ta på sig ett större ansvar än enbart de entiteter som är relevanta för den egna verksamheten som det uppstår magi.

För det andra: Det har inte förekommit någon diskussion kring vad som händer när man börjar länka ihop olika masterdataset. Om institution X lägger upp August Strindberg, och institution Y lägger upp August Strindberg så har vi goda skäl att anta att de syftar på samma historiska individ. Särskilt om födelse- och dödsdatum överensstämmer. Då kan man länka dessa som “SameAs” så vet både maskiner och människor att man syftar på samma sak. Problemet är att det inte har presenterats några gränssnitt för att göra denna koppling, och ofta har inte institutionerna någon egen kompetens för att sätta ihop datat. Inom KulturNav förefaller det finnas ett ganska bra gränssnitt för att göra just den typen av länkar dock. Men det är bara den förvaltande institutionen som kan göra förändringar i datasetet, så vad händer om man inte vänder länken åt andra hållet? Får den andra institutionens ansvarige reda på att någon har länkat en annan resurs som SameAs deras resurs? Det är ju först när man börjar att på detta sätt använda andras data, eller koppla mot andras data som det börjar bli intressant.

En tredje fundering är vem som är ansvarig för all “bonusinformation”. Om syftet med att ha distribuerade datakällor är att man ska kunna använda varandras data, så är det snart så att någon får skörda vinsten av att någon annan gör jobbet. Så är det nämligen med Länkade Öppna Data, att vinsten inte nödvändigtvis uppstår där kostnaden uppstår. Och dataförvaltning kostar. Så på sikt ser vi scenariot att ett fåtal aktörer glider in i rollen som informationsförvaltare av information som i huvudsak är viktig för andra. Man institutionaliserar alltså auktoritetsbehovet. Detta tror jag är bra, och jag tror att det är nödvändigt eftersom det krävs en tydlig rollfördelning.

Tyvärr, måste jag säga, var tiden så knapp att ingen av dessa frågor var möjlig att diskutera på plats. Så jag får skriva det här istället:

1. Hur ska ansvaret för olika auktoriteter se ut, om vi ska kunna få ut någon vinst av att man använder varandras data?
2. Vem är ansvarig för tillbakalänkning, eller “vända” länkar? Är det datasetsägaren så har vi problem.
3. Hur hanterar vi en situation där kostnad och ansvar går hand i hand? Går det att reglera detta på sikt?

Därför måste vi nätverka

För några år sedan utkom en bok med namnet “the Filter Bubble” – Filterbubblan – i den betraktas ur olika synvinklar det faktum att vi kapslas in i den typ av information som vi tidigare valt (och, för all del, även i annan typ av information baserad på vår ålder, browser eller annan profilering). Det är så sökmotorer som Google arbetar idag. Det grundläggande problemet kan sägas vara: hur kan vi få information om sådant som vi inte redan känner till, om vi dels hela tiden själva väljer våra informationskällor, och dels hela tiden matas med information baserat på våra tidigare val?

Frågan har diskuterats ganska mycket tidigare, och det finns de som tycker att detta är ett icke-problem (t ex Jocke Jardenberg). Men det är också en del av den mängd skillnader som finns mellan ett analogt samhälle och ett digitalt. Tidigare var det journalister, förläggare och redaktioner som beslutade vilken information vi skulle få, och idag beslutar vi själva, och algoritmer. Det är egentligen bara viktigt att vara medveten om detta, och det gäller förstås lika mycket nu som då. Men det finns en viktig skillnad: det massmediala samhällets urval gällde alla, det digitala samhällets urval är individuellt.

Så frågan blir: hur lyckas vi nå ut med vår information som kulturarvsaktörer? Risken är ju stor att de som t ex tror att Bob Lind har rätt gällande Ales stenar, bara väljer att lyssna på honom och hans gelikar, och väljer bort den information där motargumenten presenteras innan de ens har sett den. Där det tidigare var bäst att jobba med massmedia och direktutskick (utifrån ett traditionellt sändare-mottagare-perspektiv) är det idag bättre att jobba upp relationer med användare för att de ska lita på att man är en trovärdig aktör, man bygger nätverk (utifrån ett nätverkssamhällesperspektiv).

Ingen litar på någon som man inte har förtroende för. Och relationer byggs mellan människor, inte mellan myndigheter och människor. Därför skulle jag säga att det är av yttersta vikt att människor som är anställda vid kulturarvsinstitutionerna faktiskt ägnar en del tid åt det som kallas nätverkande: att socialisera med intressenter på alla möjliga nivåer, vare sig det är privata vänner eller okända personer som kontaktat organisationen på annat sätt. Det är så man bygger ett förtroende och en relation. Det är ju först när man tror på att det finns en människa i andra änden som man litar på det som sägs. Här har Bob Lind lyckats mycket bättre än nästan alla stora aktörer på området, och man kan kanske säga att vi har lite att lära av honom.

 

EuropeanaTech – är det här framtidens kulturarv?

Har nu tillbringat två dagar i Wien på den avslutande konferensen för Europeana Connect. Här har en hel del spretiga ansträngningar för att få styr på det digitala kulturarvet mött varandra. De ca 200 deltagarna på konferensen blandade fritt mellan unga programmerare och kostymklädda chefer eller utredare. På det hela taget en ganska kreativ samling personer där faktiskt de flesta hade någonting intressant att bidra med i diskussionerna.

Mitt huvudsakliga intryck är att hela evenemanget andades av viljan att förmedla ett ”tänk” som producerats i Europeanas beslutande skikt. Inget ont om detta, de har gjort ett stort jobb med att få ihop den digitala världens trender med modern europeisk politik och utveckling. Men när hela första dagen ägnades åt att basunera ut ett enda, och hyfsat enkelt, budskap via både keynote-talare och tematik blir det så uppenbart att det var omöjligt för flera av föreläsarna att inte kommentera kring detta.

Trappan upp enligt Europeana? (en våning ovanför konferenslokalen)

Därför kommer nu del ett i Europeanas strategi gentemot sina informationsleverantörer.

1. Öppenhet

Det kunde tydligen inte sägas tillräckligt många gånger, och begreppet vreds och böjdes och töjdes ut-och-in innan dagen var klar. Alla var överens: det finns inte en rimlig framtid för ett kulturarv som spränger gränser och slår gnistor, om inte detta också är fritt att användas hur som helst, av vem som helst och genom alla tänkbara (öppna) gränssnitt. Det skissades till och med upp en bild av en kulturvärld i opposition mot en kommersiell värld, driven av konsumism och styrd av ett fåtal stora aktörer inom kommunikation. Detta är jättebra, men det var nog helt fel publik, och någon debatt var därför inte möjlig att få till stånd.

Del två av Europeanas strategi var lite mer otydlig.

2. Crowdsourcing

I alla olika former, och i olika termer, är aktivitet och användbarhet för ”dom där ute” någonting som man lägger stor vikt vid. Andra dagens keynote-talare gav en uppsjö av olika former av möjligheter att involvera användarna i skapandet och förbättrandet av all information som finns hos museer, arkiv och andra aktörer. Rädslor, ovana och oförståelse för metoden tuggades igenom. Jättebra! I bakgrunden skymtade också ordföranden för Wikimedia UK som haft mängder med samarbeten med museer och andra stora aktörer. Det finns för närvarande inga uppenbara samarbeten mellan Wikipedia och Europeana, vilket kan bedömas som lite märkligt eftersom de i grunden har samma målsättning.

Sammantaget kan man säga att detta handlar om 1) arenan eller spelplanen för den digitala informationen, och 2) metoden för hanterandet av den digitala informationen. Jag håller helt med, det finns nog ingen annan väg att gå. Grejen är väl att på den här konferensen är alla redan frälsta. Det man får med sig hem är starka argument och bra bundsförvanter.

Jag känner mig ändå lugn över att utvecklingen inom Sverige, och hos Riksantikvarieämbetet i synnerhet, är på helt rätt väg. Och Sverige pekades flera gånger ut som en intressant aktör inom det här området. Hoppas att vi kan leva upp till detta.

 

Ny webb

Just det. Jag har ändrat min gamla webbsida till en wordpress-blogg, eftersom det är bättre för att finnas med i de digitala strömmarna. Dessutom så behöver man inte bekymra sig för hur det ser ut i olika browsers, eller hur det fungerar på olika system. WordPress får lösa det. Återkommer med innehåll inom kort.