Henrik Summanen Rotating Header Image

Att låta maskinerna göra jobbet

Det finns ett “sök-och-hitta”-paradigm i kulturarvsvärlden som ständigt dyker upp i diskussioner kring digitalisering av information, och i funderingarna kring hur man ska konstruera sina webbtjänster. Den grundläggande idén är att vi finns till för att folk ska kunna söka i våra samlingar och hitta den information vi behöver. Tanken är inte fel, och den är framför allt axiomatiskt korrekt för arkiven, museerna och biblioteken.

Men i samband med digitaliseringen skulle jag säga att tankesättet på många sätt skapar skygglappar för en av den digitala informationens största styrkor. Jag ska försöka förklara på vilket sätt. Jag har tidigare tagit upp att en ny mediaform alltid börjar sina trevande uttryck som imitationer av de andra medieformer man redan känner till. På detta sätt blir den tidiga filmen varianter på stillbilder och teater – det vill säga rörlig stillbild och filmad teater. Det är dessa uttryck man känner till och det är också på det sättet man börjar använda det nya mediat. Då vi bara befinner oss i början på digitaliseringen kan vi med fog anta att vi just nu ägnar oss åt att imitera analoga medieformers sätt att hantera allt som just nu digitaliseras. Vi gör till exempel PDF:er av dokument, trots att vi vet att den digitala potentialen ligger i att dokumentets semantiska innehåll är sökbart och bearbetningsbart över internet.

När vi säger att man ska söka och hitta information, tappar vi samtidigt bort det faktum att den digitala tekniken inte bara gör det möjligt för oss att digitalisera våra objekt, utan också att digitalisera våra arbetssätt. Varför ska vi inte låta maskinerna arbeta åt oss även i frågan om att söka och hitta? De är ju snabbare och uthålligare, och med rätt strukturerad information kan de leverera svar som tidigare tog forskare år att besvara. Det är alltså inte en människa (enbart) som är konsumenten av den digitala informationen, utan för att nyttja den digitala informationens inneboende potential måste vi tänka att användaren är en maskin.

Det är här vi brister. Vi försöker imitera ett traditionellt förhållningssätt till information, eftersom det är detta vi känner till. Stora företag, som Amazon och Google, har redan insett att framtiden ligger i att maskinerna arbetar åt oss. Därför låter de algoritmer genomlysa konsumenters tidigare klick, val och köp och levererar sannolika träffar på våra sökningar på nätet. I botten på Googles sökmotor finns en grafmodell som i allt väsentligt förefaller stämma överens med den öppna modellen för Länkad data. Skillnaden är att Google, som säljer bearbetning av information, ser graferna som en affärshemlighet, och inte släpper in oss för att se hur maskineriet fungerar.

För att maskiner ska kunna hantera vår information behöver den knytas in i ett informationsnätverk, eller en infrastruktur för information, där maskinerna utifrån avancerade instruktioner kan leta igenom, sortera och välja ut de svar vi som människor skulle kunna tänkas vilja ha. Därför måste varje insats till digitalisering ha denna användargrupp för ögonen redan när projektet formuleras. Det måste till exempel finnas en idé om långsiktigt upprätthållande av identifikatorer på varje enskilt objekt, och en grundläggande struktur för den metadata som beskriver informationen.

När vi tänker oss att framtiden ger oss större tillgång till mer information behöver det därför handla mer om att rikta om yrkeskårerna inom arkiv, museer och bibliotek till att förstå och hantera dels strukturer för maskiners konsumtion av vår information, dels de utökade och mer komplexa informationskluster som infinner sig – vilka frågor kan man egentligen ställa till vilka datamängder, och vad betyder egentligen svaret man får?

Här är den största utmaningen inom kulturarvsbranschen, och den närmar sig med stormsteg. För det är nog få av de som jobbar här idag som uppfattar sig som digitala mäklare för informationskluster med målgruppen maskiner.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>