Henrik Summanen Rotating Header Image

Wikipedia är framtidens infrastruktur

På måndag kommer jag att sätta mig ner med frågan om hur vi på Riksantikvarieämbetet ska hantera Wikipedia. RAÄ har kommit långt i detta avseende, och ser Wikipedia som en del av den infrastruktur för information som vi alla använder. Detta ställningstagande har även Libris på Kungliga Biblioteket gjort. Men hur blev det så, att en ideell organisation på relativt kort tid seglade upp som den stora informationskällan på internet?

Det enkla svaret handlar om att det är den tillgängliga informationskällan (många andra allmänna informationskällor, som Nationalencyklopedin, är inlåsta bakom betalväggar), så det är där den som söker hamnar. Det lite mer laborerade svaret är att det är så här nätet fungerar, och att vi alla måste anpassa oss. Jag ska försöka fördjupa de här resonemangen nedan.

Lite historik

Wikipedia grundades i USA 2001, så det är lite drygt tio år gammalt som koncept. På den tiden har rörelsen (för Wikipedia kan nog bäst beskrivas som en rörelse) lyckats etablera sig som en av de tyngsta informationsleverantörerna i världen. Vad du än söker efter på Google, så kan du vara ganska säker på att det finns en Wikisida relativt högt upp i sökresultatet. Detta är det kanske främsta skälet för oss inom kulturmiljöbranschen att använda oss av detta medium. Om någon vill ha information om till exempel arkeologi, eller om en specifik fornlämning, som Ales stenar, då är det väldigt hög sannolikhet att de hamnar på en Wikipediasida. En stor del av denna framgång ska man tacka Google för, eftersom de har sorterat upp Wikipedias träffar – men å andra sidan så anpassar sig Google efter vad användarna vill ha, så man kan kanske konstatera att Wikipediasidan är ett attraktivt mål för informationssökare på internet. Idag finns det på svenska Wikipedia nästan en halv miljon artiklar (Wikipedia statistik), och det ökar ständigt. För de som är intresserade av hur snabbt redigeringarna trillar in kan jag rekommendera Wikistream.

Alla kan ändra allting!?

Ja, normalt sett kan en användare ändra på, korrigera eller bara förbättra de artiklar som finns. Eller helt enkelt skapa nya. Men man ska ha klart för sig att det knappast är någon anarki som råder. Tvärtom så är redaktörscommunityn runt Wikipedia väldigt stark, och det finns god koll på de som gör bra saker, och de specifika sidor som det tvistas om. Det tar ett tag, och många goda redigeringar, för att bli en sann “wikipedian”. Det kan kanske enklast förklaras som Wikipedia själva skriver på sin introduktionssida:

“Öppna nätverk som Wikipedia är nytt för de flesta, och kombinationen av frihet och ansvar kan vara svår att hantera för många. Förtroendet brukar ta fram det bästa hos var och en och misstag rättas snabbt till av andra. Börja gärna som läsare av encyklopedin, men tveka inte att redigera om du upptäcker ett stavfel eller en konstig meningsbyggnad. Majoriteten användare är ju som du själv och alla har vi något ämnesområde som ligger oss särskilt varmt om hjärtat – somliga kan bidra med fakta, andra med formatering och bilder och åter andra med rent tekniskt underhåll. Var och en bidrar med det man kan bäst och alla lär sig mer under resans gång. Både Wikipedias omfång och djup garanteras av antalet användare.”

Allmän information, allmänt tillgänglig

Den tredje stora aspekten av den här frågan är vem som äger informationen. Det finns statliga institutioner som har ansvarsområden som är relativt tydligt avgränsade: Riksantikvarieämbetet har byggnadsminnen och fornlämningar, Riksarkivet har handlingar, museerna har föremål och Kungliga biblioteket har böcker, bara för att ta några exempel. Men när det handlar om den information som knyter ihop alla dessa olika föremål, fornlämningar, handlingar och böcker hamnar man i en gråzon. Det är spridda skurar av information, men ingen är lika sammanhållen och håller lika hög kvalitet som Wikipedia (vågar jag nog säga). Man kan ta Sten Sture d.ä. som exempel. Det finns handlingar på Riksarkivet som berör personen, det finns böcker på Sveriges bibliotek, och det finns föremål på museerna, men idag är det ingenting som knyter ihop dessa objekt, annat än bokstavskombinationen “s-t-e-n  s-t-u-r-e” (risken är ju stor att man hittar Sten Sture den yngre). Och Wikipedia – Libris har t ex länkat in Wikipediasidorna för personer till sin auktoritetslista (eller VIAFs motsvarande).

Den information som inte direkt faller på någons bord, är det enklast (informationstekniskt) att hämta från Wikipedia, eftersom man då får möjlighet att låta detta ske dynamiskt (att maskinerna själva hittar fram till informationen, snarare än att någon måste länka in varje faktabit manuellt). Dynamisk hämtning av information är det enda som rimligen fungerar i vårt samhälle, nu när informationsmängderna blir så stora. Och effektiviteten härstammar från att man enbart behöver göra länkningen en gång – sedan kan alla andra återanvända länkningen.

Framtidens strukturerade information

Men det finns fortfarande lite problem med Wikipedia. Den största delen av den information som lagras där är ostrukturerad, eller bara delvis strukturerad. Detta innebär att man inte kan välja vilka delar av informationen man vill hämta, utan måste hämta allt samtidigt (eller göra rutiner för att hämta det, men detta görs manuellt och tar tid). Om informationen hade varit strukturerad hade man t ex kunnat hämta ut bara födelseåret och födelseplatsen för Sten Sture, något som idag är lite mer komplicerat. Olika tjänster på webben (och i mobiler) kräver olika typer av information, och om man vill att maskinerna ska kunna hitta den informationen själva måste man märka sitt material noga – dvs strukturera sin information. Det finns många metoder att göra detta, men det viktiga är att man utgår från användarna utanför ämbetsområdet. Idag är nämligen den största delen av strukturen skapad av och för yrkesmän. Informationsstrukturen beskrivs enligt olika metadataformat. När man lägger ut sin information är det viktigt att man anger vilket format det handlar om, på samma sätt som att det är viktigt att man talar om vad det är för typ av information, vilket språk det är skrivet på och vilken domän man arbetar inom.

När en sådan struktur är på plats får vi möjlighet att hämta och lämna information helt utifrån de olika situationer som användarna kan tänkas vilja ha den. Det är därför vi ska jobba tillsammans med Wikipedia.

 

One Comment

  1. Johanna says:

    Tack Henrik för klargörande och pedagogisk text. Här http://wikistrategies.net/wikipedia-traffic-news/ finns lite ytterligare om varför det är bra att kvalitetshöja uppslagsord man bryr sig om redan innan publikintresset väcks. Det kan komma plötsligt, och med stor kraft!

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>