Henrik Summanen Rotating Header Image

wikimedia

Syns dina “things” i Google?

Google har nyligen ställt om sin sökalgoritm till att omfatta inte bara strängsökningar (det vill säga mönstermatchningar av ord) till att även omfatta semantiskt information om saker. Detta innebär att du på sikt kommer att börja din sökning med att välja vilken “sak” du menar när du skriver till exempel “kung karl” (menar du Karl XII eller Karl X eller någon annan). Du kan identifiera vilket av dessa objekt du är ute efter genom att viss information presenteras i anslutning till titeln. När du klickar på objektet får du upp information som är direkt relaterad till just det objekt som du söker.

Detta är en enorm omställning för Google, som bokstavligt talat går “from strings to things”. Eftersom Google inte pratar om webbsemantik utan istället har valt ordet “Knowledge Graph” kan man misstänka att maskineriet för detta ligger bakom en stängd vägg. Hur detta ska utveckla sig återstår att se, det är möjligt att Google bedömer att det inte är värt att låsa in sin metainformation på sikt.

Så varför spelar detta roll för oss inom kulturarvsområdet? Egentligen handlar detta om att synas, det vill säga att vara tillgänglig och användbar. Nu när folk har lärt sig använda Google, så finns det inte så många alternativ till detta för att hitta information. Om någon vill hitta information (även om det som du förvaltar) så kommer de att använda Google. Googles kunskapsgraf hämtar sin information från semantiska nätverk som DBpedia, Freebase och en hel del andra ställen, så det enklaste om man vill vara uppdaterad med sin information på nätet är kanske att redigera i dessa (öppna) källor.

Eller helt kortfattat: Tänk dig att det bara finns ett uppslagsverk i världen. Tänk dig vad som händer om du inte är med i det.

Därför måste vi nätverka

För några år sedan utkom en bok med namnet “the Filter Bubble” – Filterbubblan – i den betraktas ur olika synvinklar det faktum att vi kapslas in i den typ av information som vi tidigare valt (och, för all del, även i annan typ av information baserad på vår ålder, browser eller annan profilering). Det är så sökmotorer som Google arbetar idag. Det grundläggande problemet kan sägas vara: hur kan vi få information om sådant som vi inte redan känner till, om vi dels hela tiden själva väljer våra informationskällor, och dels hela tiden matas med information baserat på våra tidigare val?

Frågan har diskuterats ganska mycket tidigare, och det finns de som tycker att detta är ett icke-problem (t ex Jocke Jardenberg). Men det är också en del av den mängd skillnader som finns mellan ett analogt samhälle och ett digitalt. Tidigare var det journalister, förläggare och redaktioner som beslutade vilken information vi skulle få, och idag beslutar vi själva, och algoritmer. Det är egentligen bara viktigt att vara medveten om detta, och det gäller förstås lika mycket nu som då. Men det finns en viktig skillnad: det massmediala samhällets urval gällde alla, det digitala samhällets urval är individuellt.

Så frågan blir: hur lyckas vi nå ut med vår information som kulturarvsaktörer? Risken är ju stor att de som t ex tror att Bob Lind har rätt gällande Ales stenar, bara väljer att lyssna på honom och hans gelikar, och väljer bort den information där motargumenten presenteras innan de ens har sett den. Där det tidigare var bäst att jobba med massmedia och direktutskick (utifrån ett traditionellt sändare-mottagare-perspektiv) är det idag bättre att jobba upp relationer med användare för att de ska lita på att man är en trovärdig aktör, man bygger nätverk (utifrån ett nätverkssamhällesperspektiv).

Ingen litar på någon som man inte har förtroende för. Och relationer byggs mellan människor, inte mellan myndigheter och människor. Därför skulle jag säga att det är av yttersta vikt att människor som är anställda vid kulturarvsinstitutionerna faktiskt ägnar en del tid åt det som kallas nätverkande: att socialisera med intressenter på alla möjliga nivåer, vare sig det är privata vänner eller okända personer som kontaktat organisationen på annat sätt. Det är så man bygger ett förtroende och en relation. Det är ju först när man tror på att det finns en människa i andra änden som man litar på det som sägs. Här har Bob Lind lyckats mycket bättre än nästan alla stora aktörer på området, och man kan kanske säga att vi har lite att lära av honom.

 

Om journalistens uppdrag – och lite Wikipedia

Det är mycket Wikipedia just nu. Förutom att Riksantikvarieämbetet har beslutat sig för att anställa en Wikipedian in residence, så har även Norsk kulturråd valt att inleda ett samarbete med Wikipedia. Wikimedia är namnet på organisationen som driver Wikipedia-sajten i Sverige. Även här har det hänt ganska mycket, bland annat har en GLAM-ansvarig anställts. GLAM står för Galleries Libraries Archives Museums, och handlar alltså i första hand om att samordna kulturen i relation till Wikipedia.

När det händer mycket börjar det också dyka upp motreaktioner. Den mest negativa skrevs av författaren Maja Hagerman som i en kolumn i Dagens Nyheter kallar Wikipedia för “Breiviks privata universitet”. Det är mycket som kan sägas om Hagermans uppfattningar om Wikipedia, men det grundläggande tror jag är att hon utgår från ett analogt paradigm i sin betraktelse. I en värld där det alltid är någon som går i god för källan (ett förlag, en producent, en finansiär etc) är det osannolikt att någon skulle vilja lägga pengar på rena dumheter – då kostar det ju att sprida information – men idag (inom ett digitalt paradigm) kan alla publicera sig helt utan mellanhänder. Det hon inte tar upp är att det förstås finns en förändring inte bara gällande hur man sprider information i ett digitalt samhälle, utan också i hur man använder den. Att gå till källan har aldrig varit så aktuellt som nu, och särskilt inte på Wikipedia – som ju kräver externa referenser för informationen som läggs in.

Sen det här med journalistens framtid i en digital värld. Hagerman skriver så här:

Ändå hör man sägas ibland att det inte kommer att behövas några journalister i framtiden eftersom informationsspridningen blir allt öppnare.

Jag har svårt att få ihop hur den här meningen är tänkt att fungera i resonemanget. Ska jag tolka den som att journalisters roll bara är att sprida information? Det är nog få journalister som håller med om att så är fallet. Tvärt om så är tanken med en journalistkår att granska makten, analysera och förklara skeenden som annars blir väldigt oklara för gemene man. Detta är av största vikt i ett informationssamhälle eftersom mängden tillgänglig information är ett problem – som avnämare måste man veta vem man kan lita på. Tyvärr är stora delar av journalistiken undermålig idag, särskilt på tidningar som Aftonbladet som dagligen publicerar strunt som vem som helst kan hitta på Flashback, men tyvärr går även tidningar som DN i samma riktning – bort från analys och reportage, och mot sensation. Kanske handlar det om att jaga läsare. Jag tror att man gör en kortsiktig vinst (man når ju de som ännu inte har hittat till Flashback), men en långsiktig förlust (man tappar bort alla nya läsare som hellre vänder sig till seriösa bloggare, t ex Ajour). Inte ens när journalistförbundets ordförande får bre ut sig nämns detta, utan istället är fokus på problemen i icke-demokratier.

Frågan kring om det är bra eller dåligt med Wikipedia dök också upp i Radio1s program Online, där undertecknad tillsammans med Leo Vallentin och Jan Ainali gav motbilden till Björn Häger, som var något mer negativ. Den som lyssnar på programmet kommer att få en god sammanställning av hur Wikipedia fungerar idag, och av hur myndigheter och andra organisationer använder sajten som en del av sin infrastruktur för att fullfölja sitt uppdrag.

Den sammanlagda känslan är dock att samhället på det stora hela har börjat acceptera Wikipedia som en informationskälla som är här för att stanna. Men det verkar finnas en hel del barnsjukdomar, och frågan är om det är mediat i själv (Wikipedia) det är fel på, eller om det är metoderna för användningen det är fel på? Är det fel på alla bilar som kör för fort, om jag cyklar på en motorväg?

Wikipedia är framtidens infrastruktur

På måndag kommer jag att sätta mig ner med frågan om hur vi på Riksantikvarieämbetet ska hantera Wikipedia. RAÄ har kommit långt i detta avseende, och ser Wikipedia som en del av den infrastruktur för information som vi alla använder. Detta ställningstagande har även Libris på Kungliga Biblioteket gjort. Men hur blev det så, att en ideell organisation på relativt kort tid seglade upp som den stora informationskällan på internet?

Det enkla svaret handlar om att det är den tillgängliga informationskällan (många andra allmänna informationskällor, som Nationalencyklopedin, är inlåsta bakom betalväggar), så det är där den som söker hamnar. Det lite mer laborerade svaret är att det är så här nätet fungerar, och att vi alla måste anpassa oss. Jag ska försöka fördjupa de här resonemangen nedan.

Lite historik

Wikipedia grundades i USA 2001, så det är lite drygt tio år gammalt som koncept. På den tiden har rörelsen (för Wikipedia kan nog bäst beskrivas som en rörelse) lyckats etablera sig som en av de tyngsta informationsleverantörerna i världen. Vad du än söker efter på Google, så kan du vara ganska säker på att det finns en Wikisida relativt högt upp i sökresultatet. Detta är det kanske främsta skälet för oss inom kulturmiljöbranschen att använda oss av detta medium. Om någon vill ha information om till exempel arkeologi, eller om en specifik fornlämning, som Ales stenar, då är det väldigt hög sannolikhet att de hamnar på en Wikipediasida. En stor del av denna framgång ska man tacka Google för, eftersom de har sorterat upp Wikipedias träffar – men å andra sidan så anpassar sig Google efter vad användarna vill ha, så man kan kanske konstatera att Wikipediasidan är ett attraktivt mål för informationssökare på internet. Idag finns det på svenska Wikipedia nästan en halv miljon artiklar (Wikipedia statistik), och det ökar ständigt. För de som är intresserade av hur snabbt redigeringarna trillar in kan jag rekommendera Wikistream.

Alla kan ändra allting!?

Ja, normalt sett kan en användare ändra på, korrigera eller bara förbättra de artiklar som finns. Eller helt enkelt skapa nya. Men man ska ha klart för sig att det knappast är någon anarki som råder. Tvärtom så är redaktörscommunityn runt Wikipedia väldigt stark, och det finns god koll på de som gör bra saker, och de specifika sidor som det tvistas om. Det tar ett tag, och många goda redigeringar, för att bli en sann “wikipedian”. Det kan kanske enklast förklaras som Wikipedia själva skriver på sin introduktionssida:

“Öppna nätverk som Wikipedia är nytt för de flesta, och kombinationen av frihet och ansvar kan vara svår att hantera för många. Förtroendet brukar ta fram det bästa hos var och en och misstag rättas snabbt till av andra. Börja gärna som läsare av encyklopedin, men tveka inte att redigera om du upptäcker ett stavfel eller en konstig meningsbyggnad. Majoriteten användare är ju som du själv och alla har vi något ämnesområde som ligger oss särskilt varmt om hjärtat – somliga kan bidra med fakta, andra med formatering och bilder och åter andra med rent tekniskt underhåll. Var och en bidrar med det man kan bäst och alla lär sig mer under resans gång. Både Wikipedias omfång och djup garanteras av antalet användare.”

Allmän information, allmänt tillgänglig

Den tredje stora aspekten av den här frågan är vem som äger informationen. Det finns statliga institutioner som har ansvarsområden som är relativt tydligt avgränsade: Riksantikvarieämbetet har byggnadsminnen och fornlämningar, Riksarkivet har handlingar, museerna har föremål och Kungliga biblioteket har böcker, bara för att ta några exempel. Men när det handlar om den information som knyter ihop alla dessa olika föremål, fornlämningar, handlingar och böcker hamnar man i en gråzon. Det är spridda skurar av information, men ingen är lika sammanhållen och håller lika hög kvalitet som Wikipedia (vågar jag nog säga). Man kan ta Sten Sture d.ä. som exempel. Det finns handlingar på Riksarkivet som berör personen, det finns böcker på Sveriges bibliotek, och det finns föremål på museerna, men idag är det ingenting som knyter ihop dessa objekt, annat än bokstavskombinationen “s-t-e-n  s-t-u-r-e” (risken är ju stor att man hittar Sten Sture den yngre). Och Wikipedia – Libris har t ex länkat in Wikipediasidorna för personer till sin auktoritetslista (eller VIAFs motsvarande).

Den information som inte direkt faller på någons bord, är det enklast (informationstekniskt) att hämta från Wikipedia, eftersom man då får möjlighet att låta detta ske dynamiskt (att maskinerna själva hittar fram till informationen, snarare än att någon måste länka in varje faktabit manuellt). Dynamisk hämtning av information är det enda som rimligen fungerar i vårt samhälle, nu när informationsmängderna blir så stora. Och effektiviteten härstammar från att man enbart behöver göra länkningen en gång – sedan kan alla andra återanvända länkningen.

Framtidens strukturerade information

Men det finns fortfarande lite problem med Wikipedia. Den största delen av den information som lagras där är ostrukturerad, eller bara delvis strukturerad. Detta innebär att man inte kan välja vilka delar av informationen man vill hämta, utan måste hämta allt samtidigt (eller göra rutiner för att hämta det, men detta görs manuellt och tar tid). Om informationen hade varit strukturerad hade man t ex kunnat hämta ut bara födelseåret och födelseplatsen för Sten Sture, något som idag är lite mer komplicerat. Olika tjänster på webben (och i mobiler) kräver olika typer av information, och om man vill att maskinerna ska kunna hitta den informationen själva måste man märka sitt material noga – dvs strukturera sin information. Det finns många metoder att göra detta, men det viktiga är att man utgår från användarna utanför ämbetsområdet. Idag är nämligen den största delen av strukturen skapad av och för yrkesmän. Informationsstrukturen beskrivs enligt olika metadataformat. När man lägger ut sin information är det viktigt att man anger vilket format det handlar om, på samma sätt som att det är viktigt att man talar om vad det är för typ av information, vilket språk det är skrivet på och vilken domän man arbetar inom.

När en sådan struktur är på plats får vi möjlighet att hämta och lämna information helt utifrån de olika situationer som användarna kan tänkas vilja ha den. Det är därför vi ska jobba tillsammans med Wikipedia.