Om databasjournalistik
Databasjournalistik kan verka snårigt. Medan områden som ekonomijournalistik eller kriminaljournalistik är inriktade på rapportering av ämnen är databasjournalistik i sig mer av en metod. SVT Pejls egen databasredaktör Helena Bengtsson reder ut vad databasjournalistik är och kan vara.
Databasjournalistik eller CAR – Computer Assisted Reporting är på ett sätt ett konstigt begrepp – vi säger ju inte ”Telephone Assisted Reporting” eller ”Pen and Paper Assisted Reporting”. Från början omfattade begreppet all den journalistik som görs med hjälp av datorer men nu för tiden kan man dela upp databasjournalistiken i två huvudgrupper: Analys och Presentation
Databasjournalistik förutsätter inte att det finns en färdig databas. Ofta innebär jobbet att man börjar med att skapa sin databas på olika sätt.
Databasjournalistik förutsätter inte att det finns en färdig databas. Ofta innebär jobbet att man börjar med att skapa sin databas på olika sätt. Man kan begära ut pappersdokument från myndigheter och sedan föra in uppgifter från dokumenten i en tabell, t.ex. i Excel. Man kan skicka ut en enkät och få tillbaka svaren antingen på papper, i mailform som måste överföras till Excel eller en databas, eller via ett enkätverktyg som oftast levererar svaren direkt till en tabell. Man kan göra egna observationer och sedan mata in dem i tabellform.
Det är också möjligt att med hjälp av offentlighetsprincipen begära ut en hel, eller delar av, en databas från myndigheter. Det finns dock inget stöd i lagen om att lämna ut uppgifter eller data elektroniskt utan där får man lita på myndighetens goda vilja. I några fall har myndigheter valt att skriva ut en databas på papper för att sedan lämna ut den som dokument men i andra fall har det funnits välvilliga myndigheter som till och med har skrivit om sina dataprogram för att kunna vara behjälpliga med information.
Analys
Analysen kom först – och allra först anses Philip Meyer vara, en journalist vid Detroit Free Press som efter upploppen i stan 1952 använde en dator för att kunna visa att de som var med i upploppen inte alls var fattiga outbildade människor utan till lika hög grad college-utbildade. Ett annat tidigt och intressant exempel kommer från Atlanta där Bill Dedman så småningom vann ett Pulitzerpris för sin analys av data om vilka som beviljas huslån och den diskriminering som han då upptäckte förekom när det gällde medelinkomstinvånare med afroamerikansk bakgrund.
Vad menar man då med analys? Allt som förädlar den databas man har. Allra enklast är ju att göra ett urval från ett större material. Ett sådant material var den 380 000 poster stora databasen över krigsdagboken från Irak som vi fått via Wikileaks. Det första urvalet vi gjorde där var naturligtvis att hitta alla dokument som innehöll ordet ”Sweden” – vi hittade 56 stycken. Och de är ju mycket lättare att läsa än att titta igenom 380 000.
Ett tidigt exempel på databasjournalistik är en samkörning mellan lärarregistret å ena sidan och registret över personer dömda för brott å andra sidan.
Ett annat exempel kan vara att sortera en tabell för att se vem som är störst eller minst. När sorteringen är gjord så har man grunden för sin story, ex ”Mest jordbruksbidrag i Blekinge får Johannishus gods”, och kan gå vidare med intervjuer och annat. Oftast är dock analysen lite mer sofistikerad, man vill kanske lägga till information, som uppgifter om län och kommun, man vill räkna ihop pengar eller andra summor, eller man vill samköra två tabeller. Ett tidigt exempel på databasjournalistik är en samkörning mellan lärarregistret å ena sidan och registret över personer dömda för brott å andra sidan. Samkörningen gjordes av SCB på uppdrag från TV-programmet Striptease. Journalisterna på SVT fick inte ta del av de enstaka träffarna i samkörningen, endast statistik över hur många träffar som fanns och vilka brott det rörde sig om. Trots detta ledde det reportage som sändes i oktober 1996 till att det enligt lag blev möjligt att kontrollera lärare innan de anställs.
Vad är då skillnaden mellan en statistiker och en databasjournalist? Ibland är den väldigt liten. Ett exempel är journalisterna Josh Benton och Holly Hacker på The Dallas Morning News som med hjälp av statistiska metoder som regressionsanalys analyserade stora mängder data från de standardiserade prov som genomförs på varje amerikansk skola. Journalisterna analyserade både själva testresultaten men lade också till variabler som vilken bakgrund eleverna hade och hur fattiga de var. De hittade då skolor med osedvanligt goda resultat. Efter närmare analys och många intervjuer kunde de avslöja ett omfattande fusk med testresultaten – och hittade exempel på hur skolor hade låtit elever göra proven i grupp, eller helt enkelt talat om svaren.
I andra fall är det enskildheterna som blir det viktiga, att hitta detaljerna i ett stort material – de detaljer som är intressanta journalistiskt. En databasjournalist betraktar databasen som ett ytterligare intervjuobjekt – att ställa frågor till och utifrån de svar man får kunna ställa nya frågor.
För några år sedan fick SVT-journalisten Mikael Pettersson idén att granska alla kommunstyrelser och hur de var sammansatta. För fullmäktige så är det ju valsedlarna som bestämmer vilka som kommer in, men partiernas representanter i kommunstyrelsen utses av partierna själva. Han beställde en körning från SCB som innehöll alla kommuner, alla partier och hur många män och kvinnor som satt i varje kommunstyrelse. Att räkna ut fördelningen män/kvinnor för varje parti var enkelt och slutsatsen var inte så förvånande att Kristdemokraterna hade lägst andel kvinnor. Mer förvånande var att de andra borgerliga partierna inte följde så långt efter. Vi bestämde oss för att vinkla storyn på folkpartiet och Mikael gav sig ut för att göra intervjuer. Ganska snart uppkom nya frågor, men eftersom vi satt med hela materialet kunde vi snabbt ta hand om de invändningar som dök upp. Som när folkpartiet hävdade att orsaken till att det var så få kvinnor representerade var att de ofta bara hade en plats i kommunstyrelsen. Då ställde vi frågan till databasen om andra partier med en plats – och fann att Miljöpartiet gav 40 procent av sina platser till kvinnor, medan Folkpartiet bara lyckades i 28 procent. På samma sätt kunde vi enkelt gruppera om materialet och titta på hela blocken för sig. Det blev då tydligt att över 50 kommuner helt saknade kvinnliga representanter för det borgerliga blocket.
Dvs, jämfört med om vi hade gått på ett pressmeddelande, där vi inte kunnat kolla uppgifterna bakom, så hade vi stora möjligheter att hela tiden gå tillbaka till rådata och ställa nya frågor.
Presentation
I takt med att internet vuxit fram och webben blivit mer tillgänglig så har journalister också börjat publicera sin analys och ibland hela databaser på webben. Det är också möjligt att visualisera data genom att plotta punkter på en karta, visa diagram och grafer eller göra animeringar som berättar en hel historia.
Ett exempel är Dollars for Docs – ett undersökande projekt gjort av organisationen ProPublica i New York. De tittade på ersättningar och arvoden som läkare får av läkemedelsföretag och fick då ut en databas från företagen som innehöll namn på läkare och de belopp som betalats ut. Från analysen av databasen fick de ett antal artiklar, publicerade hela databasen på webben – och gjorde dessutom en applikation som kan publiceras på vilken webbsida som helst.
De senaste åren har en mängd verktyg dykt upp som gör det relativt enkelt att visualisera data.
De senaste åren har en mängd verktyg dykt upp som gör det relativt enkelt att visualisera data. I många fall är dessa gratis och tillgängliga för nerladdning. Journalister har inte varit sena att börja använda den typen av verktyg. Också när det gäller programmering och presentation av databaser har nya verktyg gjort det enklare att publicera hela basen på webben. Som Django, ett verktyg som först utvecklades på Washington Post och sedan användes för EveryBlock, en webbsida som hämtar offentliga data och fördelar ut den på väldigt lokal nivå. Django användes också av Pulitzerprisvinnaren Politifact men det ska sägas att det krävs ganska avancerade kunskaper i programmering för att jobba med sådana verktyg. Detta gäller också programmeringsspråk, som Python, Perl och Ruby men i takt med att journalister har velat göra mer och mer komplicerade analyser och presentationer, så har de också fått lära sig mer komplicerade verktyg.
Inte alla jobbar på det sättet – det finns också en mängd verktyg idag som gör det lättare att presentera, utan att man har kunskaper i programmering eller html. Ett sådant verktyg är Tableau, som hyfsat enkelt gör det möjligt att presentera en karta med punkter på webben. Ett exempel är kartan över alla trafiksäkerhetskameror som SVT:s Rapport presenterade strax före jul 2010. Där visas alla kameror samt uppgifter om hur många bilister som fångats av kameran. Uppgifterna kom från Transportstyrelsen, med koordinater för varje kamera. På samma sätt kan man använda Google Fusion, som enkelt översätter adresser till punkter på en Google-karta.
Det finns även verktyg för andra visualiseringar där man enkelt kan skapa ett ordmoln ur en text eller göra snygga diagram och grafer för publicering på webben.


