"Le petit journal", målning av Konstantin Stoitzner (1863–1934).

Tidningar är en viktig typ av källor, som dock innebär särskilda utmaningar vid digitaliseringen i ett projekt som Wikisource.

Tidningar i svenska Wikisource

redigera
Mer än 30 sidor
Enstaka sidor
Projekt som bygger på innehåll ur tidningar

Riktlinjer för tidningar i svenska Wikisource

redigera

Vi provar oss fram. Området är nytt. Dokumentera erfarenheter och rutiner här.

  • Filer som laddas upp till Wikimedia Commons läggs i en kategori för varje tidningstitel, till exempel commons:Category:Post- och Inrikes Tidningar. Skriv gärna i kategorins inledning att korrekturläsning äger rum på svenska Wikisource, så att fler intresserade hittar hit.
  • Filerna namnges med TITEL ÅÅÅÅ-MM-DD SSS.FILSLUT, till exempel Post- och Inrikes Tidningar 1835-12-29 3.jpg för sidan 3 den 29 december 1835. Om ett helt nummer (med flera sidor) ryms i en PDF- eller Djvu-fil, sätts förstås sidnumret inte ut i filnamnet. Med namnrymden Fil: kommer man till bildfilens beskrivningssida, men namnrymden Sida: kommer man till korrekturläsningssidan.
  • På svenska Wikisource används kategori:Kungliga biblioteket för de Index-sidor som bygger på inscannat material från KB.
  • Inledningsvis kan man använda en Index-sida per tidning, som omfattar alla årgångar och nummer (som exempel Tidning Wenersborgs stad och län). När många nummer av Post- och Inrikes Tidningar lades in, visade det sig fördelaktigt att i stället göra en Djvu-fil och Index-sida per dag, och göra översikten i kalenderform.
  • Även om man bara vill digitalisera en enstaka artikel, så följer man mönstret med kategorier, namngivning och upprättande av en Index-sida för tidningen, så att andra kan fortsätta att lägga till år och nummer.
  • Använd rubriker på följande nivåer:
    • <h1> för tidningens titel,
    • <h2> för sektioner (Inrikes, Utrikes, Handelsnyheter, Annonser) och för större artiklar,
    • eventuellt <h3> för underavdelningar eller egna artiklar inom en sektion.
    • För olika orter inom utrikes och inrikes nyheter används inga rubriker alls, utan bara brödtext på egen rad, eventuellt markerad i fet/kursiv/spärrad stil.
    • För varierande textstorlekar inom annonser, använd exempelvis <big> men inte rubriker.
  • Äldre dagstidningar har ofta en följetong utspridd över flera sidor. Vid transkludering kan följetongen separeras från övrigt innehåll i tidningen genom att använda tekniken med sektioner, se Östgötaposten 1897-09-10.
Öppna frågor
  • Är det meningsfullt att skapa en sida i huvudnamnrymden för varje tidningsnummer? Som prov finns Post- och Inrikes Tidningar 1821-01-02.
  • Ska man försöka följa teman genom alla tidningsnummer, t.ex. de dagliga meteorologiska observationerna?
  • Ska man försöka indexera artiklar av samma namngivna författare?
  • Ska man i artikeltexten länka person- och ortnamn till motsvarande artiklar i Wikipedia?
  • Hur kan man koppla årtalsartiklarna i Wikipedia till tidningarnas innehåll?
  • Hur kan Wikisource samarbeta med andra projekt som indexerar tidningsartiklar?
Resurser och hjälpmedel
  • En lista över förkortningar av tidningstitlar finns i Wikipedia. Den kan vara användbar när Post- och Inrikes Tidningar anger U.W. som nyhetskälla (Uddewalla Weckoblad).
  • Kalenderöversikten för Post- och Inrikes Tidningar skapas med scriptet Kalender.sh.
  • "Nya Lundstedt" är Kungl. bibliotekets databas över "Svenska dagstidningar från 1900". De äldre finns i Sveriges periodiska litteratur (3 delar, 1895-1902) av Bernhard Lundstedt.

Svårigheter vid digitalisering av tidningar

redigera
  • Hela nummer (utgåvor, häften) och tidsserier (månader, år) av tidningar har en stor textmassa. Ofta är man bara intresserad av enstaka artiklar. När är det mödan värt att försöka digitalisera hela årgångar av en tidning?
  • Varje sida av en tidning brukar vara stor. Bilden av hela sidan kan inte samtidigt vara läsbar på en datorskärm. Man måste kunna zooma och panorera utan att förlora orienteringen. På webben går det vanligen inte att länka till en viss del av den stora bilden, till exempel nederst i spalt 3.
  • Genren är inte enhetlig. Det finns många slag av tidningar och tidskrifter: Dagliga nyhetstidningar, veckomagasin, vetenskapliga tidskrifter, årsböcker. Några har större likheter med böcker, dagstidningarna är de som skiljer ut sig mest.
  • Varje nummer av en tidning innehåller många slags innehåll: Nyhetsrapporter, politiska ledarartiklar, kåserier, väderrapporter, börskurser, följetonger, annonser, offentliga tillkännagivanden. Det enda de har gemensamt är dagen de publicerades. För att följa ett ämne under dess utveckling (till exempel ett krig) måste många små delar plockas ihop från olika nummer över en lång tid.
  • Upphovsrättslagen är densamma för tidningar som för böcker. Men upphovsrättsintrången har en annan karaktär. Piratkopiering av äldre dagstidningar har aldrig varit ett problem, eftersom det är försäljningen av nya tidningar som är intressant för branschen. Därför saknas rättsfall som ger vägledning om hur 70-årsregeln ska tillämpas. Det är i praktiken omöjligt att utreda om alla medförfattare har dött för mer än 70 år sedan. En tänkbar lagtolkning (som tillämpas i Projekt Runeberg) är att tidningar med många medförfattare är anonyma verk, som blir fria från upphovsrätt 70 år efter utgivningsåret. Men denna tolkning är inte tillämpbar på Wikimedia Foundations servrar. Av tradition har dagstidningar alltid återgett varandras aktuella nyheter i översatt och lätt omskriven form.

Tidigare erfarenheter

redigera

Kungliga biblioteket

redigera

Kungliga biblioteket var ett av fjorton nationalbibliotek som 2006-2008 deltog i det EU-finansierade TelPlus-projektet. KB deltog dock bara i det första delprojektet WP1 - OCRing previously digitized material. För detta OCR-tolkade KB inscannade mikrofilmer av 200.000 sidor ur 24 dagstidningar, som man nu hittar under rubriken digitaliserade svenska dagstningar. Det är fritt att kopiera detta innehåll. Bortsett från Post- och Inrikes Tidningar är det dock bara mindre landsortstidningar från 1800-talet. De större svenska dagstidningarna finns på mikrofilm som är av äldre datum och har sämre kvalitet. För att få någorlunda bildkvalitet, valde KB i stället mindre landsortstidningar som hade mikrofilmats senare. KB har inte arbetat med korrekturläsning eller strukturering av innehållet.