En infrastruktur för att migrera föråldrad forskningsdata till läsbara format

En vän och kollega, Maria Simonsen, frågade mig häromsistens om jag har en VHS-spelare. Hon ville låna en VHS-spelare för att hon kommit över ett intressant material i detta format i sitt universitetshistoriska forskningsprojekt. (Nej, jag har ingen VHS-spelare.)

Nyligen såg jag i mitt Twitterflöde hur pedagogikforskaren Christian Lundahl efterfrågade en mikrokassettbandsplerare för att komma åt forskningsrådata.

Maria Simonsen och Christian Lundahl är förstås inte de enda humanister som stöter på det praktiska problemet: hur läser jag av rådata som finns på ett gammalt medium. Flera av oss har nog en del grejer liggande på fysiska bärare av data som det är en icke-trivial uppgift att läsa av.

Ett förslag till lösning: någonstans i arkiv- och forskningsbiblioteksvärlden (Riksarkivet eller KB, till exempel) inrättas ett nationellt centrum för avläsning av gamla medier. Där installeras och underhålls hårdvara av personal som kan det hela. Medier skickas dit av forskare, som efter en tid får tillbaka filer i standardformat. Det hela skulle utformas som ett slags service till forskarsamhället, där man kunde boka in sig för en migrering av data gratis.

Det hade inte ens behövt bli speciellt dyrt. En-två heltidstjänster + lite kringkostnader = fem miljoner om året.

Disketter 3.5″, floppies 5 1/4″ och 8″, VHS, mikrokassetter, vanliga kassetter, ljudinspelningar på rullband, digitala data på band (bandstationer var stora på 1970-talet), MiniDisc, Zipdrive …, ja det finns många obsoleta format. Hårdvara för att läsa av dessa borde fortfarande gå att få tag på med lite detektivarbete — men det kanske är omöjligt om några årtionden. Och det finns fortfarande teknisk personal som var med när det begav sig och kan hantera hårdvaran.

Det här inlägget postades i arkiv och har märkts med etiketterna , , , . Bokmärk permalänken.

1 svar på En infrastruktur för att migrera föråldrad forskningsdata till läsbara format

  1. Paul Schlyter skriver:

    Några fler gamla obsoleta dataformat var hålkorten och hålremsorna. Kanske också de små magnetkorten till de första programmerbara kalkylatorerna.

    Bland 5,25-tumsdisketterna fanns till en början en uppsjö av sinsemellan inkompatibla diskettformat. När IBM PC dök upp fungerade den efter en tid som en standard för hur diskettformaten skulle se ut, både fysiskt och logiskt. PC’ns FAT-format för den logiska organisationen av en disk används fortfarande på USB-minnen, SD-kort och liknande. Apple hade till en början sitt eget diskettformat (förstås), både på 3,5-tums och 5,25-tums disketter, och Apple-formatet var så eget att det krävdes speciell hårdvara för att kunna läsa det på andra datorer. Men så småningom bytte Apple sitt diskettformat från GCR till MFM (som alla andra då använde) på 3,5-tumsdisketterna till Macintoshdatorerna – en tid efteråt förekom en ”svekdebatt” om detta bland Macintosh-fans. Men det första format som var kompatibelt med både PC och Mac var faktiskt data-CD-skivorna.

    Bandstationerna, som var stora på 1970-talet, hade också en uppsjö olika bandformat, olika för olika typer av stordatorer. Det fanns band med 7 spår och band med 9 spår som förstås krävde olika bandstationer för att kunna läsas. Sedan hade olika band olika bit-tätheter. 400 bpi (bits-per-inch) och 800 bpi var vanliga tidiga bittätheter. Så småningom kom band med 6250 bpi som var den högrsta bit-tätheten jag hörde talas om.

    Kring år 2000 hade NASA ett projekt där de, så mycket som det gick, migrerade data från gamla rymdsonder på magnetband till modernare media. NASA stötte då på rent konkret fysiska problem: många gamla band gick fysiskt sönder när de försökte läsa dem. På andra band lossnade magnetskiktet från plastunderlaget så det blev en hög med stoft av magnetiskt material där bitarna låg hopblandade huller om buller, och det gick förstås inte att läsa. Så småningom lärde de sig hur de gamla magnetbanden skulle hanteras för att maximera chansen att de överlevde en läsning. De äldsta banden var från slutet av 1950-talet.

Lämna ett svar

Din e-postadress kommer inte publiceras.

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.