In Zeiten von Corona ist „Digitalisierung“ von Schulen, Arbeitsplatz oder Gesundheitssystem ein großes Schlagwort – als weit gefasster Oberbegriff für den digitalen Wandel der Gesellschaft, den Übergang von den analogen Werkzeugen und Prozessen des Industriezeitalters in eine neue Ära, die in allen Bereichen von der Bildung bis hin zur Wirtschaft, von der Kultur bis hin zur Verwaltung, von digitalen Technologien geprägt ist.

In der Archivwelt hat „Digitalisierung“ dagegen (auch) eine sehr viel konkretere Bedeutung: das „Umwandeln von analogen Werten in digitale Formate und ihre Verarbeitung oder Speicherung in einem digitaltechnischen System“[1].

Digitalisierung (Beispielbild)

In der Praxis bedeutet das in der Regel, Archiv- und Sammlungsgut, das in seiner ursprünglichen Form analog vorliegt – Papierdokumente, Fotonegative- und Abzüge, Poster, gedruckte Broschüren oder ähnliches „physisches“ Material – einzuscannen und die Scandateien in digitalen Systemen zu speichern, zu verwalten für die Nutzung bereitzustellen.

Digitalisiert wird im Archiv, wenn das Originalmaterial beschädigt ist oder durch wiederholtes Ausheben im Magazin und die Nutzung im Leseraum Schäden drohen, z.B. wenn das Papier eines Briefes brüchig geworden ist und die Tinte verblasst oder sich bei einem Foto die empfindliche Bildschicht abzulösen beginnt. Man spricht von Schutzdigitalisierung oder – wenn das Original langfristig nicht zu retten ist – auch von Ersatzdigitalisierung. Digitalisierung ist hier die Nachfolgetechnologie zur seit langem eingesetzten Schutzverfilmung, der manchmal auch rein vorsorglichen Sicherung von Dokumenten in Form von Mikrofilm oder Mikrofiche.

Neue Ziele der Digitalisierung im Archiv

Aber Digitalisierung findet auch – und zunehmend – statt, um Archivmaterial besser zugänglich zu machen. Einzelne Archivalien oder ganze Bestände und Sammlungen werden dabei in digitale Dateien umgewandelt. Diese können dann entweder auf Anfrage für Nutzer*innen in aller Welt digital verschickt oder gleich online bereitgestellt werden. Die Vorteile liegen auf der Hand: der Zugang zu Archiven erfordert keine zeitaufwändigen und teuren Archivreisen mehr, die Nutzung ist unabhängig von Archivöffnungszeiten oder Leseplatzreservierungen, Archivalien können in Dateiform auch von den Nutzer*innen nach individuellen Forschungsfragen organisiert und z.B. per Texterkennung auf Schlagworte durchsucht werden.
Der Zugang zu Archiven, Wissen, Kulturgut wird, insbesondere durch komplett online verfügbare digitale Sammlungen, vereinfacht und in vielerlei Hinsicht demokratisiert; dazu tun sich neue Forschungsmöglichkeiten und -methoden auf, Stichwort „digital humanities“. Eigentlich der Idealzustand, könne man meinen, nicht nur in Corona-Zeiten, in denen viele Archive – auch wir am HIS – aus Infektionsschutzgründen die Leseräume schließen müssen und dadurch der traditionelle Zugang zu Archivmaterial manchmal über Monate unmöglich wird.

Da stellt sich doch die Frage:

„Warum digitalisieren Archive ihre Bestände nicht komplett, und stellen alles online?“

Bei dem Versuch einer Antwort kommen wir Archivar*innen uns manchmal als Spielverderber*innen vor.
Vorweg: Wenn es nach uns ginge, wäre natürlich alles online verfügbar, durchsuchbar, downloadbar – auch wir wünschen uns nichts mehr, als dass unsere „Schätze“ möglichst einfach, vielfältig und kreativ genutzt werden können. Kulturgüter nicht nur zu sammeln und zu erhalten, sondern sie auch so weit wie nur möglich zugänglich zu machen, ist unser Job. Nur:

Es ist nicht so einfach. Denn…

…Digitalisierung ist aufwändig und kostet sehr (sehr) viel Geld

Plakat auf Ausichtscanner
Der Aufsichtscanner im HIS-Archiv
im Einsatz bei der Digitalisierung von Plakaten.

Eigentlich verdient er täglich einen Orden, ein Dankesgebet oder zumindest ausgiebige Streicheleinheiten: Der Aufsichtsscanner im HIS. Dieses Wunder der Technik macht das Scannen so viel einfacher: Dokument auflegen, gewünschtes Dateiformat auswählen, ein „Klick“ mit dem Fußschalter, schon ist der Scan fertig auf USB-Stick gespeichert, wahlweise auch automatisch zugschnitten, begradigt, und gedreht. Umblättern, und „Klick“ für den nächster Scan. Damit ist zum Beispiel eine Broschüre innerhalb einiger Minuten digitalisiert.

Die resultierenden Dateien müssen dann nur noch vom Speicherstick aufs Archivlaufwerk kopiert, und dort mit einem eindeutigen Namen versehen (entsprechend der analogen Archivsignatur) an der richtigen Stelle (entsprechend der analogen Systematik) gespeichert werden. Auch das dauert nur wenige Minuten. Dann noch ein kurzer Arbeitsgang, um die abgelegte Datei mit der Online-Datenbank zu verknüpfen. Fertig! Die Broschüre, eben noch aus der Archivbox geholt, ist nun im Netz such- und durchsuchbar.

Schon an diesem Beispiel wird deutlich, dass der Digitalisierungsprozess trotz aller moderner Technik mit einigem Aufwand verbunden ist. Einige Minuten hier, einige Klicks da – selbst bei einer Broschüre von sagen wir, 48 Seiten, summiert sich die Zeit auf, alles in allem, 10-15 Minuten. Nun rechnen wir hoch: Die Broschürensammlung im HIS-Archiv umfasst rd. 4.500 Broschüren, was, grob überschlagen, 1000 Arbeitsstunden für die Komplett-Digitalisierung entspräche (oder 25 Vollzeit-Arbeitswochen). Oder, als weiteres Beispiel, ein Aktenordner voller Briefe, der, nach vorsichtiger Schätzung, 500 Blatt enthält. Davon sind viele beidseitig beschrieben, macht 700-800 Scans, um den kompletten Inhalt zu erfassen. Jeder Scan dauert nur ein paar Sekunden, aber von diesen Aktenordnern passen 12-13 Stück auf einen Regalmeter, und Beispielbestand X hat 62 Regalmeter… Kurz: Es summiert sich gewaltig.

Erschwerend kommt hinzu, dass Arbeitsprozesse bei der Digitalisierung von Archivgut nur in begrenztem Maße automatisiert werden können. Selten liegen die zu scannenden Dokumente in einem einheitlichen Format vor, oft sind Originale empfindlich, was z.B.  das automatische Scannen von Dokumentenstapeln per Einzelblatteinzug ausschließen würde. Das Digitalisieren von Bildmaterialien, insbesondere von Fotonegativen oder Dias, bedarf besonders viel Handarbeit, da u.a. Farbwerte und Bildschärfe individuell eingestellt und korrigiert werden müssen.
Dieser Aufwand erklärt auch, warum Digitalisierung als Dienstleistung recht teuer ist. Selbst wenn pro Seite oder pro Bild nur ein Centbetrag fällig wird, so summieren sich die Kosten für extern vergebene Scanaufträge in einem mittelgroßen Digitalisierungsprojekt schnell auf fünf- oder gar sechsstellige Beträge.

Die Vorteile von Digitalisierung für Bestandserhaltung und Zugang zu Archivgut, aber auch die hohen Kosten für die Umsetzung sind weithin bekannt, weshalb es eine ganze Reihe von Förderprogrammen und Drittmitteltöpfen für Digitalisierungsprojekte gibt. Allerdings stellen die Förderbedingungen für kleine, oftmals prekär finanzierte Archive – ganz besonders eben für solche Archive und Dokumentationsstellen, die als „Freie Archive“ alternative Überlieferungen zu den etablierten staatlichen und wissenschaftlichen Archiven bilden – häufig unüberwindbare Hürden dar. Kriterien wie eine öffentlich-rechtliche Trägerschaft des antragstellenden Archivs, das Einbringen hoher Vor- und Eigenleitungen, oder das Vorhandensein langfristiger Personal- und Infrastrukturen [2] schließen leider allzu oft ambitionierte Digitalisierungsvorhaben aus „nicht-traditionellen“ Archiven von Vornherein von der Förderung aus.

…digital(isiert)e Bestände sind anspruchsvoll

Nun sind die Archivalien gescannt, die Scandateien ordnungsgemäß benannt und abgelegt, die Datenbankverknüpfung steht. Prima, dann ist alles fertig, oder?
Ja – erstmal, also für die nächsten Wochen und Monate, vielleicht ein paar Jahre. Doch Archive funktionieren nur langfristig, sie bewahren ihre Schätze idealerweise für die Ewigkeit. Oder zumindest für hunderte von Jahren. Pergament und Papier machen da, bei entsprechenden Lagerungsbedingungen und vorsichtigem Umgang, ggf. Stabilisierungs- und Restaurierungmaßnahmen, noch relativ tapfer mit. Die älteste Pergamenturkunde im Hamburger Staatsarchiv ist z.B. von 1140 [3] und im Original auch nach 880 Jahren (vorausgesetzt man kann  die mittelalterliche Handschrift entziffern und den Text aus dem Lateinischen übersetzen) noch ohne technische Hilfsmittel lesbar.

Aber eine digitale Datei, deren Inhalt nach fast 900 Jahren noch lesbar ist?  – Schon 20 oder 30 Jahre alte Dateien machen da Probleme!

Das fängt an bei Datenträgern, für die es keine Lesegeräte mehr gibt, wie 3,5“-Disketten, die in den 1990er Jahren Stand der Technik waren, bevor um die Jahrtausendwende kurzzeitig ZIP-Disketten, dann CD-ROMs zu „dem“ Datenträgerformat wurden. Aber ein Disketten- oder ZIP-Laufwerk, wer hat das heute noch? Selbst CD- oder DVD-Laufwerke gehören schon länger nicht mehr zum Standard bei neuen PCs oder Laptops.

3,5 Zoll Diskette und ZIP-Datenträger
Eben noch Stand der Technik - jetzt schon obsolet:
Speichermedien der 1990er und 2000er Jahre.

Weiter geht es bei überholten Dateiformaten. Wer kennt sie nicht, die Word 95-Dateien, die sich mit etwas Glück noch öffnen lassen, dann aber nur kryptische Buchstaben- und Symbolreihen anzeigen, oder einen Text, bei dem jegliche Formatierungen und Sonderzeichen verloren gegangen sind? Und letztlich: „bit rot“, der physische Zerfall von digitalen Datenträgern, der z.B. die Trägerschicht von magnetischen oder optischen Speichermedien zerstört.

Also sind digitale Daten keineswegs sicher für die Ewigkeit. Sie müssen vielmehr im Rahmen der digitalen Bestandserhaltung aktiv gepflegt werden, zum Beispiel, indem Datenträger und Dateiformate regelmäßig auf ihre Lesbarkeit überprüft und ggf. umkopiert und in aktuelle Formate umgewandelt werden – natürlich unter der Maßgabe, dass der originale Inhalt dabei unverändert bleibt.
Dafür dass, z.B. ein digitales Bild in 100 Jahren noch genauso aussieht wie heute, bedarf es nicht nur einer geeigneten technischen Infrastruktur, sondern auch eines langfristig angelegten Konzept der digitalen Bestandserhaltung, das strategische Überlegungen (Welche Ablagestruktur, welche Dateiformate sind geeignet?) genauso einschließt, wie die Planung und kontinuierlichen Umsetzung von entsprechenden Arbeitsabläufen. Dies gilt für Dokumente und Bilder, die bereits digital entstanden sind, genauso wie eben für Materialien, die erst nach ihrer Digitalisierung in Dateiform vorliegen.

Die „Folgekosten“ der Digitalisierung sind enorm. Schon nach wenigen Jahren können, nach Berechnungen der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder (KLA), die laufen Kosten allein für die Speicherung der Digitalisate die einmalig angefallenen Kosten für die Digitalisierung übersteigen [4]. Planungs- und Personalkosten für die digitale Bestandserhaltung sind hier noch gar nicht einbezogen.
So mag das ursprüngliche Digitalisierungsprojekt noch durch Eigenmittel oder Fördergelder realisierbar sein. Aber die digitale Langzeitarchivierung erfordert dann kontinuierlich Ressourcen, die kleine Archive, deren Gesamtfinanzierung vielleicht nur für wenige Jahre gesichert ist, nur mit großen Schwierigkeiten aufbringen können.

…es gibt rechtliche Fragen zu klären

Selbst wenn die technischen Fragen der Digitalisierung gelöst sind, also Digitalisate vorliegen UND für deren langfristige Erhaltung gesorgt ist – die rechtlichen Fragen, die im Zusammenhang mit der Vervielfältigung und Veröffentlichung von Archivmaterialien stehen, und damit auch großen Einfluss auf Digitalisierungsprojekte haben, stehen noch aus: Datenschutz und Urheberrecht.
Dazu – auch aus gegebenem Anlass, nämlich der Diskussion um die Umsetzung der europäischen „Digital Single Market“-Richtlinie [5] in deutsches Urheberrecht und die Konsequenzen für Archive – später mehr an dieser Stelle.

Einstweilen:

Sehen Sie es uns Archivar*innen nach, wenn wir auf die Frage nach komplett digitalisierten Beständen [6] mit einem Stoßseufzer antworten. Wir würden der Bitte gerne nachkommen, wirklich. Und wir arbeiten daran, so gut wir können. Aber es ist eben nicht so einfach.

(SK)

Ein wenig mit Münzen gefülltes Glas mit der Beschriftung "swear jar" und ein fast volles Glas mit der Beschriftung "every time a researcher asks me why we don't digitize everything and make it available online"
Manchmal muss es eben ein Meme sein...
Mit Dank an @ArchivesAreCool auf Twitter

[1] https://de.wikipedia.org/wiki/Digitalisierung, abgerufen 06.12.2020.

[2] Beispielhaft für Förderprogramm mit hohen Zugangshürden: Das neue Förderprogramm „Digitalisierung und Erschließung“ der DFG. Merkblatt Digitalisierung und Erschließung, DFG-Vordruck 12.15 – 08/20. https://www.dfg.de/formulare/12_15/12_15_de.pdf, abgerufen 11.12.2020.

[3] Pergamenturkunde um 1140, Älteste Urkunde des Staatsarchivs Hamburg. https://www.hamburg.de/bkm/oeffentlichkeitsarbeit/13901122/aelteste-urkunde/, abgerufen 06.12.2020. Es handelt sich um eine Urkunde, in der Adalbero, Erzbischof von Hamburg-Bremen, dem von ihm wiederhergestellten Domkapitel zu Hamburg gewisse Besitztümer und „Steuerrechte“ (Zehnten) verleiht. 710-1 I Qq 1; HUB 1, Nr. 162.

[4] Wirtschaftliche Digitalisierung in Archiven, Empfehlungen der Konferenz der Leiterinnen und Leiter der Archivverwaltungen des Bundes und der Länder (KLA). Ausgearbeitet vom Fototechnischen Ausschuss der KLA (2015/2016). https://www.bundesarchiv.de/DE/Content/Downloads/KLA/wirtschaftliche-digitalisierung.pdf?__blob=publicationFile, abgerufen am 10.12.2020.
Natürlich sind die Speicherkosten pro Terrabyte in den vergangenen fünf Jahren gesunken, doch das Grundproblem der langfristige Speicherkosten für Digitalisate bleibt.

[5] Offizielle Bezeichnung: Richtlinie über das Urheberrecht und die verwandten Schutzrechte im digitalen Binnenmarkt DSM-RL (EU) 2019/790.

[6] Diese Frage wird gelegentlich verbunden mit dem Vorschlag: “Dann könnte man die Originale danach sogar entsorgen und damit die Kosten für Lagerung und Erhaltung von tonnenweise Papier sparen”. Dies ist ein geeigneter Satz, um Archivar*innen an den Rand eines Nervenzusammenbruchs oder Sie an Beginn eines langen Vortrags zu bringen – probieren Sie es lieber nicht aus.