VAD

Speichern ist keine Langzeitarchivierung

/

/

Speichern ist keine Langzeitarchivierung
Creative Commons CC0

Das einfache Abspeichern von Forschungsdaten ist nicht vergleichbar mit dem Erhalt, der durch Langzeitarchivierung gewährleistet wird. Dank des neuen Bewusstseins für die Bedeutung von Forschungsdaten wird mittlerweile generell anerkannt, wie wichtig die Sicherung von Daten durch regelmäßiges Speichern an mehreren Orten sein kann (LOCKSS – Lots of Copies Keep Stuff Save). Doch Daten schlicht/einfach zu speichern, selbst mit mehreren Backups, ist nicht ausreichend, um das langfristige Überleben digitaler Objekte sicher zu stellen. Digitale Materialien, die einen immer größeren Anteil dessen ausmachen, was Menschen an Wissen und Kultur produzieren sind sehr fragil – man könnte sogar sagen, fragiler als physische Objekte.

 

Auch die Menge an Forschungsdaten, mit denen Institutionen täglich arbeiten, (insbesondere born digital-Daten, also solche, die digital erzeugt wurden) macht offensichtlich, dass einfache Speicherungs- und Backup-Verfahren nicht ausreichen, um einen langfristigen Zugang zu diesen Daten zu gewährleisten. Backups und das Speichern von mehreren Kopien sind zwar ein Teil der langfristigen Sicherung von Daten, aber wirkliche Langzeitarchivierung erfordert bei weitem mehr. Langzeitarchivierung ist ein Prozess, der es ermöglicht, die Nutzbarkeit von Daten trotz technologischer Veränderungen, die im Laufe der Zeit auftreten, zu erhalten. Hier werden verschiedene Aspekte des Langzeitarchivierungsprozesses vorgestellt:

 

  1. Speicher-Verfahren

Digitale Dateien und Medien können beschädigt werden – eine korrumpierte digitale Datei kann möglicherweise nicht mehr geöffnet werden. An dieser Stelle sind Backups hilfreich. Man sollte jedoch Backup-Software nicht blind vertrauen, sondern regelmäßig überprüfen, ob die wiederhergestellten Dateien mit den ursprünglich gespeicherten übereinstimmen. Und um zu überprüfen, ob die Dateien vollständig und inhaltlich identisch sind, können zum Beispiel Prüfsummen für die gespeicherten Dateien hilfreich sein.

 

  1. Dateiformate

Nicht nur der  Verfall und die Korrumpierung von Dateien gefährden digitale Materialien. Auch die technologische Landschaft verändert sich im Laufe der Zeit und es ändern sich beispielsweise Dateiformate. Wenn die aktuelle Software eine Datei nicht mehr öffnen kann, helfen auch keine mehrfachen Backups weiter. Bei der Langzeitarchivierung müssen Änderungen der Software und der Dateiformate berücksichtigt werden und Maßnahmen zur Behebung von Problemen ergriffen werden, bevor sie auftreten. So können beispielsweise die Identifizierung gefährdeter Dateiformate und deren Migrierung in weiter verbreitete Formate Teil eines professionellen Schutzprozesses sein.

 

  1. Metadaten

Metadaten sind wichtig um z.B. einen Forschungsdatensatz zu finden und in der Lage zu sein, in Katalogen oder Datenbanken nach ihm zu suchen. Es ist allerdings auch wichtig, dem Datensatz einen Kontext zu geben, denn ohne gute Metadaten kann die Bedeutung dieses Datensatzes verloren gehen. Wenn einen Forschungsdatensatz gespeichert wird, sind Informationen darüber, wer den Datensatz erstellt hat und zu welcher Forschung er gehört unabdinglich, sonst wird der Datensatz selbst möglicherweise unverständlich und nutzlos. Diese Informationen müssen so zeitnah wie möglich mit der Erstellung der Daten bereitgestellt werden.

 

Es ist nicht vorhersehbar, welche Forschungsdaten oder Materialien aus dem digitalen Kulturerbe in Zukunft verwendet werden können. Wer sie aber richtig verwaltet, macht die Wiederverwendung dieser Daten möglich und erhöht den Wert dieser Wiederverwendung.

 

Fazit:

Einfaches Speichern, auch an mehreren Orten, ist nicht mit Langzeitarchivierung vergleichbar, denn:

  • Dateien oder Speichermedien können beschädigt werden, was Datenverlust zur Folge hat.
  • Daten können unzugänglich werden, wenn sich Technologien und Software ändern.
  • Dateien benötigen Metadaten, damit sie wieder gefunden werden können.
  • Jede Art von Datei benötigt Metadaten (Themen, Titel, Autoren usw.) aus denen man ihren Kontext erkennen kann.

 

Überarbeitete Fassung von Natalie Harrower und Kathryn Cassidy am Digital Repository of Ireland.

 

Facebook
Twitter
LinkedIn
Email
Print