Mit ‘Archiv’ verschlagwortete Einträge

h1

Probleme von MyLifeBits

April 21, 2008

Gordon Bells Archiv umfasst bereits 160 Gigabyte an Daten, von denen der grösste Anteil die Videodateien von rund 60 Gigabyte einnehmen. Gefolgt von über 100′000 E-Mails, 58′000 Fotos, 15′000 Word- und PDF-Dokumente und rund 100′000 Web-Seiten (Stand Juni 2007). (vgl. Artikel „Gedächtnis total“ S. 10)

Jedoch die grösste Herausforderung, vor welche MyLifeBits steht, ist nicht das Sammeln von Daten, sondern das Vernetzen, Ordnen und Wiederfinden des gesamten Archives. Bells Archiv weist die gleichen Schwachpunkte auf wie seiner Zeit in der DDR die gigantischen Aktenberge, welche von der Stasi über beinahe jeden Bürger angelegt wurden. (vgl. Artikel „Gedächtnis total“ S. 10)
„Als Bell im Jahr 2001 begann, waren die Suchmaschinen für Desktop-PCs noch sehr unhandlich. Deshalb entwarfen sie eine Datenbank, die nicht nur die Möglichkeit zur Volltextsuche innerhalb unserer PCs bietet (was inzwischen schon zur Standardausstattung gehört), sondern digitalisierte Erinnerungen auch über Zusatzinformationen auffindet, beispielsweise Datum, Ort und Gegenstand eines Fotos oder schriftliche oder gesprochene Kommentare, die der Datei beigefügt sind. Diese Metadaten sind häufig entscheidend; so findet man vielleicht eine bestimmte E-Mail nur wieder, weil man weiß, dass man sie irgendwann im Frühjahr verschickt hat.“ (Artikel „Erinnerung total“ S. 92)
Menschen organisieren Erinnerung entlang von Daten und Namen. Lifelogging versucht, vom Gehirn zu lernen. Das heisst, das Vernetzen und Ordnen der gespeicherten Daten basiert auf dem gleichen Prinzip, wie unser Gehirn Informationen speichert und wieder abruft. Erschwert wird die Suche von der Blindheit des Rechners: Computer können Bilder nicht „sehen“, wie sie Daten erkennen. Zudem sollen vorallem Sprach- und Gesichtserkennungssysteme zum Einsatz kommen um die Metadaten von Audiodateien, Bilder oder Videodateien automatisch setzen zu können, ohne dass diese noch mühsam bearbeitet werden müssen. Das System erkennt aufgrund der entsprechenden Software die Gesichter und die Stimmen und vernetzt diese Dateien dann mit bereits bestehenden Daten im Archiv. MyLifeBits arbeitet noch mit Hilfe von Dateneckpunkten, die anhand von Zeitstempel und Entstehungsort das Gewünschte identifizieren. Doch bei einer gezielten Suche hilft das nicht immer. Gemmell setzt deshalb auf intelligente Software (Künstliche Intelligenz), die den Inhalt von Dateien analysieren kann. (vgl. Artikel „Erinnerung total“ S. 92)
„Es wird auch schwierig sein sicherzustellen, dass man noch nach Jahrzenten Zugriff auf seine Aufzeichnungen hat. In der Vergangenheit sind schon mehrfach Daten unzugänglich geworden, weil deren Formate veraltet waren. Man wird immer wieder in die Verlegenheit kommen, seine Daten in die jeweils aktuellen Formate umwandeln zu lassen, oder sogar Imitationen alter Programme auf neueren Geräten laufen zu lassen (Emulation), um die Daten verfügbar zu halten. Vermutlich wird eigens dafür eine Branche entstehen.“ (Artikel „Erinnerung total“ S. 92)
Das Problem der Archivierung von digitalen Daten entstand nicht erst durch das Vorhaben von Gordon Bell und seinem digitalisierten Leben. Schon bei der herkömmlichen Archivierung ist die Problematik der Formateveraltung schon seit dem Aufkommen von digitalen Daten bekannt. Eine allgemeine Lösung existiert bis zu diesem Zeitpunkt noch nicht. Momentan werden auf zwei Ansätze gesetzt: Zum Einen werden die Daten angepasst an die neuen Formate oder es werden zu den Daten auch die entsprechenden Hardwarekomponenten aufbewahrt um diese verfügbar zu halten. Beide Methoden sind nicht optimal, da diese zum Teil mit sehr grossem Aufwand verbunden sind und zudem auch umständlich. Gehofft wird nun auf neue Technologien, welche die Umwandlung in die neuen Formate automatisch vornimmt. Am meisten wird hier sicher auf die Künstliche Intelligenz gesetzt, die dies zukünftig ermöglichen soll. Dies wird aber sicher noch einige Jahre dauern, bis eine solche Umsetzung möglich sein wird.

Gordon Bell im Datenhaufen

Quellen:

Bild http://www.kk.org/thetechnium/gordon_bell1-tm.jpg

DIE WELT, No. 146/2007. (26 June 2007), pp. 10-10.
by Uwe Schmitt
Spektrum der Wissenschaft, No. Mai 2007. (May 2007), pp. 84-92.
by Gordon Bell, Jim Gemmell