
Probleme von MyLifeBits
April 21, 2008Gordon Bells Archiv umfasst bereits 160 Gigabyte an Daten, von denen der grösste Anteil die Videodateien von rund 60 Gigabyte einnehmen. Gefolgt von über 100′000 E-Mails, 58′000 Fotos, 15′000 Word- und PDF-Dokumente und rund 100′000 Web-Seiten (Stand Juni 2007). (vgl. Artikel „Gedächtnis total“ S. 10)
Jedoch die grösste Herausforderung, vor welche MyLifeBits steht, ist nicht das Sammeln von Daten, sondern das Vernetzen, Ordnen und Wiederfinden des gesamten Archives. Bells Archiv weist die gleichen Schwachpunkte auf wie seiner Zeit in der DDR die gigantischen Aktenberge, welche von der Stasi über beinahe jeden Bürger angelegt wurden. (vgl. Artikel „Gedächtnis total“ S. 10)
„Als Bell im Jahr 2001 begann, waren die Suchmaschinen für Desktop-PCs noch sehr unhandlich. Deshalb entwarfen sie eine Datenbank, die nicht nur die Möglichkeit zur Volltextsuche innerhalb unserer PCs bietet (was inzwischen schon zur Standardausstattung gehört), sondern digitalisierte Erinnerungen auch über Zusatzinformationen auffindet, beispielsweise Datum, Ort und Gegenstand eines Fotos oder schriftliche oder gesprochene Kommentare, die der Datei beigefügt sind. Diese Metadaten sind häufig entscheidend; so findet man vielleicht eine bestimmte E-Mail nur wieder, weil man weiß, dass man sie irgendwann im Frühjahr verschickt hat.“ (Artikel „Erinnerung total“ S. 92)
Menschen organisieren Erinnerung entlang von Daten und Namen. Lifelogging versucht, vom Gehirn zu lernen. Das heisst, das Vernetzen und Ordnen der gespeicherten Daten basiert auf dem gleichen Prinzip, wie unser Gehirn Informationen speichert und wieder abruft. Erschwert wird die Suche von der Blindheit des Rechners: Computer können Bilder nicht „sehen“, wie sie Daten erkennen. Zudem sollen vorallem Sprach- und Gesichtserkennungssysteme zum Einsatz kommen um die Metadaten von Audiodateien, Bilder oder Videodateien automatisch setzen zu können, ohne dass diese noch mühsam bearbeitet werden müssen. Das System erkennt aufgrund der entsprechenden Software die Gesichter und die Stimmen und vernetzt diese Dateien dann mit bereits bestehenden Daten im Archiv. MyLifeBits arbeitet noch mit Hilfe von Dateneckpunkten, die anhand von Zeitstempel und Entstehungsort das Gewünschte identifizieren. Doch bei einer gezielten Suche hilft das nicht immer. Gemmell setzt deshalb auf intelligente Software (Künstliche Intelligenz), die den Inhalt von Dateien analysieren kann. (vgl. Artikel „Erinnerung total“ S. 92)
„Es wird auch schwierig sein sicherzustellen, dass man noch nach Jahrzenten Zugriff auf seine Aufzeichnungen hat. In der Vergangenheit sind schon mehrfach Daten unzugänglich geworden, weil deren Formate veraltet waren. Man wird immer wieder in die Verlegenheit kommen, seine Daten in die jeweils aktuellen Formate umwandeln zu lassen, oder sogar Imitationen alter Programme auf neueren Geräten laufen zu lassen (Emulation), um die Daten verfügbar zu halten. Vermutlich wird eigens dafür eine Branche entstehen.“ (Artikel „Erinnerung total“ S. 92)
Das Problem der Archivierung von digitalen Daten entstand nicht erst durch das Vorhaben von Gordon Bell und seinem digitalisierten Leben. Schon bei der herkömmlichen Archivierung ist die Problematik der Formateveraltung schon seit dem Aufkommen von digitalen Daten bekannt. Eine allgemeine Lösung existiert bis zu diesem Zeitpunkt noch nicht. Momentan werden auf zwei Ansätze gesetzt: Zum Einen werden die Daten angepasst an die neuen Formate oder es werden zu den Daten auch die entsprechenden Hardwarekomponenten aufbewahrt um diese verfügbar zu halten. Beide Methoden sind nicht optimal, da diese zum Teil mit sehr grossem Aufwand verbunden sind und zudem auch umständlich. Gehofft wird nun auf neue Technologien, welche die Umwandlung in die neuen Formate automatisch vornimmt. Am meisten wird hier sicher auf die Künstliche Intelligenz gesetzt, die dies zukünftig ermöglichen soll. Dies wird aber sicher noch einige Jahre dauern, bis eine solche Umsetzung möglich sein wird.

Quellen:
Bild http://www.kk.org/thetechnium/gordon_bell1-tm.jpg
Je grösser die Datenmenge desto schwieriger das Auffinden von relevanten Informationen. Während Gordon Bell sich darum sorgt, die Datenflut mit Hilfe von Metadaten zu strukturieren, beschreitet Marcel Kotzur den anderen Weg. Seit er, aufgrund von Kontakten zu G8-kritischen Gruppierungen, vom deutschen Verfassungsschutz observiert wird, streamt er sein komplettes Leben ins Web. Seine Überwachungsshow „TruemanTV“ verkörpert seine These: Selbstüberwachung ist der beste Schutz vor Observation. Denn, wenn alles zu sehen ist, ist eigentlich nichts mehr sichtbar.
Dies mag verblüffen, scheint im Fall von Kotzur aber aufzugehen. Schliesslich ist sein Leben durch die staatliche Observation ja sowieso nicht mehr privat sondern zumindest semi-publik.
Quelle: http://www.spiegel.de/netzwelt/web/0,1518,542734,00.html (interessant finde ich v.a. folgenden Gedanken: „Spasseshalber stelle ich mir vor: Alle 82 Millionen Einwohner Deutschlands präsentieren sich live und nonstop im Netz. Die Vorratsdatenspeicherung wäre überflüssig, der Kontrollapparat würde zusammenbrechen – das Internet auch.“)