Infor­ma­ti­ker der Uni­ver­si­tät Bam­berg ent­wickeln lern­fä­hi­gen Assi­sten­ten zum intel­li­gen­ten Löschen von über­flüs­si­gen Datei­en

In Ver­wal­tun­gen von Unter­neh­men tür­men sich Datei­en über Datei­en. Es ist für Mit­ar­bei­te­rin­nen und Mit­ar­bei­ter mit­un­ter schwie­rig, in der Flut von Tabel­len, Prä­sen­ta­tio­nen und Tex­ten den Über­blick zu behal­ten. Außer­dem benö­tigt jede ein­zel­ne Datei Ener­gie und Spei­cher­platz auf einer Fest­plat­te – und ver­ur­sacht so Kosten für das Unter­neh­men und bela­stet die Umwelt. Was aber soll gelöscht wer­den? Wo fängt man am besten an? Infor­ma­ti­ke­rin­nen und Infor­ma­ti­ker der Uni­ver­si­tät Bam­berg arbei­ten der­zeit an einer auto­ma­ti­sier­ten Lösung: Sie ent­wickeln in dem inter­dis­zi­pli­nä­ren Pro­jekt „Dare2Del“ zusam­men mit der Arbeits­psy­cho­lo­gie an der Fried­rich-Alex­an­der-Uni­ver­si­tät Erlan­gen-Nürn­berg mit­tels maschi­nel­lem Ler­nen ein System, das hilft, irrele­van­te Daten zu löschen. Das Pro­jekt „Dare2Del“ läuft über sechs Jah­re und wird von der Deut­schen For­schungs­ge­mein­schaft (DFG) mit ins­ge­samt 889.702 Euro geför­dert. Es ist Teil des DFG Schwer­punkt­pro­gramms „Inten­tio­nal For­get­ting in Orga­ni­sa­tio­nen“.

In der ersten Pro­jekt­pha­se von 2016 bis 2019 pro­gram­mier­ten Dr. Ute Schmid, Pro­fes­so­rin für Ange­wand­te Infor­ma­tik, ins­bes. Kogni­ti­ve Syste­me, und ihr Mit­ar­bei­ter Micha­el Sie­bers ein lern­fä­hi­ges Modell, das zwar sehr kom­ple­xe Algo­rith­men ver­ar­bei­ten kann, für den Nut­zer aber trotz­dem leicht zu bedie­nen ist. Das System löscht Datei­en nicht wahl­los und schon gar nicht auto­ma­tisch: Die künst­li­che Intel­li­genz beach­tet Unter­neh­mens­vor­schrif­ten und recht­li­che Vor­ga­ben und passt sich den Wün­schen der Nut­ze­rin­nen und Nut­zer an. Sie kön­nen bei­spiels­wei­se Regeln fest­le­gen: Immer die letz­te und vor­letz­te Ver­si­on einer Datei sol­len behal­ten wer­den.

In der zwei­ten Pha­se geht es in den kom­men­den drei Jah­ren dar­um, die Vor­schlä­ge des Systems nach­voll­zieh­bar und trans­pa­rent für Anwen­de­rin­nen und Anwen­der zu machen. So soll das Pro­gramm bei­spiels­wei­se bestimm­te Benen­nun­gen der Datei­en her­vor­he­ben und durch einen Text erklä­ren, war­um die Datei zur Löschung vor­ge­schla­gen wird. „Unser Ziel ist es, eine part­ner­schaft­li­che Zusam­men­ar­beit von Mensch und Künst­li­cher Intel­li­genz zu ermög­li­chen“, sagt Ute Schmid. Eine beson­de­re Her­aus­for­de­rung für die Wis­sen­schaft­le­rin­nen und Wis­sen­schaft­ler ist dabei, her­aus­zu­fin­den, wann ein Nut­zer wel­che Inhal­te bear­bei­ten möch­te. Wer gera­de mit­ten in der Arbeit an einem Pro­jekt stecke, möch­te nicht gefragt wer­den, ob er eine Datei aus einem völ­lig ande­ren Kon­text noch braucht. Schmid erklärt: „Rand­zei­ten schei­nen geeig­net zu sein: Bei­spiels­wei­se wer­den am Ende jedes Arbeits­ta­ges fünf Datei­en abge­fragt, die aus dem Tages­kon­text stam­men.“

Die Psy­cho­lo­gin­nen Prof. Dr. Cor­ne­lia Nie­ssen und Kyra Göbel von der Fried­rich-Alex­an­der-Uni­ver­si­tät Erlan­gen-Nürn­berg zeig­ten, dass Per­so­nen wäh­rend der Arbeit sel­ten Datei­en löschen, nur, wenn sie unmit­tel­bar den Arbeits­ab­lauf behin­dern. Erklä­run­gen des lern­fä­hi­gen Systems sol­len hier die Bereit­schaft erhö­hen, Datei­en zu löschen, das Gedächt­nis zu ent­la­sten und sich bes­ser kon­zen­trie­ren zu kön­nen.

Ute Schmid erklärt, wel­che Vor­tei­le ein sol­cher Assi­stent für Unter­neh­men haben könn­te, wenn er nach dem Ende der For­schung auf dem Markt ein­ge­führt wird: „Digi­ta­le Daten, die über­flüs­sig gewor­den sind, erschwe­ren die Suche nach Infor­ma­tio­nen, ver­zö­gern Ent­schei­dun­gen und len­ken von eigent­lich anste­hen­den Auf­ga­ben ab.“ Sinn­voll zu löschen, erhö­he die Arbeits­lei­stung. „Die Unter­neh­men spa­ren Kosten für die teu­re Spei­che­rung der Daten in Clouds. Außer­dem wird weni­ger Ener­gie benö­tigt, um Daten zu spei­chern, und weni­ger Roh­stof­fe ver­braucht, um Fest­plat­ten her­zu­stel­len.“