Using Printed Bar Codes to Link Physical Documents to Digital Files

Thema:
Using Printed Bar Codes to Link Physical Documents to Digital Files
Art:
BA
BetreuerIn:
Andreas Schmid
BearbeiterIn:
David Sinz
ErstgutachterIn:
Raphael Wimmer
Status:
abgeschlossen
Stichworte:
Physical-Digital, Drucker, Bar Code, Digitalisierung, Papier, Dokument
angelegt:
2020-04-23
Antrittsvortrag:
2020-06-22
Abgabe:
2020-08-24

Hintergrund

Das Drucken und Scannen von Dokumenten stellt einen Übergang zwischen physischer und digitaler „Welt“ dar, der mit einem Verlust von Informationen und Affordances verbunden ist. So kann beispielsweise ein gedrucktes PDF zwar jemandem überreicht werden, dadurch gewährt man aber nicht automatisch Zugriff auf die Originaldatei. Auch physische Veränderungen eines gedruckten Dokuments wirken sich nicht auf dessen digitale Form aus, obwohl dies beispielsweise beim Ausfüllen von Formularen oder dem Annotieren von Text gewünscht sein kann. Es existieren bereits zahlreiche Verfahren zum maschinellen Lesen von handschriftlich ausgefüllten Formularen, diese erfordern jedoch meist einen spezifischen Aufbau des Dokuments. Mit einem feinen Punktmuster bedrucktes Papier in Verbindung mit einem speziellen Stift, der dieses Muster lesen kann, ermöglicht bereits jetzt das automatische digitalisieren handschriftlicher Notizen [1]. Die dafür benötigte technische Infrastruktur reduziert allerdings die Praxistauglichkeit dieses Ansatzes.

Zielsetzung der Arbeit

Der Umfang dieser Arbeit kann so angepasst werden, dass sie als Bachelor- oder Masterarbeit bearbeitet werden kann

Durch das automatische Hinzufügen von IDs beim Druck von Dokumenten werden diese eindeutig identifizierbar. So kann beim Scannen des Dokuments wieder die Verbindung zur Originaldatei hergestellt werden. Eine solche Infrastruktur würde es erlauben, Unterschiede zwischen Original und Scan (z.B. Annotationen, ausgefüllte Formularfelder) zu erkennen, Besitzern eines gedruckten Dokuments Zugriff auf dessen Originaldatei zu geben und Metadaten zu Dokumenten zu sammeln.

In dieser Arbeit soll eine solche Infrastruktur prototypisch implementiert werden, indem gedruckten Dokumenten automatisch einzigartige IDs hinzugefügt werden. Es sollen mögliche Use Cases für eine solche Infrastruktur nutzerzentriert erhoben und Machbarkeitsanalysen für Anwendungen zu diesen Use Cases durchgeführt werden.

Konkrete Aufgaben

  • Aufbereiten des Themas (Literaturrecherche) (15%)
  • technischer Proof of Concept (10%)
  • Vorstudie: Anforderungserhebung (10%)
  • Implementierung (15%)
  • Erheben von Use Cases (15%)
  • Machbarkeitsanalyse der Use Cases (15%)
  • Vervollständigen der schriftlichen Ausarbeitung (20%)

Erwartete Vorkenntnisse

  • technisches Interesse
  • systematisches Arbeiten
  • Linux-Kenntnisse sind von Vorteil

Weiterführende Quellen

[1] Norrie, M. C., Signer, B., & Weibel, N. (2006). Print-n-link: Weaving the paper web. Proceedings of the 2006 ACM Symposium on Document Engineering, 34–43.