Textdaten und strukturierte Daten unterscheiden sich fundamental wenn es um Anonymisierung und Pseudonymisierung geht – technisch und datenschutzrechtlich. Bei Textdaten wie E-Mails, Schriftsätzen oder Freitextfeldern liegt die Hauptschwierigkeit darin, überhaupt zuverlässig zu erkennen, was pseudonymisiert werden muss: Namen, Orte, Organisationen, aber auch Telefonnummern, IBANs, Termine, seltene Ereignisse und indirekte Hinweise. Das geschieht typischerweise über Named Entity Recognition, manchmal ergänzt um […]