Bild

Data Privacy and Security Group

Uni Leipzig | Computer Science | ScaDS.AI
Bild
Profile Teaching Theses Team Deutsch

Our Profile

 

Ecole polytechnique, Creative Commons Attribution-ShareAlike 2.0 Generic

Data protection is about finding a balance between the fundamental right to privacy and the increasingly extensive collection of personal data. The goal of information and cyber security is to protect data, services or IT systems from cyber attacks and other threats using technical and organizational measures.

Data analysis approaches, technical and organizational protection measures, societal needs, and economic requirements are in a complex relationship. Typical examples are Internet-of-Things applications where devices send sensor data to the cloud. The cloud manages this data by using Big Data techniques. The sensor data is then analyzed using machine learning or AI, and is used to steer smart city or smart home components eventually. Our concern is to achieve a meaningful level of data protection and security in such scenarios. To this end, our teaching and research covers a wide range of topics, from data analysis approaches over protective measures to compliance frameworks. We research the use of machine learning techniques for learning firewall rules or intrusion detection systems, as well as for de-anonymizing sensor data. We evaluate to which extent machine learning algorithms can be used, when data is in an anonymized form, has a reduced data quality or is stored in a distributed manner in the cloud. We are also interested in workflow privacy patterns, which provide technical or organizational measures for data protection as templates for business processes. At the compliance level, we strive for approaches that mitigate the security risk for the user or the risk of an encroachment on fundamental rights for the persons concerned. Finally, we want to find out whether such approaches conflict with other measures.

How to find us

Teaching in the Summer Term 2023

 

Wenn Sie sich für eines der Module angemeldet haben, aber in der ersten Vorlesungsstunde nicht anwesend sein können, melden Sie sich bitte bei uns! Nicht in Anspruch genommene Plätze werden vom Studienbüro an Nachrücker vergeben.

Compact data privacy from anonymization to purpose limitation (in Geman)

Belegbarkeit: Vertiefungsmodul im M.Sc. Informatik, Bereich Skalierbares Datenmanagement im M.Sc. Data Science
Dozenten: Erik Buchmann
Modulprüfung: Klausur 60 Minuten
Teilnahmevoraussetzungen: keine (Anmeldepflicht!)

Das Modul besteht aus einer Vorlesung (2 SWS) und einer Übung (1 SWS) und wird mit 5 LP verrechnet. Die Übung findet in Gruppen statt. Die Lehrmaterialien werden rechtzeitig über einen zugehörigen Moodle-Kurs bereitgestellt.

Inhalt der Vorlesung:

  • gesellschaftliche, technische und wirtschaftliche Ziele des Datenschutzes
  • Anonymisierungsverfahren und Anonymitätsmaße
  • grundlegende Datenschutzlösungen auf unterschiedlichen technischen und organisatorischen Ebenen
  • angewandte Verfahren zum Datenschutz im Internet und im Smart Home
Inhalt der Übung:
  • Vertiefung der Konzepte aus der Vorlesung an praktischen Beispielen

Die Lehrmaterialien für Vorlesung und Übung finden Sie im zugehörigen Moodle-Kurs.

Ort und Zeit:
Die Vorlesung findet ab 06.04.2023 jeden Donnerstag 15:15-16:45 Uhr im HS19 statt.
Die Übungen finden ab 14.04.2023 jeweils Freitags von 11:15-12:45 Uhr im SG 2-14. Es wird zwei Übungsgruppen geben, die jeweils im Wechsel alle 2 Wochen eine Übung durchführen.


Data privacy from anonymization to purpose limitation (in Geman)

Belegbarkeit: Vertiefungsmodul im M.Sc. Informatik, Bereich Skalierbares Datenmanagement im M.Sc. Data Science
Dozenten: Erik Buchmann, Anika Hannemann
Modulprüfung: Klausur 60 Minuten und Referat 20 Minuten
Teilnahmevoraussetzungen: keine (Anmeldepflicht!)

Dieses Modul enthält die Vorlesungen und Übungen des Moduls "Datenschutz kompakt von Anonymisierung bis Zweckbindung", und bietet zusätzlich noch ein Seminar (2 SWS). Das Modul wird darum mit 10 LP verrechnet. Das Seminar findet in Gruppen statt. Die Themenvergabe wird am ersten Seminar-Termin am 04.04.2023 durchgeführt. Wenn Sie bei der Themenvergabe nicht anwesend sein können, melden Sie sich bitte bei uns!

Inhalt des Seminars:

  • Neue, komplexe Datenschutzprobleme und Datenschutzlösungen aus der Forschung verstehen und bewerten
  • Diese so aufbereiten und präsentieren, dass sie für Personen ohne Datenschutz-Fachwissen verständlich werden
  • Demonstration an einem selbst realisierten, praktischen Beispiel

Die Lehrmaterialien für das Seminar finden Sie im zugehörigen Moodle-Kurs.

Ort und Zeit:
Vorlesungen und Übungen siehe oben. Der erste Seminartermin ist Dienstag, der 04.04.2023.
Das Seminar der Gruppe A findet jeden Dienstag von 15:15 bis 16:45 Uhr im P-901 statt.
Das Seminar der Gruppe B findet jeden Dienstag von 17:15 bis 18:45 Uhr im P-901 statt.


Encrypted data management on private data (in German)

Modulnummer:10-INF-DS105
Belegbarkeit: Bereich Skalierbares Datenmanagement im M.Sc. Data Science
Dozenten: Erik Buchmann
Modulprüfung: Klausur 60 Minuten, Prüfungsvorleistung Referat 20 Minuten
Teilnahmevoraussetzungen: Teilnahme am Modul "Skalierbare Datenbanktechnologien 1" 10-INF-DS01 oder gleichwertige Kenntnisse (Anmeldepflicht!)

Das Modul besteht aus einer Vorlesung (2 SWS) und einem Seminar (1 SWS), und wird mit 5 LP verrechnet. Die Lehrmaterialien werden rechtzeitig über einen zugehörigen Moodle-Kurs bereitgestellt.

Inhalt der Vorlesung:

  • Auslagern von Datenbankinhalten, z.B. im Rahmen von Cloud-Lösungen, Containervirtualisierung oder Database-as-a-Service
  • spezifische Angreifermodelle und Einsatzszenarien
  • technische Schutzmaßnahmen wie verschlüsselte Indexe, Secure Multiparty Computation oder Homomorphic Encryption
  • alternative Systemmodelle wie die Blockchain
Inhalt des Seminars:
  • Anwendung der Kenntnisse der Vorlesung auf neuartige Schutzmaßnahmen
  • Bewertung neuartiger Einsatzszenarien/Technologien auf ihre Absicherbarkeit
  • Überzeugende Präsentationstechniken

Die Lehrmaterialien für Vorlesung und Seminar finden Sie im zugehörigen Moodle-Kurs.

Ort und Zeit:
Die Vorlesung findet ab 06.04.2023 jeden Donnerstag von 09:15 bis 10:45 am ScaDS.AI im Raum A03.07 statt.
Das Seminar findet jeweils Donnerstags von 13:15 bis 14:45 im selben Raum am ScaDS.AI statt. Die Themenvergabe für das Seminar wird am ersten Seminartermin durchgeführt. Der erste Seminartermin ist der 13.04.2023! Wenn Sie bei der Themenvergabe nicht anwesend sein können, melden Sie sich bitte bei uns!


Past semesters

Bachelor's and Master's Theses

 

In the following, we name a few prominent examples for Bachelor's and Master's theses, that are within our field of expertise and research. If you are interested in similar topics, please do not hesitate to get in touch with us!

Train AI/ML models with anonymous data

Machine learning uses data from the past to to learn data mining models or neural networks. Such models are supposed to classify new, unknown data in a meaningful way or to predict certain properties on new data. Even under normal conditions, it is challenging to evaluate the quality of machine learning models for new, unknown data sets. With anonymized or noisy data, this is even more difficult.
The focus of this topic is to study a machine learning use case, and to investigate the impact of privacy-enhancing technologies on the quality of the learned model.

Machine learning for smart-home firewalls

In smart-home installations, users with no knowledge of cybersecurity operate complex, networked IT devices. This is challenging, because potential security issues are not apparent to the user. For example, the Mirai botnet and its successors have been spreading via insecure IoT devices since 2016, unnoticed by their owners. In many cases, security loopholes were exploited that are actually very easy to fix, such as factory-default passwords or outdated software packages with known vulnerabilities.
With this topic, machine learning methods shall be developed that improve the security of a complex smart home installation for users without deep IT knowledge.

Risk analysis for IoT devices

Right now, Internet-of-Things (IoT) devices can be found everywhere in everyday life, from electric cars and smart TVs to washing machines and smart toothbrushes. This creates many new risks, e.g., new attack vectors over the Internet, the potential lack of firmware function updates in the future, or device failures at home due to the bankruptcy of a cloud provider abroad.
The objective of this topic is to create a complete catalog of all IoT-specific risks that can occur over the lifetime of an IoT device from a given device category.

Specification quality

Very often, security issues are the result of imprecise specifications or security standards. However, the BSI-Grundschutz compendium alone is already 900 pages long, which makes it challenging to identify misformulated specifications. With this topic, machine learning methods from the field of natural language text analysis shall be used to evaluate compliance documents such as privacy statements, security-critical RFC documents, and the like.
The goal of this topic is to develop and evaluate machine learning methods that help an auditor to find potentially misformulated specifications in the body of a very large set of compliance documents.

Team

 

Prof. Erik Buchmann
Prof. Erik Buchmann
Head of the group

Profile and Contact
ScaDS.AI
Raum D 03.10, Löhrs Carre
Humboldtstraße 25
04105 Leipzig
Claudia Götz
Claudia Götz
Secretary

Contact
ScaDS.AI
Raum D 03.12, Löhrs Carre
Humboldtstraße 25
04105 Leipzig
Anika Hannemann
Anika Hannemann
PhD Student

Contact
ScaDS.AI
Raum D 03.08, Löhrs Carre
Humboldtstraße 25
04105 Leipzig
Sabine Lorius
Sabine Lorius
Research Assistant

Contact
ScaDS.AI
Raum D 03.08, Löhrs Carre
Humboldtstraße 25
04105 Leipzig
Sabine Lorius
Victor Jüttner
Research Assistant

Contact
ScaDS.AI
Raum D 03.06, Löhrs Carre
Humboldtstraße 25
04105 Leipzig
Prof. Dr.-Ing. habil. Erik Buchmann: Email, Postal Address, How to find us