INTERNSHIP DETAILS

Masterarbeit: Aktuelle Backdoor Detektionsverfahren angreifen

CompanyFraunhofer-Gesellschaft
LocationDarmstadt
Work ModeOn Site
PostedMarch 29, 2026
Internship Information
Core Responsibilities
The role involves researching and implementing novel machine learning approaches to enhance the security of large language models. Additionally, the candidate will evaluate results critically and present findings in a project report.
Internship Type
full time
Company Size
286
Visa Sponsorship
No
Language
German
Working Hours
40 hours
Apply Now →

You'll be redirected to
the company's application page

About The Company
Fraunhofer IGD is the international leading institute for applied research in visual computing. Visual computing is image- and model-based information technology and includes computer graphics and computer vision, as well as virtual and augmented reality. In simple terms, the Fraunhofer researchers in Darmstadt, Rostock, and Kiel are turning information into images and extracting information from images. In cooperation with its partners, technical solutions and market-relevant products are created. Prototypes and integrated solutions are developed in accordance with customized requirements. In doing so, Fraunhofer IGD places users at the forefront, providing them with technical solutions to facilitate computer work and make it more efficient. Owing to its numerous innovations, Fraunhofer IGD raises man-machine interaction to a new level. Man is able to work in a more result-oriented and effective way by means of the computer and visual computing developments.
About the Role

Hintergrund/Motivation: 
Backdoor Attacken sind Angriffe auf Neuronale Netze bei denen ein sogenannter Trigger das Entscheidungsverhalten der Netze verändert und dadurch Schwachstellen entstehen. Diese Trigger können in den Trainingsdatensatz eingeschleust werden oder direkt auf die Modellgewichte. Diese nennt man dann vergiftet. Durch Parametereffiziente Finetuning Methoden sind Backdoor Angriffe auf Large Language Modelle (LLMs) wesentlich schwieriger zu detektieren geworden, da ein vergiftetes Parameterupdate schwieriger zu erkennen ist als ein vergifteter Datensatz. Daher wurden in der vergangenen Zeit einige Verfahren entwickelt um vergiftete Modelupdates zu erkennen.

 

Ziel:  Durch die Vielfalt der Backdoor Angriffe können Verfahren oft weitaus weniger Angriffe erkennen als sie vorgeben, da sie oft Annahmen treffen, die nicht der Realität entsprechen. Ziel dieser Arbeit ist es daher, bei Verfahren die in der Literatur vorgestellt wurden, Schwachstellen zu finden und auszunutzen, sodass versprochene Effekte doch nicht wie gewünscht erreicht werden.

 

Ergebnisse: Die Ergebnisse dieser Arbeit sollen der Forschungscommunity aufzeigen, dass ein grundlegendes Verständnis von den Mechaniken von Backdoor Angriffen zwingend erforderlich ist. Dafür sollen für vorher ausgewählte Detektionsverfahren Modelle, Datensätze oder Finetuning Adapter erstellt und getestet werden, die zuverlässig diese Detektionsverfahren umgehen können.

 

Hier sorgst Du für Veränderung

  • Forschen und Implementieren von neuartigen Machine Learning Ansätzen, die die Sicherheit von LLMs steigern.
  • Selbstkritische Evaluierung der gefunden Ergebnisse.
  • Präsentieren der Ergebnisse.
  • Anfertigen eines Projektberichts in Form einer Masterarbeit.

 

Hiermit bringst Du Dich ein

  • Kenntnisse im Bereich Machine Learning darunter Training, Inferenz und Optimierung von Transformerarchitekturen.
  • Kenntnisse im Bereich ML-Security sind wünschenswert.
  • Gute Python Kenntnisse im speziellen mit Pytorch sind erforderlich.
  • Wissenschaftliches Interesse und Interesse an aktuellen Forschungsprojekten.

 

 

Was wir für Dich bereithalten

  • Selbstständige Arbeitszeiteinteilung
  • Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung

 

Verwandte Arbeiten:
[1] https://arxiv.org/pdf/2404.09932 (Relevante Abschnitte: 2.7, 3.5, 3.6)
[2] http://arxiv.org/pdf/2403.00108
[3] http://arxiv.org/pdf/2411.17453
[4] http://arxiv.org/pdf/2508.01365

 

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online-Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht. 

 

Fraunhofer-Institut für Sichere Informationstechnologie SIT 

www.sit.fraunhofer.de 


Kennziffer: 82689                Bewerbungsfrist: 

 

Key Skills
Machine LearningTrainingInferenceOptimizationTransformer ArchitecturesML SecurityPythonPytorchScientific InterestResearch Projects
Categories
TechnologyScience & ResearchData & AnalyticsEngineering
Benefits
Flexible Working HoursInsights into Academic Research and Industrial Application