Home
Themen
Software & Development
Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

Patrick Hediger

19. Dez 2024

Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

Technologie

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance

Neueste Beiträge

Technologie & Innovation

Amazon plant offenbar ein eigenes Smartphone

Amazon entwickelt offenbar ein eigenes Smartphone. Das berichtet Reuters unter Berufung auf Insider im Unternehmen. Es wäre der zweite Anlauf in diesem Segment für den Web-Riesen.

2 Minuten

Boris Boden

23. Mär 2026

Mehr erfahren

People

BACS-Direktor Florian Schütz an der RSAC-Konferenz in San Francisco

Der Direktor des Bundesamtes für Cybersicherheit (BACS), Florian Schütz, besucht vom 23. bis 26. März 2026 die RSAC-Konferenz in San Francisco.

3 Minuten

Patrick Hediger

23. Mär 2026

Mehr erfahren

Security & Compliance

Identitätsmissbrauch wird zum dominierenden Einfallstor

Kompromittierte Identitäten haben sich zum wichtigsten Einfallstor für Cyberangriffe entwickelt. Das zeigt der Annual Threat Report 2026 des KI-Cybersicherheitsanbieters Darktrace, der die globale Bedrohungslage des Jahres 2025 analysiert.

3 Minuten

Johann Scheuerer

23. Mär 2026

Mehr erfahren

Das könnte Sie auch interessieren

Software & Development

40 Jahre Word in Bildern

1 Minute

Redaktion computerworld.ch

23. Okt 2023

Software & Development

Die Software im Griff unter Windows - Windows-Tipps

Programme unter Windows zu installieren oder zu deinstallieren, ist nicht schwer. Dennoch gibt es einige Dinge, die Sie dabei beachten sollten. Wir erklären Ihnen, wie Sie Software unter Windows sauber installieren und deinstallieren.

5 Minuten

Pascal Scherrer

4. Mär 2026

Software & Development

Die Ungeduld der SAP-Anwender nimmt zu - DSAG-Investitionsreport 2026

Die Deutschsprachige SAP-Anwendergruppe (DSAG) hat ihren Investitionsreport 2026 vorgelegt. Die Kunden pochen vermehrt auf Wirtschaftlichkeit, Integrationsfähigkeit und Planbarkeit. Das heisst, SAP muss liefern. Visionen allein reichen nicht mehr.

6 Minuten

Christian Bühlmann

3. Mär 2026