Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
© (Quelle: dall-e-3)

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance
Anzeige

Neueste Beiträge

Europäisches Jolla Phone wird bald Realität
Nachdem genug Vorbestellungen vorliegen, will das finnische Unternehmen Jolla die Produktion seines Smartphones mit der Android-Alternative Sailfish OS starten.
3 Minuten
13. Mär 2026
Neue Studienrichtung der FHNW verbindet Sport, Daten und KI
Tracking, Wearables und künstliche Intelligenz verändern den Sport grundlegend. Mit der neuen Studienrichtung «Data Science & AI for Sports» positioniert sich die Hochschule für Informatik FHNW in einem wachsenden Zukunftsfeld.
3 Minuten
13. Mär 2026
Digitalisierung spaltet die deutsche Wirtschaft
Viele Unternehmen profitieren bereits von der Digitalisierung. Gleichzeitig kommt rund die Hälfte mit der Transformation kaum hinterher, und für einige wird sie sogar zur Existenzfrage.
3 Minuten
12. Mär 2026

Das könnte Sie auch interessieren

Die Software im Griff unter Windows - Windows-Tipps
Programme unter Windows zu installieren oder zu deinstallieren, ist nicht schwer. Dennoch gibt es einige Dinge, die Sie dabei beachten sollten. Wir erklären Ihnen, wie Sie Software unter Windows sauber installieren und deinstallieren.
5 Minuten
4. Mär 2026
WhatsApp für Profis - Whatsapp-Tipps
WhatsApp ist im Schweizer Alltag schon lange präsent. Trotzdem gibt es noch immer viele Funktionen, die wenig bekannt sind. Zudem kommen stetig neue Features hinzu. Wir haben die hilfreichsten Tipps und Tricks für Sie zusammengetragen.
9 Minuten
19. Feb 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige