Anzeige
Anzeige
Anzeige
Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
© (Quelle: dall-e-3)

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance
Anzeige

Neueste Beiträge

Irgendwo im ­Nirgendwo
Manchmal braucht es einfach die genauen GPS-Koordinaten, um den eigenen Standort durchzugeben.
2 Minuten
26. Apr 2026
Bessere Qualität der swisstopo Geodaten dank neuer Luftbildkameras
Zum Start der Flugsaison 2026 führt das Bundesamt für Landestopografie swisstopo eine Kamera neuster Generation für die Aufnahme von Luftbildern ein. Diese Weiterentwicklung dient der Erneuerung von Aufnahmesystemen, die das Ende ihres Lebenszyklus erreicht haben.
3 Minuten
26. Apr 2026
Ines Stutz mit mehr Verantwortung bei Aveniq
Ines Stutz übernimmt Leitung des neu geschaffenen Bereiches Consulting & Project Services.Um Kunden in Transformations- und Projektvorhaben noch gezielter zu unterstützen, stärkt Aveniq ihr Beratungs- und Projektgeschäft.
2 Minuten
25. Apr 2026

Das könnte Sie auch interessieren

CCleaner: ja oder nein? - Windows-Pflege
Die Wartungs-Software CCleaner hält sich seit Jahren und ist bei vielen Anwendern beliebt. Doch braucht es dieses Tool heute noch? Und wenn ja, welche Version empfiehlt sich – die Free-Variante oder die kostenpflichtige Pro-Fassung?
6 Minuten
Samsung Galaxy z Fold7: die besten Bilder - Sunrise
Der «TV Shop» auf der Sunrise TV Box wurde erneuert und findet sich nun im Hauptmenü. TV-Apps sowie Senderpakete sind in wenigen Schritten abonnier- und kündbar.
1 Minute
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige