Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
© (Quelle: dall-e-3)

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance
Anzeige

Neueste Beiträge

Stand der IKT-Vorhaben im VBS
Der Bundesrat wurde an seiner Sitzung vom 11. Februar 2026 über den Stand der wichtigsten IKT-Vorhaben im VBS informiert. Dabei nahm er Kenntnis von der Umsetzung und der Wirksamkeit der ergriffenen Steuerungs- und Aufsichtsmassnahmen.
2 Minuten
12. Feb 2026
Swisscom 2025 mit mehr Umsatz aber weniger Gewinn
Nach der Akquisition von Vodafone Italia präsentieren sich die Zahlen für das Jahr 2025 wie erwartet: Die Swisscom Gruppe steigerte den Umsatz um 36,6% auf CHF 15'048 Mio. Der Reingewinn sank gegenüber dem Vorjahr um 17,6% auf CHF 1'270 Mio.
4 Minuten
12. Feb 2026
Achim Schneider ist neuer Managing Partner bei retailsolutions - SAP Beratung
Das Zuger Retail-Beratungshaus retailsolutions verstärkt sein Mangement mit Achim Schneider. Seit Februar verantwortet er als neuer Managing Partner die globale strategische Weiterentwicklung des Unternehmens.
2 Minuten
12. Feb 2026

Das könnte Sie auch interessieren

Outlook: Auf bevorzugten Browser ändern - Nein, ich will nicht Edge
Microsoft Outlook ignoriert neuerdings den im System eingestellten Standard-Webbrowser. So ändern Sie das wieder, falls Sie die Benachrichtigung verpasst haben.
2 Minuten
30. Aug 2023
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige