Home
Themen
Security & Compliance
KI-Software greift in Test zu Erpressung aus Selbstschutz

Patrick Hediger

27. Mai 2025

Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Künstliche Intelligenz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic gewährte dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine aussereheliche Beziehung hat.

Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hiess es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden liess, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Massnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Inhalt

Zu hilfsbereit
Zukunft mit KI-Agenten

Künstliche Intelligenz (KI)

Neueste Beiträge

Security & Compliance

Swisscom: Geopolitik und KI verschärfen die Bedrohungslage

KI-basierte Angriffe werden präziser, Hacker-Gruppen arbeiten immer professioneller und Sicherheitsrisiken in globalen Lieferketten nehmen weiter zu. Die neue Ausgabe des «Cybersecurity Threat Radar 2026» zeigt ein verschärftes Lagebild gegenüber 2025.

3 Minuten

Patrick Hediger

27. Apr 2026

Mehr erfahren

Künstliche Intelligenz (KI)

Vodafone peppt seinen Chatbot mit generativer KI auf

Der Chatbot Tobi von Vodafone wird mit generativer KI von Google ausgestattet und soll so helfen, Kundenanfragen eigenständig schneller, präziser und empathischer zu beantworten.

3 Minuten

Boris Boden

27. Apr 2026

Mehr erfahren

Business & IT-Strategie

UMB als erster Cisco Managed Service Practice Maturity Expert der Schweiz ausgezeichnet

Cisco hat UMB als ersten Schweizer Partner im Rahmen des neuen Cisco 360 Partner Programms mit dem Managed Service Practice Maturity Expert Status – vormals Gold Provider – ausgezeichnet.

2 Minuten

Patrick Hediger

27. Apr 2026

Mehr erfahren

Das könnte Sie auch interessieren

Security & Compliance

Phishing im Zusammenhang mit Verkäufen auf Ricardo.ch

Cyberkriminelle nutzen gezielt Verkaufsinserate auf Ricardo.ch, um Inserierende mit einer Kombination aus echten und gefälschten Nachrichten zu täuschen. Dabei versuchen sie, an die TWINT-Nummer und den TWINT-PIN der Betroffenen zu gelangen, um missbräuchliche Zahlungen vorzunehmen.

3 Minuten

Patrick Hediger

30. Mär 2026

Browser

Samsung Galaxy z Fold7: die besten Bilder - Sunrise

Der «TV Shop» auf der Sunrise TV Box wurde erneuert und findet sich nun im Hauptmenü. TV-Apps sowie Senderpakete sind in wenigen Schritten abonnier- und kündbar.

1 Minute

Redaktion computerworld.ch

11. Sep 2025

Security & Compliance

Cyberbedrohungslage in der Schweiz bleibt hoch

Der Halbjahresbericht des Bundesamtes für Cybersicherheit (BACS) beschreibt die relevanten Vorfälle und Entwicklungen im Kontext der Cyberbedrohungen gegen die Schweiz und international im zweiten Halbjahr 2025. Die Angriffe werden gezielter und komplexer.

4 Minuten

Patrick Hediger

31. Mär 2026