Home
Themen
Security & Compliance
KI-Software greift in Test zu Erpressung aus Selbstschutz

Patrick Hediger

27. Mai 2025

Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Künstliche Intelligenz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic gewährte dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine aussereheliche Beziehung hat.

Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hiess es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden liess, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Massnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Inhalt

Zu hilfsbereit
Zukunft mit KI-Agenten

Künstliche Intelligenz (KI)

Neueste Beiträge

Künstliche Intelligenz (KI)

Telekom nimmt grösste KI-Fabrik Deutschlands in Betrieb

Sechs Monate Bauzeit, eine Milliarde Euro: Die Deutsche Telekom hat in München die Industrial AI Cloud eröffnet und steigert damit Deutschlands KI-Rechenleistung um 50 Prozent. CEO Tim Höttges nutzte die Eröffnung für klare Forderungen an die Politik.

7 Minuten

Roland Bernhard

5. Feb 2026

Mehr erfahren

PowerShot G7 X Mark III 30th Anniversary Edition

Technologie & Innovation

Canon feiert 30 Jahre PowerShot

Canon begeht im Jahr 2026 das 30-jährige Jubiläum seiner PowerShot-Serie kompakter Digitalkameras. Anlässlich dieses Jubiläums bringt das Unternehmen im April 2026 die PowerShot G7 X Mark III 30th Anniversary Edition auf den Markt.

3 Minuten

Patrick Hediger

5. Feb 2026

Mehr erfahren

People

Ines Stutz übernimmt Leitung des Bereichs SAP Consulting bei Aveniq

Aveniq gewinnt mit Ines Stutz eine Expertin für Unternehmens- und IT-Transformationen für die Leitung des Bereichs SAP Consulting. Mit dieser Neubesetzung unterstreicht Aveniq die strategische Bedeutung des SAP-Marktsegments und baut ihre SAP-Beratungs- und Transformationskompetenz weiter aus.

2 Minuten

Patrick Hediger

6. Feb 2026

Mehr erfahren

Das könnte Sie auch interessieren

Security & Compliance

«Bei der Datensouveränität gilt es die richtige Balance zu finden» - Quotes & Thoughts

Daniel Bachofner, Country Manager NetApp Schweiz, vertritt die Meinung, dass sich die Entscheidung, wie souverän Daten in einem Unternehmen gehandhabt werden, stark auf die Wettbewerbsfähigkeit auswirkt.

3 Minuten

Christian Bühlmann

18. Dez 2025

Security & Compliance

191 Prozent mehr Malware-Angriffe im Dezember 2025 - Acronis Cyberthreats

Laut dem aktuellen Acronis Cyberthreats Update für Januar 2026 verzeichnete der Dezember 2025 den stärksten Anstieg gegenüber dem Vormonat bei erkannten Malware-Angriffen im Jahr 2025.

3 Minuten

Patrick Hediger

27. Jan 2026

Security & Compliance

Falsche Krypto-Registrierung zielt auf Personendaten ab - Aufgepasst

Ein professionell gestaltetes Schreiben im Design Schweizerischen Institutionen täuscht eine angebliche Krypto-Registrierungspflicht vor und fordert Empfänger zur Eingabe persönlicher und finanzieller Daten auf.

2 Minuten

Patrick Hediger

26. Jan 2026