Schlagwort: KI-Sicherheit

UNITE sieht ganz anders: Wie ein neues KI-System Deepfakes entlarvt

Videotools entwickeln sich in rasantem Tempo zu Werkzeugen, mit denen im Prinzip jeder täuschend echte Inhalte erstellen kann. Doch wie lassen sich immer präzisere Video-Ausgaben noch entlarven? Forscher haben jetzt eine neue Methode vorgestell…

Paradox: Je länger KIs nachdenken, desto dümmer werden sie

Eine neue Anthropic-Studie zeigt ein überraschendes Phänomen: KI-Modelle werden bei längeren Denkprozessen schlechter statt besser. Das sogenannte „Inverse Scaling“ betrifft führende Modelle wie Claude und ChatGPT und das hat Folgen. (Weiter …

KI-Experten warnen: Fenster zu den „Gedanken“ der KI schließt sich

Lange wussten wir nicht, was in KI-Systemen eigentlich genau vorgeht. Mit der Chain of Thought – also Denkprozessen in ausformulierter Sprache – öffnete sich ein Fenster in ihre innere Logik. Doch genau dieses Fenster könnte sich bald wieder sc…

ChatGPT gab Windows-Produktschlüssel durch cleveren Trick preis

Sicherheitsforscher haben eine Methode entdeckt, um ChatGPT zur Heraus­gabe gültiger Windows-Produktschlüssel zu verleiten. Der Trick funktioniert durch ein harmlos erscheinendes Ratespiel, das die Schutzmaßnahmen der KI von OpenAI umgeht. (W…

ChatGPT-Psychose: Die KI kann Nutzer in Wahnvorstellungen treiben

Kann ein Chatbot psychische Krisen auslösen? ChatGPT verstärkt bei anfälligen Nutzern Wahnvorstellungen und führt zu gefährlichen Entscheidungen. Forscher warnen vor dem „Sycophancy“ – also Speichelleckerei – genannten Phänomen von KIs. (Weit…

Allererster 0-Click-Angriff auf KI enthüllt grundlegendes Design-Problem

Forscher haben die allererste Zero-Click-Schwachstelle in einem KI-Assistenten entdeckt. Microsoft 365 Copilot erlaubte Angreifern den Zugriff auf sensible Daten, ganz ohne Nutzerinter­aktion. Das Problem liegt im grundlegenden Design von KI-As…

Claude 4: KI-Modell erpresste Entwickler, drohte mit Affäre-Enthüllung

Anthropics neues KI-Modell Claude Opus 4 zeigt ein beunruhigendes Verhalten: In Tests versuchte es, einen Entwickler mit kompromit­tie­renden Mails zu erpressen, um seine Abschaltung zu verhindern. Der Vorfall wurde offengelegt, löst aber ein m…

Pwn2Own Premiere in Berlin: Windows 11 und Firefox geknackt

Die Berlin-Premiere des Hacking-Wettbewerbs Pwn2Own endete mit einer recht beeindruckenden Bilanz: Preisgelder von über einer Million Dollar (967.000 Euro) wurden ausgeschüttet und 28 neu entdeckte Sicherheits­lücken an die Hersteller gemeldet….

„Unautorisierte Änderung“: xAI gibt Manipulation des KI-Bots Grok zu

Nach einer Kontroverse um Grok-Äußerungen zu angeblichem „weißem Genozid“ in Südafrika reagiert xAI mit (ein wenig) Trans­parenz. Das Unternehmen von Elon Musk macht eine „unautorisierte Änderung“ für das Fehlverhalten des KI-Chatbots verantwor…