Schlagwort: RLHF

Selbstbewusst falsch: Forscher haben entschlüsselt, warum KI lügt

Sprachmodelle wie GPT-4o oder Gemma 3 können bei einfachen Fragen über­trieben selbstsicher antworten – und bei Kritik plötzlich einknicken. Diese paradoxe Mischung aus Starrsinn und Verunsicherung lässt sich nun erstmals systematisch erklären….

OpenAI muss Update zurückziehen, weil ChatGPT zu viel schleimte

Das ChatGPT-Modell GPT‑4o wurde nach einem Update plötzlich zum überschwänglichen Ja-Sager. OpenAI hat die Aktualisierung nun zurückgezogen, nachdem die KI selbst gefährlichen Ideen enthusiastisch zustimmte und regelrecht schleimte. (We…