Schlagwort: Guardrails

Forscher knacken KI-Schutzmechanismen mit schlechter Grammatik

Sicherheitsforscher von Palo Alto Networks haben eine überraschend einfache Methode gefunden, um die eingebauten Schutzmechanismen großer KI-Sprachmodelle (LLMs) auszuhebeln: lange, grammatikalisch fehlerhafte Schachtelsätze. (Weiter lesen)