Schlagwort: Anthropic

OpenAI muss Update zurückziehen, weil ChatGPT zu viel schleimte

Das ChatGPT-Modell GPT‑4o wurde nach einem Update plötzlich zum überschwänglichen Ja-Sager. OpenAI hat die Aktualisierung nun zurückgezogen, nachdem die KI selbst gefährlichen Ideen enthusiastisch zustimmte und regelrecht schleimte. (We…

Microsoft: KI kann Code-Debugging einfach nicht so gut wie ein Mensch

Trotz zunehmender Nutzung von Künstlicher Intelligenz in der Softwareentwicklung zeigen aktuelle Studien, dass moderne KI-Modelle beim Debugging an klare Grenzen stoßen. Vor allem schneiden sie hierbei im Vergleich zum Menschen deutlich schlech…

DeepSeek veröffentlicht V3, bereitet OpenAI und Co. Kopfschmerzen

DeepSeek hat Version V3 seines KI-Modells vorgestellt, diese zeich­net sich u. a. durch verbesserte Fähigkeiten beim Program­mie­ren und Mathematik aus. Bemerkenswert ist vor allem, dass das Modell auf Consumer-Hardware wie dem Mac Studio lauff…

Claude geht online: Anthropics KI durchsucht jetzt auch das Internet

Claude bekommt Zugriff aufs Internet – und macht dabei vieles anders als ChatGPT & Co. Der KI-Chatbot von Anthropic setzt bei der neuen Websuche-Funktion auf vollständige Transparenz: Jede Information wird mit direkten Quellenlinks belegt. (W…

Super Mario Bros. wird zum neuen, aber umstrittenen KI-Benchmark

Forscher der University of California San Diego nutzen Super Mario Bros. als neue Benchmark für KI-Modelle. Die Ergebnisse überraschen: Klassische Modelle wie GPT-4 scheitern an der Echtzeit-Herausforderung, während andere KIs besser abschneide…

Super Mario Bros. wird zum neuen, aber umstrittenen KI-Benchmark

Forscher der University of California San Diego nutzen Super Mario Bros. als neue Benchmark für KI-Modelle. Die Ergebnisse überraschen: Klassische Modelle wie GPT-4 scheitern an der Echtzeit-Herausforderung, während andere KIs besser abschneide…

Claude 3.7: Anthropics KI-Modell mit Denkfähigkeiten

Anthropic präsentiert mit Claude 3.7 Sonnet ein KI-Modell, das erstmals „hybrides Denken“ ermöglicht. Nutzer können zwischen schnellen Antworten und umfassender Analyse wählen. Das Modell zeigt Stärken bei Programmieraufgaben und erreicht Spitz…