Grok 3 - KI-Assistent

Mit Echtzeit-Info von X

Was ist Grok 3

Grok 3 ist das neueste Sprachmodell von xAI, das mithilfe eines bahnbrechenden Reinforcement-Learning-Frameworks auf einem Cluster von 200.000 GPUs trainiert wurde. Es verfügt über 27 Milliarden Parameter und ein Kontextfenster von 1,28 Millionen Tokens mit Echtzeit-Wissenszugriff.

Im Think-Modus kann Grok 3 tiefgehende Denkprozesse von 6 Sekunden bis 6 Minuten durchführen und zeigt dabei Leistungen über dem menschlichen Expertenniveau. Es erreichte eine Genauigkeit von 93,3% im AIME 2025-Wettbewerb und 84,6% im graduierten GPQA.

Als vielseitiger KI-Assistent unterstützt Grok 3 12 Programmiersprachen, kann Bild- und Videoinhalte verarbeiten und nutzt DeepSearch für Echtzeit-Informationsverifizierung.

Kernfunktionen im Überblick

Entdecken Sie revolutionäre Durchbrüche in Grok 3

Verbesserter Denk-Motor

Unterstützt tiefgehende Denkprozesse von 6s bis 6min
93,3% Genauigkeit im AIME 2025-Wettbewerb (64 Denkiterationen)
84,6% Genauigkeit bei GPQA-Diamantproblemen (übertrifft menschliche Experten)
Reinforcement-Learning-Framework basierend auf 200k GPU-Cluster

Mathematik & Wissenschaft

AIME 2024/2025 Zweijahresschnitt: 94,5% Genauigkeit
MMLU-Pro Benchmark: 79,9% Genauigkeit (führend in STEM)
Durchschnittliche Latenz bei komplexen mathematischen Problemen: 67ms

Code-Generierung & Optimierung

LiveCodeBench v5: 79,4% Genauigkeit (Echtzeit-Programmierbewertung)
Unterstützt Analyse von millionenzeilen Codebasen
Unterstützt 12 Sprachen einschließlich Python/Java/C++

Multimodale Verständnis

MMMU Benchmark: 73,2% Genauigkeit
EgoSchema Langzeitvideoverständnis: 74,5% Genauigkeit
Bild-Text-Mischproblem-Lösung um 42% verbessert

Echtzeit-Wissensmotor

Deckt Echtzeit-Webdaten + soziale Daten der 𝕏-Plattform ab
Durchschnittliche Antwortzeit für komplexe Anfragen <800ms
Unterstützt Kreuzverifizierung von über 1.200 vertrauenswürdigen Quellen

Langkontext-Verarbeitung

1M Token Kontextspeicher (ca. 750k Zeichen)
Einmal-Analyse von 3000-seitigen technischen Dokumenten
83,3% Genauigkeit im LOFT 128k Benchmark

Leistungsvergleich

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%