

Was ist Grok 3
Grok 3 ist das neueste Sprachmodell von xAI, das mithilfe eines bahnbrechenden Reinforcement-Learning-Frameworks auf einem Cluster von 200.000 GPUs trainiert wurde. Es verfügt über 27 Milliarden Parameter und ein Kontextfenster von 1,28 Millionen Tokens mit Echtzeit-Wissenszugriff.
Im Think-Modus kann Grok 3 tiefgehende Denkprozesse von 6 Sekunden bis 6 Minuten durchführen und zeigt dabei Leistungen über dem menschlichen Expertenniveau. Es erreichte eine Genauigkeit von 93,3% im AIME 2025-Wettbewerb und 84,6% im graduierten GPQA.
Als vielseitiger KI-Assistent unterstützt Grok 3 12 Programmiersprachen, kann Bild- und Videoinhalte verarbeiten und nutzt DeepSearch für Echtzeit-Informationsverifizierung.
Kernfunktionen im Überblick
Entdecken Sie revolutionäre Durchbrüche in Grok 3
Verbesserter Denk-Motor
- Unterstützt tiefgehende Denkprozesse von 6s bis 6min
- 93,3% Genauigkeit im AIME 2025-Wettbewerb (64 Denkiterationen)
- 84,6% Genauigkeit bei GPQA-Diamantproblemen (übertrifft menschliche Experten)
- Reinforcement-Learning-Framework basierend auf 200k GPU-Cluster
Mathematik & Wissenschaft
- AIME 2024/2025 Zweijahresschnitt: 94,5% Genauigkeit
- MMLU-Pro Benchmark: 79,9% Genauigkeit (führend in STEM)
- Durchschnittliche Latenz bei komplexen mathematischen Problemen: 67ms
Code-Generierung & Optimierung
- LiveCodeBench v5: 79,4% Genauigkeit (Echtzeit-Programmierbewertung)
- Unterstützt Analyse von millionenzeilen Codebasen
- Unterstützt 12 Sprachen einschließlich Python/Java/C++
Multimodale Verständnis
- MMMU Benchmark: 73,2% Genauigkeit
- EgoSchema Langzeitvideoverständnis: 74,5% Genauigkeit
- Bild-Text-Mischproblem-Lösung um 42% verbessert
Echtzeit-Wissensmotor
- Deckt Echtzeit-Webdaten + soziale Daten der 𝕏-Plattform ab
- Durchschnittliche Antwortzeit für komplexe Anfragen <800ms
- Unterstützt Kreuzverifizierung von über 1.200 vertrauenswürdigen Quellen
Langkontext-Verarbeitung
- 1M Token Kontextspeicher (ca. 750k Zeichen)
- Einmal-Analyse von 3000-seitigen technischen Dokumenten
- 83,3% Genauigkeit im LOFT 128k Benchmark
Leistungsvergleich
Competition Math
Graduate-Level Google-Proof Q&A (Diamond)
LiveCodeBench (v5)
Code Generation: 10/1/2024 - 2/1/2025
MMMU
Multimodal Understanding