Grok 3 - KI-Assistent

Mit Echtzeit-Info von X

Grok 3 Feature
Grok 3 Feature

Was ist Grok 3

Grok 3 ist das neueste Sprachmodell von xAI, das mithilfe eines bahnbrechenden Reinforcement-Learning-Frameworks auf einem Cluster von 200.000 GPUs trainiert wurde. Es verfügt über 27 Milliarden Parameter und ein Kontextfenster von 1,28 Millionen Tokens mit Echtzeit-Wissenszugriff.

Im Think-Modus kann Grok 3 tiefgehende Denkprozesse von 6 Sekunden bis 6 Minuten durchführen und zeigt dabei Leistungen über dem menschlichen Expertenniveau. Es erreichte eine Genauigkeit von 93,3% im AIME 2025-Wettbewerb und 84,6% im graduierten GPQA.

Als vielseitiger KI-Assistent unterstützt Grok 3 12 Programmiersprachen, kann Bild- und Videoinhalte verarbeiten und nutzt DeepSearch für Echtzeit-Informationsverifizierung.

Kernfunktionen im Überblick

Entdecken Sie revolutionäre Durchbrüche in Grok 3

Verbesserter Denk-Motor

  • Unterstützt tiefgehende Denkprozesse von 6s bis 6min
  • 93,3% Genauigkeit im AIME 2025-Wettbewerb (64 Denkiterationen)
  • 84,6% Genauigkeit bei GPQA-Diamantproblemen (übertrifft menschliche Experten)
  • Reinforcement-Learning-Framework basierend auf 200k GPU-Cluster

Mathematik & Wissenschaft

  • AIME 2024/2025 Zweijahresschnitt: 94,5% Genauigkeit
  • MMLU-Pro Benchmark: 79,9% Genauigkeit (führend in STEM)
  • Durchschnittliche Latenz bei komplexen mathematischen Problemen: 67ms

Code-Generierung & Optimierung

  • LiveCodeBench v5: 79,4% Genauigkeit (Echtzeit-Programmierbewertung)
  • Unterstützt Analyse von millionenzeilen Codebasen
  • Unterstützt 12 Sprachen einschließlich Python/Java/C++

Multimodale Verständnis

  • MMMU Benchmark: 73,2% Genauigkeit
  • EgoSchema Langzeitvideoverständnis: 74,5% Genauigkeit
  • Bild-Text-Mischproblem-Lösung um 42% verbessert

Echtzeit-Wissensmotor

  • Deckt Echtzeit-Webdaten + soziale Daten der 𝕏-Plattform ab
  • Durchschnittliche Antwortzeit für komplexe Anfragen <800ms
  • Unterstützt Kreuzverifizierung von über 1.200 vertrauenswürdigen Quellen

Langkontext-Verarbeitung

  • 1M Token Kontextspeicher (ca. 750k Zeichen)
  • Einmal-Analyse von 3000-seitigen technischen Dokumenten
  • 83,3% Genauigkeit im LOFT 128k Benchmark

Leistungsvergleich

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

FAQ