
Grok 4: Το «Εξυπνότερο AI του Κόσμου» ή Άλλη μια Υπερβολή του Elon Musk;
Ο Elon Musk περηφανεύεται για αυτό που ο ίδιος αποκαλεί τις απίστευτες δυνατότητες του νέου, προηγμένου AI chatbot της xAI, του Grok 4, το οποίο έρχεται να ταράξει τα νερά στην επανάσταση της τεχνολογίας AI.
«Το Grok 4 είναι πιο έξυπνο από σχεδόν όλους τους μεταπτυχιακούς φοιτητές σε όλους τους κλάδους, ταυτόχρονα», καυχήθηκε ο Musk, προσθέτοντας με έμφαση ότι το Grok 4 είναι «το πιο έξυπνο AI στον κόσμο».
Είναι όμως πραγματικά έτσι; Η νοημοσύνη ήταν ένα δύσκολο μέγεθος προς μέτρηση ακόμη και πριν την εμφάνιση του AI, αλλά συγκεκριμένες δοκιμές και benchmarks μπορούν να μας δώσουν μια ξεκάθαρη εικόνα για το μέλλον της τεχνολογίας.
Grok 4 vs GPT-4 & Gemini: Η Αλήθεια των AI Benchmarks
Μια εξέχουσα πλατφόρμα για τη σύγκριση μοντέλων AI είναι ο πίνακας κατάταξης LMArena, μια καινοτομία που αναπτύχθηκε από το UC Berkeley.
Η πλατφόρμα αυτή συλλέγει χιλιάδες αξιολογήσεις, ζητώντας από τους χρήστες να βαθμολογήσουν ανώνυμα τις απαντήσεις των chatbots σε ένα ευρύ φάσμα κατηγοριών, όπως:
- Δημιουργική γραφή
- Προγραμματισμός
- Μαθηματικά
- Οπτική αντίληψη
Πώς Κατατάσσεται το Grok 4;
Σύμφωνα με τις τελευταίες βαθμολογίες, το Grok 4 κατέλαβε την τρίτη θέση συνολικά. Για να μην παρεξηγηθούμε, αυτό είναι εξαιρετικά εντυπωσιακό — αλλά αποδεικνύει ότι υπολείπεται ακόμη των κορυφαίων μοντέλων της Google και της OpenAI.
Συγκεκριμένα, η κατάταξη έχει ως εξής:
- Πρώτη θέση: Gemini 2.5 της Google
- Δεύτερη θέση (ισοβαθμία): Τα μοντέλα o3 και 4o της OpenAI
- Τρίτη θέση (ισοβαθμία): GPT-4.5 της OpenAI και το Grok 4 της xAI
Αυτό το αποτέλεσμα δείχνει την ένταση του ανταγωνισμού στην παγκόσμια αγορά AI, μια εξέλιξη που παρακολουθεί στενά και η Ελλάδα. Ενώ το Grok είναι ένας τρομερός ανταγωνιστής, η τελευταία του έκδοση απέχει από το να είναι «το πιο έξυπνο AI στον κόσμο», τουλάχιστον με βάση αυτά τα δεδομένα.
Σημείωση: Η απόκλιση μεταξύ ισχυρισμών και πραγματικότητας δεν αποτελεί έκπληξη για όσους παρακολουθούν την πορεία του Musk. Έχει μακρά ιστορία στο να λέει ανακρίβειες στην επαγγελματική του ζωή, στις πολιτικές του δραστηριότητες, ακόμη και στα χόμπι του.
Αμφισβήτηση των Benchmarks: Μια Ελπίδα για το Grok 4;
Παρόλα αυτά, υπάρχει και ένας αντίλογος που ίσως δίνει μια σανίδα σωτηρίας στους ισχυρισμούς για το Grok. Η κριτική από ειδικούς υποστηρίζει ότι η «αρένα» των chatbots του Berkeley μπορεί να βασίζεται περισσότερο στην «αίσθηση» (vibes-based) που αφήνει ένα μοντέλο, παρά σε αυστηρά επιστημονικά και αντικειμενικά δεδομένα.
Σύμφωνα με μια πρόσφατη μελέτη...