
Η μάχη για την κυριαρχία στο AI
Η μάχη για την κυριαρχία στον χώρο της τεχνολογίας καλά κρατεί, και το ερώτημα παραμένει: Ποιος είναι ο αδιαμφισβήτητος ηγέτης;
Η τελευταία φορά που πραγματοποιήθηκαν εκτενείς συγκριτικές δοκιμές μοντέλων AI από την OpenAI και την Google στο Ars ήταν στα τέλη του 2023, μια εποχή που η πρόταση της Google ονομαζόταν ακόμα Bard. Στα περίπου δύο χρόνια που μεσολάβησαν από τότε, έχουν συμβεί κοσμογονικές αλλαγές και μια πραγματική επανάσταση στον κόσμο του AI.
Η συμμαχία Apple και Google
Το τοπίο αλλάζει δραματικά τώρα που η Apple πήρε τη στρατηγική απόφαση να συνεργαστεί με το Google Gemini για να τροφοδοτήσει την επόμενη γενιά της φωνητικής βοηθού Siri.
Με βάση αυτή την εξέλιξη, σκεφτήκαμε ότι ήρθε η ώρα να προχωρήσουμε σε νέες, εξαντλητικές δοκιμές για να δούμε πού βρίσκονται σήμερα τα προηγμένα μοντέλα αυτών των τεχνολογικών κολοσσών.
Η μεθοδολογία της δοκιμής: Πώς συγκρίναμε τους γίγαντες
Για τις ανάγκες αυτής της σύγκρισης, εστιάζουμε στα προεπιλεγμένα μοντέλα που διαθέτουν τόσο η OpenAI όσο και η Google στους χρήστες που δεν πληρώνουν για κανονική συνδρομή (δωρεάν χρήστες). Στόχος είναι να αξιολογήσουμε την εμπειρία που θα έχει ο μέσος χρήστης στην Ελλάδα και παγκοσμίως:
- ChatGPT 5.2 για την OpenAI
- Gemini 3.2 Fast για την Google
"Αν και υπάρχουν άλλα μοντέλα που μπορεί να είναι πιο ισχυρά σε επεξεργαστική ισχύ, θεωρήσαμε ότι αυτή η δοκιμή αναπαριστά καλύτερα την καθημερινή εμπειρία AI, όπως ακριβώς θα λειτουργούσε για τη συντριπτική πλειοψηφία των χρηστών της Siri, οι οποίοι δεν διατηρούν ενεργή συνδρομή στις υπηρεσίες καμίας από τις δύο εταιρείες."
Η διαδικασία αξιολόγησης
Όπως και στο παρελθόν, τροφοδοτήσαμε με τις ίδιες ακριβώς εντολές (prompts) και τα δύο μοντέλα. Στη συνέχεια, αξιολογήσαμε τα αποτελέσματα χρησιμοποιώντας έναν συνδυασμό αυστηρής αντικειμενικής αξιολόγησης και της απαραίτητης υποκειμενικής αίσθησης για την ποιότητα του λόγου.
Ωστόσο, για να διασφαλίσουμε ότι η σύγκριση συμβαδίζει με την καινοτομία της εποχής, δεν αρκεστήκαμε στις σχετικά απλές εντολές του 2023. Αντ' αυτού, υποβάλαμε τα μοντέλα σε ένα ενημερωμένο σύνολο πιο σύνθετων και απαιτητικών εντολών, τις οποίες χρησιμοποιήσαμε για πρώτη φορά όταν συγκρίναμε το GPT-5 με το GPT-4o το περασμένο καλοκαίρι.
Διαβάστε ολόκληρο το άρθρο και τα αναλυτικά αποτελέσματα