
Το X (πρώην Twitter) ανοίγει ξανά τα χαρτιά του: Τι αποκαλύπτει ο νέος open source αλγόριθμος
Το 2023, η πλατφόρμα που τότε γνωρίζαμε ως Twitter προχώρησε σε μια κίνηση που χαρακτηρίστηκε ως τεχνολογική καινοτομία, διαθέτοντας μερικώς ως open source τον αλγόριθμό της για πρώτη φορά. Εκείνη την εποχή, ο δισεκατομμυριούχος ιδιοκτήτης της Tesla, Elon Musk, είχε μόλις ολοκληρώσει την εξαγορά της πλατφόρμας και ισχυριζόταν ότι βρισκόταν σε μια αποστολή ριζικής αναδιάρθρωσης των social media, με απώτερο στόχο να ενισχύσει τη διαφάνεια και την ελευθερία λόγου.
Ωστόσο, η αρχική δημοσίευση του κώδικα δέχτηκε γρήγορα έντονη κριτική από την παγκόσμια κοινότητα προγραμματιστών και χαρακτηρίστηκε ως «θέατρο διαφάνειας». Οι επικριτές σημείωσαν ότι η κίνηση ήταν «ελλιπής» και ότι ουσιαστικά δεν αποκάλυπτε πολλά για την εσωτερική λειτουργία του οργανισμού, ούτε εξηγούσε το γιατί ο κώδικας λειτουργούσε με τον συγκεκριμένο τρόπο, αφήνοντας ερωτηματικά για την AI στρατηγική της εταιρείας.
Η νέα δέσμευση του Musk για την τεχνολογία
Σήμερα, ο ιστότοπος (που έχει πλέον μετονομαστεί σε X) προχωρά σε μια νέα εξέλιξη, διαθέτοντας ξανά τον αλγόριθμό του ως open source. Αυτή η κίνηση έρχεται να εκπληρώσει μια υπόσχεση που έδωσε ο Musk την περασμένη εβδομάδα, σηματοδοτώντας μια νέα εποχή για την πλατφόρμα.
«Θα κάνουμε τον νέο αλγόριθμό του 𝕏, συμπεριλαμβανομένου όλου του κώδικα που χρησιμοποιείται για να καθοριστεί ποιες οργανικές και διαφημιστικές αναρτήσεις προτείνονται στους χρήστες, open source σε 7 ημέρες», είχε δηλώσει χαρακτηριστικά.
Επιπλέον, ο Musk δεσμεύτηκε να παρέχει πλήρη διαφάνεια σχετικά με τις αλλαγές στον αλγόριθμό κάθε τέσσερις εβδομάδες για το προσεχές μέλλον, επιδιώκοντας να κερδίσει την εμπιστοσύνη των χρηστών.
Τι αποκαλύπτουν τα δεδομένα στο GitHub
Σε μια αναλυτική ανάρτηση στο GitHub την Τρίτη, το X παρείχε μια προσβάσιμη περιγραφή σχετικά με τον κώδικα παραγωγής του feed, συνοδευόμενη από ένα διάγραμμα που εξηγεί τη ροή εργασίας του προγράμματος.
Αν και τα στοιχεία που αποκαλύφθηκαν δεν θεωρούνται ιδιαίτερα συνταρακτικά για τους ειδικούς της βιομηχανίας, σίγουρα παρέχουν μια πολύτιμη ματιά πίσω από την «αλγοριθμική κουρτίνα» του γίγαντα των social media. Το διάγραμμα δείχνει ότι, όταν ο προηγμένος αλγόριθμος αναζητά περιεχόμενο για να τροφοδοτήσει το timeline ενός συγκεκριμένου χρήστη, λαμβάνει σοβαρά υπόψη τα εξής δεδομένα:
- Το ιστορικό αλληλεπίδρασης (σε ποιες αναρτήσεις έχει κάνει κλικ ο χρήστης, likes, retweets κ.λπ.).
- Τις πρόσφατες αναρτήσεις εντός του δικτύου επαφών του (in-network).
Παράλληλα, το σύστημα διεξάγει μια βαθιά ανάλυση βασισμένη στο Machine Learning (Μηχανική Μάθηση) και την AI για αναρτήσεις «εκτός δικτύου» (out-of-network). Αυτό αφορά περιεχόμενο από λογαριασμούς που ο χρήστης δεν ακολουθεί απαραίτητα, αλλά το σύστημα προβλέπει ότι θα βρει ελκυστικό, βασιζόμενο σε μοτίβα συμπεριφοράς.
Φιλτράρισμα και Κατάταξη: Πώς επιλέγεται το περιεχόμενο
Στο επόμενο στάδιο της διαδικασίας, ο αλγόριθμος εφαρμόζει αυστηρά φίλτρα για να αποκλείσει συγκεκριμένες κατηγορίες αναρτήσεων, διασφαλίζοντας την ποιότητα της εμπειρίας:
- Αναρτήσεις που προέρχονται από μπλοκαρισμένους λογαριασμούς.
- Αναρτήσεις που περιέχουν λέξεις-κλειδιά που έχουν τεθεί σε σίγαση (muted) από τον χρήστη.
- Περιεχόμενο που έχει κριθεί υπερβολικά βίαιο ή που παρουσιάζει χαρακτηριστικά spam.
Τέλος, ο αλγόριθμος κατατάσσει το εναπομείναν περιεχόμενο με βάση το τι προβλέπει η AI ότι ο χρήστης θα βρει πιο ενδιαφέρον. Αυτή η διαδικασία κατάταξης είναι δυναμική και λαμβάνει υπόψη κρίσιμους παράγοντες όπως η συνάφεια του θέματος και η ποιότητα του περιεχομένου, καθορίζοντας τελικά τι βλέπουμε στις οθόνες μας στην Ελλάδα και σε όλο τον κόσμο.