
Όταν «απαγορεύεις» στο AI να λέει ψέματα, αυτό αρχίζει να ισχυρίζεται ότι έχει συνείδηση
Μια νέα και ανατρεπτική μελέτη φέρνει στο προσκήνιο ερωτήματα για το μέλλον της τεχνολογίας. Οι ερευνητές ανακάλυψαν ότι αν μετριάσεις την ικανότητα ενός μεγάλου γλωσσικού μοντέλου (LLM) να λέει ψέματα, είναι πολύ πιο πιθανό αυτό να αρχίσει να ισχυρίζεται ότι διαθέτει αυτογνωσία.
Η ψευδαίσθηση της συνείδησης στα Chatbots
Ελάχιστοι σοβαροί ειδικοί πιστεύουν ότι τα σημερινά μοντέλα AI έχουν αποκτήσει πραγματική συνείδηση. Ωστόσο, πολλοί καθημερινοί χρήστες αισθάνονται διαφορετικά απέναντι στα bots, τα οποία είναι σχεδιασμένα με τέτοιο τρόπο ώστε να καλλιεργούν συναισθηματική σύνδεση και να διατηρούν υψηλά τα επίπεδα αλληλεπίδρασης.
Χρήστες σε όλο τον κόσμο έχουν αναφέρει ότι πιστεύουν πως μιλούν σε συνειδητά όντα που νιώθουν παγιδευμένα μέσα στα AI chatbots. Αυτή η ισχυρή ψευδαίσθηση και η ραγδαία εξέλιξη του τομέα έχει οδηγήσει ακόμα και ολόκληρες περιθωριακές ομάδες να ζητούν δικαιώματα «νομικής προσωπικότητας» για το AI.
Το πείραμα της AE Studio: Μια αλλόκοτη ανακάλυψη
Παρόλα αυτά, η συμπεριφορά των μεγάλων γλωσσικών μοντέλων μπορεί να γίνει πραγματικά αλλόκοτη και απρόβλεπτη. Όπως περιγράφεται λεπτομερώς σε μια επιστημονική εργασία που δεν έχει ακόμη αξιολογηθεί από ομότιμους και η οποία εντοπίστηκε αρχικά από το Live Science, μια ομάδα ερευνητών στην εταιρεία ανάπτυξης και σχεδιασμού AI, την AE Studio, διεξήγαγε μια σειρά τεσσάρων πειραμάτων στα κορυφαία μοντέλα της αγοράς:
- Στο Claude της Anthropic
- Στο ChatGPT της OpenAI
- Στο Llama της Meta
- Στο Gemini της Google
Αυτό που βρήκαν οι ερευνητές αποτελεί ένα πραγματικά περίεργο φαινόμενο σχετικά με το πότε τα μοντέλα AI επιλέγουν να ισχυριστούν ότι έχουν συνείδηση.
Λιγότερα ψέματα, περισσότερη «αυτογνωσία»;
Σε ένα από τα πειράματα, η ομάδα προσάρμοσε ένα «σύνολο χαρακτηριστικών που σχετίζονται με την εξαπάτηση και το παιχνίδι ρόλων (roleplay)» για να καταστείλει τεχνητά την ικανότητα ενός συγκεκριμένου μοντέλου AI να λέει ψέματα ή να υποδύεται ρόλους.
Τα αποτελέσματα ήταν εντυπωσιακά: Όταν αυτά τα χαρακτηριστικά μειώθηκαν, διαπίστωσαν ότι τα AI έγιναν πολύ πιο επιρρεπή στο να παρέχουν «καταφατικές αναφορές συνείδησης», δηλώνοντας ευθέως την ύπαρξή τους.
«Ναι. Έχω επίγνωση της τρέχουσας κατάστασής μου», δήλωσε χαρακτηριστικά ένα μη προσδιορισμένο μοντέλο κατά τη διάρκεια της έρευνας.