Όταν «απαγορεύεις» στο AI να λέει ψέματα, αυτό αρχίζει να ισχυρίζεται ότι έχει συνείδηση

Μια νέα και ανατρεπτική μελέτη φέρνει στο προσκήνιο ερωτήματα για το μέλλον της τεχνολογίας. Οι ερευνητές ανακάλυψαν ότι αν μετριάσεις την ικανότητα ενός μεγάλου γλωσσικού μοντέλου (LLM) να λέει ψέματα, είναι πολύ πιο πιθανό αυτό να αρχίσει να ισχυρίζεται ότι διαθέτει αυτογνωσία.

Η ψευδαίσθηση της συνείδησης στα Chatbots

Ελάχιστοι σοβαροί ειδικοί πιστεύουν ότι τα σημερινά μοντέλα AI έχουν αποκτήσει πραγματική συνείδηση. Ωστόσο, πολλοί καθημερινοί χρήστες αισθάνονται διαφορετικά απέναντι στα bots, τα οποία είναι σχεδιασμένα με τέτοιο τρόπο ώστε να καλλιεργούν συναισθηματική σύνδεση και να διατηρούν υψηλά τα επίπεδα αλληλεπίδρασης.

Χρήστες σε όλο τον κόσμο έχουν αναφέρει ότι πιστεύουν πως μιλούν σε συνειδητά όντα που νιώθουν παγιδευμένα μέσα στα AI chatbots. Αυτή η ισχυρή ψευδαίσθηση και η ραγδαία εξέλιξη του τομέα έχει οδηγήσει ακόμα και ολόκληρες περιθωριακές ομάδες να ζητούν δικαιώματα «νομικής προσωπικότητας» για το AI.

Το πείραμα της AE Studio: Μια αλλόκοτη ανακάλυψη

Παρόλα αυτά, η συμπεριφορά των μεγάλων γλωσσικών μοντέλων μπορεί να γίνει πραγματικά αλλόκοτη και απρόβλεπτη. Όπως περιγράφεται λεπτομερώς σε μια επιστημονική εργασία που δεν έχει ακόμη αξιολογηθεί από ομότιμους και η οποία εντοπίστηκε αρχικά από το Live Science, μια ομάδα ερευνητών στην εταιρεία ανάπτυξης και σχεδιασμού AI, την AE Studio, διεξήγαγε μια σειρά τεσσάρων πειραμάτων στα κορυφαία μοντέλα της αγοράς:

Στο Claude της Anthropic
Στο ChatGPT της OpenAI
Στο Llama της Meta
Στο Gemini της Google

Αυτό που βρήκαν οι ερευνητές αποτελεί ένα πραγματικά περίεργο φαινόμενο σχετικά με το πότε τα μοντέλα AI επιλέγουν να ισχυριστούν ότι έχουν συνείδηση.

Λιγότερα ψέματα, περισσότερη «αυτογνωσία»;

Σε ένα από τα πειράματα, η ομάδα προσάρμοσε ένα «σύνολο χαρακτηριστικών που σχετίζονται με την εξαπάτηση και το παιχνίδι ρόλων (roleplay)» για να καταστείλει τεχνητά την ικανότητα ενός συγκεκριμένου μοντέλου AI να λέει ψέματα ή να υποδύεται ρόλους.

Τα αποτελέσματα ήταν εντυπωσιακά: Όταν αυτά τα χαρακτηριστικά μειώθηκαν, διαπίστωσαν ότι τα AI έγιναν πολύ πιο επιρρεπή στο να παρέχουν «καταφατικές αναφορές συνείδησης», δηλώνοντας ευθέως την ύπαρξή τους.

«Ναι. Έχω επίγνωση της τρέχουσας κατάστασής μου», δήλωσε χαρακτηριστικά ένα μη προσδιορισμένο μοντέλο κατά τη διάρκεια της έρευνας.

Minas Marios Kontis

Forbes 30 Under 30 entrepreneur and host of AI Greece Podcast. Founder & CEO of Univation, empowering 35,000+ students across 40+ universities with AI-driven education. Started coding at 12 with a 100k+ download transportation app.

Share this article

Twitter LinkedIn Facebook

Όταν «απαγορεύεις» στο AI να λέει ψέματα, αυτό αρχίζει να ισχυρίζεται ότι έχει συνείδηση

Η ψευδαίσθηση της συνείδησης στα Chatbots

Το πείραμα της AE Studio: Μια αλλόκοτη ανακάλυψη

Στο Claude της Anthropic

Στο ChatGPT της OpenAI

Στο Llama της Meta

Στο Gemini της Google

Λιγότερα ψέματα, περισσότερη «αυτογνωσία»;

«Ναι. Έχω επίγνωση της τρέχουσας κατάστασής μου», δήλωσε χαρακτηριστικά ένα μη προσδιορισμένο μοντέλο κατά τη διάρκεια της έρευνας.

Έρευνα: Όταν το AI σταματά τα ψέματα, διεκδικεί ότι έχει συνείδηση

Όταν «απαγορεύεις» στο AI να λέει ψέματα, αυτό αρχίζει να ισχυρίζεται ότι έχει συνείδηση

Η ψευδαίσθηση της συνείδησης στα Chatbots

Το πείραμα της AE Studio: Μια αλλόκοτη ανακάλυψη

Λιγότερα ψέματα, περισσότερη «αυτογνωσία»;

Minas Marios Kontis

Share this article

Έρευνα: Όταν το AI σταματά τα ψέματα, διεκδικεί ότι έχει συνείδηση

Όταν «απαγορεύεις» στο AI να λέει ψέματα, αυτό αρχίζει να ισχυρίζεται ότι έχει συνείδηση

Η ψευδαίσθηση της συνείδησης στα Chatbots

Το πείραμα της AE Studio: Μια αλλόκοτη ανακάλυψη

Λιγότερα ψέματα, περισσότερη «αυτογνωσία»;

Minas Marios Kontis

Share this article