
Η Adobe αντιμέτωπη με νέα αγωγή: Κατηγορείται ότι εκπαίδευσε το AI της με πειρατικά βιβλία
Όπως κάθε εταιρεία που ηγείται στην τεχνολογική εξέλιξη, έτσι και η Adobe έχει επενδύσει σημαντικά στο AI τα τελευταία χρόνια, ακολουθώντας τον δρόμο της καινοτομίας. Η εταιρεία λογισμικού έχει λανσάρει διάφορες προηγμένες υπηρεσίες AI από το 2023, με κορυφαίο παράδειγμα το Firefly — τη δημοφιλή σουίτα δημιουργίας πολυμέσων που τροφοδοτείται από τεχνητή νοημοσύνη.
Τώρα, ωστόσο, η απόλυτη αφοσίωση της εταιρείας στην τεχνολογία αυτή φαίνεται να την έχει οδηγήσει σε νομικούς μπελάδες. Μια νέα δικαστική διαμάχη έρχεται στο προσκήνιο, καθώς μια αγωγή ισχυρίζεται ότι η εταιρεία χρησιμοποίησε πειρατικά βιβλία για την εκπαίδευση ενός από τα μοντέλα AI της, εγείροντας σοβαρά ερωτήματα για τα πνευματικά δικαιώματα.
Η Ομαδική Αγωγή και το μοντέλο SlimLM
Συγκεκριμένα, μια προτεινόμενη ομαδική αγωγή (class-action lawsuit) που κατατέθηκε εκ μέρους της Elizabeth Lyon, μιας συγγραφέως από το Oregon, ισχυρίζεται ότι η Adobe χρησιμοποίησε πειρατικές εκδόσεις πολυάριθμων βιβλίων — συμπεριλαμβανομένων των δικών της — για την εκπαίδευση του προγράμματος SlimLM της εταιρείας.
Η Adobe περιγράφει το SlimLM ως μια σειρά μικρών γλωσσικών μοντέλων που μπορούν να «βελτιστοποιηθούν για εργασίες βοήθειας εγγράφων σε κινητές συσκευές». Η εταιρεία αναφέρει ότι το SlimLM προ-εκπαιδεύτηκε στο SlimPajama-627B, ένα «αποδιπλασιασμένο, πολυ-σωματιακό (multi-corpora), ανοιχτού κώδικα σύνολο δεδομένων» που κυκλοφόρησε από την Cerebras τον Ιούνιο του 2023.
Η Lyon, η οποία έχει γράψει διάφορους οδηγούς για τη συγγραφή μη λογοτεχνικών βιβλίων, υποστηρίζει σθεναρά ότι ορισμένα από τα έργα της συμπεριλήφθηκαν παράνομα σε ένα σύνολο δεδομένων προ-εκπαίδευσης που αξιοποίησε η Adobe.
Η «απαγορευμένη» σύνδεση με Books3 και RedPajama
Η αγωγή της Lyon, η οποία αναφέρθηκε αρχικά από το ειδησεογραφικό πρακτορείο Reuters, αποκαλύπτει ότι τα γραπτά της συμπεριλήφθηκαν σε ένα επεξεργασμένο υποσύνολο ενός «χειραγωγημένου» συνόλου δεδομένων, το οποίο αποτέλεσε τη βάση του προγράμματος της Adobe. Η υπόθεση φωτίζει το πώς λειτουργούν τα datasets πίσω από το AI:
«Το σύνολο δεδομένων SlimPajama δημιουργήθηκε με την αντιγραφή και τον χειρισμό του συνόλου δεδομένων RedPajama (συμπεριλαμβανομένης της αντιγραφής του Books3). Έτσι, επειδή είναι παράγωγο αντίγραφο του συνόλου δεδομένων RedPajama, το SlimPajama περιέχει το σύνολο δεδομένων Books3, συμπεριλαμβανομένων των προστατευόμενων με πνευματικά δικαιώματα έργων της Ενάγουσας και των μελών της Ομάδας.»
Ένα ευρύτερο πρόβλημα για τις Tech Εταιρείες και το μέλλον του AI
Το «Books3» — μια τεράστια συλλογή 191.000 βιβλίων που έχουν χρησιμοποιηθεί για την εκπαίδευση συστημάτων genAI — αποτελεί συνεχή πηγή νομικών προβλημάτων για την παγκόσμια τεχνολογική κοινότητα. Το RedPajama έχει επίσης αναφερθεί σε διάφορες δικαστικές υποθέσεις, δείχνοντας ότι το ζήτημα είναι συστημικό.
- Τον Σεπτέμβριο, μια παρόμοια αγωγή κατά της Apple ισχυρίστηκε ότι η εταιρεία είχε χρησιμοποιήσει υλικό με πνευματικά δικαιώματα για την εκπαίδευση του μοντέλου Apple Intelligence.
- Η δικαστική διαμάχη ανέφερε το συγκεκριμένο σύνολο δεδομένων και κατηγόρησε την τεχνολογική εταιρεία για αντιγραφή προστατευμένων έργων.
Η έκβαση αυτών των υποθέσεων αναμένεται να καθορίσει το μέλλον της ανάπτυξης του AI και τον τρόπο με τον οποίο οι εταιρείες θα προσεγγίζουν τα πνευματικά δικαιώματα στην ψηφιακή εποχή.