
InfiniMind: Πώς δύο πρώην στελέχη της Google αξιοποιούν τα "Dark Data" των βίντεο με τη δύναμη του AI
Στην εποχή της ψηφιακής πληροφορίας, οι σύγχρονες επιχειρήσεις παράγουν περισσότερο περιεχόμενο βίντεο από ποτέ, δημιουργώντας έναν τεράστιο όγκο δεδομένων. Από ιστορικά αρχεία εκπομπών δεκαετιών μέχρι χιλιάδες κάμερες ασφαλείας σε καταστήματα και αμέτρητες ώρες πλάνων παραγωγής, το υλικό είναι ατελείωτο.
Ωστόσο, το μεγαλύτερο μέρος αυτού του υλικού παραμένει "θαμμένο" και ανεκμετάλλευτο σε διακομιστές, χωρίς ποτέ να προβληθεί ή να αναλυθεί ουσιαστικά. Αυτό ακριβώς το κενό καλύπτουν τα Dark Data (σκοτεινά δεδομένα): ένας τεράστιος, αναξιοποίητος επιχειρηματικός πόρος που οι εταιρείες συλλέγουν αυτόματα, αλλά σπάνια χρησιμοποιούν για τη λήψη στρατηγικών αποφάσεων.
Η καινοτόμος λύση από το Τόκιο
Για την αποτελεσματική αντιμετώπιση αυτού του προβλήματος, ο Aza Kai (CEO) και ο Hiraku Yanagita (COO), δύο κορυφαία πρώην στελέχη της Google που συνεργάστηκαν για σχεδόν μια δεκαετία στην Google Japan, αποφάσισαν να δημιουργήσουν τη δική τους πρωτοποριακή λύση.
Το δίδυμο ίδρυσε την InfiniMind, μια πολλά υποσχόμενη startup με έδρα το Τόκιο. Η εταιρεία αναπτύσσει προηγμένες υποδομές που μετατρέπουν petabytes μη προβεβλημένου βίντεο και ήχου σε δομημένα, επιχειρηματικά δεδομένα, τα οποία είναι πλήρως αναζητήσιμα.
"Ο συνιδρυτής μου, ο οποίος πέρασε μια δεκαετία ηγούμενος λύσεων brand και δεδομένων στην Google Japan, και εγώ είδαμε αυτό το σημείο καμπής να έρχεται ενώ ήμασταν ακόμα στην Google," δήλωσε χαρακτηριστικά ο Kai.
Μέχρι το 2024, η τεχνολογία είχε ωριμάσει και η ζήτηση της αγοράς ήταν πλέον ξεκάθαρη, ωθώντας τους συνιδρυτές να προχωρήσουν στη δημιουργία της εταιρείας, φέρνοντας μια νέα εποχή στην ανάλυση δεδομένων.
Γιατί οι παλιές μέθοδοι απέτυχαν
Ο Kai, ο οποίος διαθέτει βαθιά εμπειρία από τη θητεία του στην Google Japan σε τομείς αιχμής όπως το cloud, η μηχανική μάθηση, τα διαφημιστικά συστήματα και τα μοντέλα πρότασης βίντεο, εξήγησε ότι οι τρέχουσες λύσεις επέβαλαν έναν σημαντικό συμβιβασμό.
Οι παλαιότερες τεχνολογικές προσεγγίσεις είχαν σοβαρούς περιορισμούς:
- Στατική ανάλυση: Μπορούσαν να τοποθετήσουν ετικέτες μόνο σε αντικείμενα μεμονωμένων καρέ.
- Έλλειψη ροής: Αδυνατούσαν να παρακολουθήσουν τη ροή της αφήγησης.
- Απουσία αιτιότητας: Δεν μπορούσαν να κατανοήσουν την αιτιότητα των γεγονότων.
- Περιορισμένη κατανόηση: Δεν ήταν σε θέση να απαντήσουν σε σύνθετες ερωτήσεις σχετικά με το συνολικό περιεχόμενο του βίντεο.
Για πελάτες με τεράστια αρχεία και petabytes πλάνων, ακόμη και οι πιο βασικές ερωτήσεις σχετικά με το περιεχόμενό τους παρέμεναν συχνά αναπάντητες, στερώντας τους πολύτιμη γνώση.
Η επανάσταση των Vision-Language Models και του AI
Αυτό που πραγματικά άλλαξε τα δεδομένα και έφερε την επανάσταση ήταν η ραγδαία πρόοδος στα vision-language models (μοντέλα όρασης-γλώσσας) μεταξύ του 2021 και του 2023. Σύμφωνα με τον Kai, τότε ήταν που το AI βίντεο άρχισε να εξελίσσεται πέρα από την απλή και στατική προσθήκη ετικετών σε αντικείμενα.
Οι παράγοντες που συνέβαλαν καθοριστικά σε αυτή την αλλαγή περιλαμβάνουν:
- Τη σημαντική πτώση του κόστους των μονάδων επεξεργασίας γραφικών (GPU).
- Τα ετήσια κέρδη απόδοσης της τάξης του 15–20% την τελευταία δεκαετία.
- Το σημαντικότερο: Την πρωτοφανή ικανότητα των νέων μοντέλων. Μέχρι πρότινος, τα μοντέλα απλά δεν διέθεταν την απαραίτητη ευφυΐα για να εκτελέσουν τέτοιες εργασίες.
Επενδυτικά νέα και μελλοντικές προοπτικές
Η InfiniMind επιβεβαίωσε τη δυναμική της εξασφαλίζοντας πρόσφατα χρηματοδότηση εκκίνησης ύψους $5.8 εκατομμυρίων, με επικεφαλής την UTEC. Αυτή η επενδυτική κίνηση υπογραμμίζει το τεράστιο ενδιαφέρον της αγοράς για καινοτόμες λύσεις που ξεκλειδώνουν την κρυμμένη αξία των δεδομένων βίντεο μέσω του προηγμένου AI.