Υπάρχει μια λέξη που επιστρέφει σαν επωδός κάθε φορά που μιλάμε για την τεχνητή νοημοσύνη: δεδομένα. Χωρίς αυτά τα μεγαλύτερα γλωσσικά μοντέλα δεν είναι τίποτα παραπάνω από άδεια δοχεία. Όσο περισσότερα δεδομένα έχουν, τόσο πιο “έξυπνα” φαίνονται. Μέχρι τώρα οι εταιρείες τεχνητής νοημοσύνης λειτούργησαν σαν ακρίδες πάνω στο διαδίκτυο: άρθρα, βιβλία, φωτογραφίες, βίντεο, συνομιλίες. Ό,τι μπορούσε να “κατέβει”, έγινε τροφή. Όμως η δεξαμενή στερεύει. Το διαδίκτυο δεν παράγει πια την “καθαρή” πρώτη ύλη που χρειάζονται για να κάνουν το επόμενο βήμα και τότε έρχεται η στροφή: ο πραγματικός κόσμος. 

Τους τελευταίους μήνες παρακολουθούμε έναν άγριο αγώνα δρόμου. Η OpenAI, η Google, η Perplexity δεν φτιάχνουν απλώς νέα μοντέλα. Κυνηγούν νέες πηγές δεδομένων. Αυτά που δεν μπορείς να “ξύνεις” από μια ιστοσελίδα, αλλά που γεννιούνται καθημερινά από συναλλαγές, συνήθειες, αναζητήσεις, μικρές κινήσεις που προδίδουν τις ζωές μας. Κι αυτό σημαίνει συνεργασίες, συμφωνίες, δώρα στους χρήστες που στην πραγματικότητα πληρώνονται με το πιο πολύτιμο νόμισμα: τα δεδομένα τους. 

Η OpenAI υπέγραψε συμφωνίες με κολοσσούς του ηλεκτρονικού εμπορίου όπως η Shopee και η Shopify. Η Google και η Perplexity μοίρασαν “δωρεάν” πρόσβαση σε προηγμένα εργαλεία στην Ινδία, εκεί όπου το κοινό είναι νεανικό, τεχνολογικά ώριμο και με τεράστια διείσδυση κινητών. Ο στόχος ξεκάθαρος: να συλλέξουν δομημένα δεδομένα καταναλωτών. Να μάθουν πώς αναζητούν ένα προϊόν, πώς φτάνουν στο καλάθι, ποιο κουμπί πατούν λίγο πριν την αγορά. Είναι πληροφορίες-χρυσός για υπηρεσίες εξατομίκευσης, fintech εφαρμογές ή ακόμα και για υγεία. 

Ένας ερευνητής το έθεσε απλά: «Αυτά τα δεδομένα θα τους δώσουν πιο πλούσια σύνολα, πιο πολύτιμα, που θα κάνουν τα μοντέλα πιο ακριβή και πιο δημιουργικά». Ουσιαστικά οι εταιρείες AI προσπαθούν να μιμηθούν τον τρόπο που μαθαίνει ο εγκέφαλος: όχι από τη θεωρία, αλλά από την εμπειρία. 

Η Κίνα έχει ήδη δείξει τον δρόμο. Χρησιμοποίησε το εθνικό σύστημα υγείας που καλύπτει πάνω από 600 εκατομμύρια πολίτες ως απίστευτη δεξαμενή εκπαίδευσης για εφαρμογές στην ανακάλυψη φαρμάκων. Το αποτέλεσμα; Συμφωνίες δισεκατομμυρίων με φαρμακευτικούς γίγαντες όπως η AstraZeneca και η Pfizer. Η Δύση αρχίζει τώρα να καταλαβαίνει ότι χωρίς πραγματικά, τοπικά, “βρώμικα” δεδομένα, τα μοντέλα τους θα παραμείνουν έξυπνα μόνο στα χαρτιά. 

Η στρατηγική αποδίδει ήδη. Στην Ινδία όταν η Perplexity ανακοίνωσε συνεργασία με την Bharti Airtel, οι λήψεις της εφαρμογής της εκτοξεύτηκαν από 790.000 σε πάνω από 6,6 εκατομμύρια. Οι χρήστες έσπευσαν να δοκιμάσουν το “δωρεάν εργαλείο”. Ένας νεαρός data scientist το είπε ξεκάθαρα: «Δεν με νοιάζει που μαζεύουν τα δεδομένα μου. Δεν είναι ευαίσθητα». Δεν ήξερε καν ότι μπορούσε να απενεργοποιήσει τη συλλογή. Να, λοιπόν, το μυστικό: το “δωρεάν” στην τεχνητή νοημοσύνη σχεδόν πάντα σημαίνει ότι πληρώνεις με τα δεδομένα σου. 

Εκεί που οι χρήστες ενθουσιάζονται, οι ειδικοί ανησυχούν, γιατί πίσω από όλα αυτά κρύβεται το ζήτημα της κυριαρχίας των δεδομένων. Χώρες όπως η Ινδία, η Νιγηρία, η Νότια Αφρική απαιτούν τα δεδομένα των πολιτών τους να αποθηκεύονται τοπικά. Δεν θέλουν να γίνουν απλοί “τροφοδότες” για τα παγκόσμια μοντέλα χωρίς αντάλλαγμα. Θέλουν προστασία, ισοτιμία, έλεγχο. «Χρειάζονται ισχυρά πλαίσια εποπτείας για να αποφύγουμε προκαταλήψεις και καταχρήσεις» προειδοποιεί χαρακτηριστικά ένας ειδικός. 

Η μάχη έχει πάρει ήδη παράξενες διαστάσεις. Στις 12 Αυγούστου η Perplexity σόκαρε την αγορά όταν ανακοίνωσε ότι προσφέρει 34,5 δισεκατομμύρια δολάρια για να αγοράσει τον Chrome της Google, ένα ποσό σχεδόν διπλάσιο από τη δική της αποτίμηση. Ίσως να ήταν μπλόφα, ίσως επικοινωνιακό πυροτέχνημα, αλλά το μήνυμα ήταν σαφές: το πραγματικό γήπεδο όπου θα κριθεί η μάχη της τεχνητής νοημοσύνης δεν είναι οι αλγόριθμοι, αλλά η πρόσβαση στα δεδομένα. 

Γιατί τα δεδομένα δεν είναι ουδέτερα. Είναι οι ζωές μας: τα clicks, οι συνήθειες, οι αγορές, οι αναζητήσεις μας. Και όσο πιο βαθιά μπαίνουν οι εταιρείες σ’ αυτό το πεδίο, τόσο πιο επιτακτική γίνεται η ανάγκη να μιλήσουμε για δικαιώματα, για όρια, για διαφάνεια. Αλλιώς η υπόσχεση της τεχνητής νοημοσύνης μπορεί να καταλήξει σε μια νέα μορφή αποικιοκρατίας: οι πλούσιοι του Βορρά να αντλούν την πρώτη ύλη από τον Νότο, χωρίς να επιστρέφουν ποτέ την αξία που αποσπούν. 

Το μέλλον της τεχνητής νοημοσύνης δεν θα κριθεί μόνο στα εργαστήρια ή στα νούμερα των παραμέτρων. Θα κριθεί στο ποιος θα έχει το δικαίωμα να μαζεύει, να αποθηκεύει και να εκμεταλλεύεται τα δεδομένα του πραγματικού κόσμου. Κι αυτό είναι ένα στοίχημα ανοιχτό, αβέβαιο, γεμάτο εντάσεις. 

Το μεγάλο ερώτημα δεν είναι ποια εταιρεία θα φτιάξει τον πιο “έξυπνο” αλγόριθμο. Είναι ποια κοινωνία θα θέσει τα όρια σε έναν κόσμο όπου κάθε μας κίνηση μπορεί να γίνει υλικό εκπαίδευσης, γιατί τα δεδομένα δεν είναι απλώς καύσιμο για τις μηχανές. Είναι το αποτύπωμα της ανθρώπινης εμπειρίας και αν δεν το προστατεύσουμε, κινδυνεύουμε να μείνει κενό, δηλαδή σε μια ζωή παραδομένη στους αλγόριθμους που ξέρουν μόνο να εκμεταλλεύονται. 

*Με στοιχεία από Rest of World 


Υπάρχει μια λέξη που επιστρέφει σαν επωδός κάθε φορά που μιλάμε για την τεχνητή νοημοσύνη: δεδομένα. Χωρίς αυτά τα μεγαλύτερα γλωσσικά μοντέλα δεν είναι τίποτα παραπάνω από άδεια δοχεία. Όσο περισσότερα δεδομένα έχουν, τόσο πιο “έξυπνα” φαίνονται. Μέχρι τώρα οι εταιρείες τεχνητής νοημοσύνης λειτούργησαν σαν ακρίδες πάνω στο διαδίκτυο: άρθρα, βιβλία, φωτογραφίες, βίντεο, συνομιλίες. Ό,τι μπορούσε να “κατέβει”, έγινε τροφή. Όμως η δεξαμενή στερεύει. Το διαδίκτυο δεν παράγει πια την “καθαρή” πρώτη ύλη που χρειάζονται για να κάνουν το επόμενο βήμα και τότε έρχεται η στροφή: ο πραγματικός κόσμος. 

Τους τελευταίους μήνες παρακολουθούμε έναν άγριο αγώνα δρόμου. Η OpenAI, η Google, η Perplexity δεν φτιάχνουν απλώς νέα μοντέλα. Κυνηγούν νέες πηγές δεδομένων. Αυτά που δεν μπορείς να “ξύνεις” από μια ιστοσελίδα, αλλά που γεννιούνται καθημερινά από συναλλαγές, συνήθειες, αναζητήσεις, μικρές κινήσεις που προδίδουν τις ζωές μας. Κι αυτό σημαίνει συνεργασίες, συμφωνίες, δώρα στους χρήστες που στην πραγματικότητα πληρώνονται με το πιο πολύτιμο νόμισμα: τα δεδομένα τους. 

Η OpenAI υπέγραψε συμφωνίες με κολοσσούς του ηλεκτρονικού εμπορίου όπως η Shopee και η Shopify. Η Google και η Perplexity μοίρασαν “δωρεάν” πρόσβαση σε προηγμένα εργαλεία στην Ινδία, εκεί όπου το κοινό είναι νεανικό, τεχνολογικά ώριμο και με τεράστια διείσδυση κινητών. Ο στόχος ξεκάθαρος: να συλλέξουν δομημένα δεδομένα καταναλωτών. Να μάθουν πώς αναζητούν ένα προϊόν, πώς φτάνουν στο καλάθι, ποιο κουμπί πατούν λίγο πριν την αγορά. Είναι πληροφορίες-χρυσός για υπηρεσίες εξατομίκευσης, fintech εφαρμογές ή ακόμα και για υγεία. 

Ένας ερευνητής το έθεσε απλά: «Αυτά τα δεδομένα θα τους δώσουν πιο πλούσια σύνολα, πιο πολύτιμα, που θα κάνουν τα μοντέλα πιο ακριβή και πιο δημιουργικά». Ουσιαστικά οι εταιρείες AI προσπαθούν να μιμηθούν τον τρόπο που μαθαίνει ο εγκέφαλος: όχι από τη θεωρία, αλλά από την εμπειρία. 

Η Κίνα έχει ήδη δείξει τον δρόμο. Χρησιμοποίησε το εθνικό σύστημα υγείας που καλύπτει πάνω από 600 εκατομμύρια πολίτες ως απίστευτη δεξαμενή εκπαίδευσης για εφαρμογές στην ανακάλυψη φαρμάκων. Το αποτέλεσμα; Συμφωνίες δισεκατομμυρίων με φαρμακευτικούς γίγαντες όπως η AstraZeneca και η Pfizer. Η Δύση αρχίζει τώρα να καταλαβαίνει ότι χωρίς πραγματικά, τοπικά, “βρώμικα” δεδομένα, τα μοντέλα τους θα παραμείνουν έξυπνα μόνο στα χαρτιά. 

Η στρατηγική αποδίδει ήδη. Στην Ινδία όταν η Perplexity ανακοίνωσε συνεργασία με την Bharti Airtel, οι λήψεις της εφαρμογής της εκτοξεύτηκαν από 790.000 σε πάνω από 6,6 εκατομμύρια. Οι χρήστες έσπευσαν να δοκιμάσουν το “δωρεάν εργαλείο”. Ένας νεαρός data scientist το είπε ξεκάθαρα: «Δεν με νοιάζει που μαζεύουν τα δεδομένα μου. Δεν είναι ευαίσθητα». Δεν ήξερε καν ότι μπορούσε να απενεργοποιήσει τη συλλογή. Να, λοιπόν, το μυστικό: το “δωρεάν” στην τεχνητή νοημοσύνη σχεδόν πάντα σημαίνει ότι πληρώνεις με τα δεδομένα σου. 

Εκεί που οι χρήστες ενθουσιάζονται, οι ειδικοί ανησυχούν, γιατί πίσω από όλα αυτά κρύβεται το ζήτημα της κυριαρχίας των δεδομένων. Χώρες όπως η Ινδία, η Νιγηρία, η Νότια Αφρική απαιτούν τα δεδομένα των πολιτών τους να αποθηκεύονται τοπικά. Δεν θέλουν να γίνουν απλοί “τροφοδότες” για τα παγκόσμια μοντέλα χωρίς αντάλλαγμα. Θέλουν προστασία, ισοτιμία, έλεγχο. «Χρειάζονται ισχυρά πλαίσια εποπτείας για να αποφύγουμε προκαταλήψεις και καταχρήσεις» προειδοποιεί χαρακτηριστικά ένας ειδικός. 

Η μάχη έχει πάρει ήδη παράξενες διαστάσεις. Στις 12 Αυγούστου η Perplexity σόκαρε την αγορά όταν ανακοίνωσε ότι προσφέρει 34,5 δισεκατομμύρια δολάρια για να αγοράσει τον Chrome της Google, ένα ποσό σχεδόν διπλάσιο από τη δική της αποτίμηση. Ίσως να ήταν μπλόφα, ίσως επικοινωνιακό πυροτέχνημα, αλλά το μήνυμα ήταν σαφές: το πραγματικό γήπεδο όπου θα κριθεί η μάχη της τεχνητής νοημοσύνης δεν είναι οι αλγόριθμοι, αλλά η πρόσβαση στα δεδομένα. 

Γιατί τα δεδομένα δεν είναι ουδέτερα. Είναι οι ζωές μας: τα clicks, οι συνήθειες, οι αγορές, οι αναζητήσεις μας. Και όσο πιο βαθιά μπαίνουν οι εταιρείες σ’ αυτό το πεδίο, τόσο πιο επιτακτική γίνεται η ανάγκη να μιλήσουμε για δικαιώματα, για όρια, για διαφάνεια. Αλλιώς η υπόσχεση της τεχνητής νοημοσύνης μπορεί να καταλήξει σε μια νέα μορφή αποικιοκρατίας: οι πλούσιοι του Βορρά να αντλούν την πρώτη ύλη από τον Νότο, χωρίς να επιστρέφουν ποτέ την αξία που αποσπούν. 

Το μέλλον της τεχνητής νοημοσύνης δεν θα κριθεί μόνο στα εργαστήρια ή στα νούμερα των παραμέτρων. Θα κριθεί στο ποιος θα έχει το δικαίωμα να μαζεύει, να αποθηκεύει και να εκμεταλλεύεται τα δεδομένα του πραγματικού κόσμου. Κι αυτό είναι ένα στοίχημα ανοιχτό, αβέβαιο, γεμάτο εντάσεις. 

Το μεγάλο ερώτημα δεν είναι ποια εταιρεία θα φτιάξει τον πιο “έξυπνο” αλγόριθμο. Είναι ποια κοινωνία θα θέσει τα όρια σε έναν κόσμο όπου κάθε μας κίνηση μπορεί να γίνει υλικό εκπαίδευσης, γιατί τα δεδομένα δεν είναι απλώς καύσιμο για τις μηχανές. Είναι το αποτύπωμα της ανθρώπινης εμπειρίας και αν δεν το προστατεύσουμε, κινδυνεύουμε να μείνει κενό, δηλαδή σε μια ζωή παραδομένη στους αλγόριθμους που ξέρουν μόνο να εκμεταλλεύονται. 

*Με στοιχεία από Rest of World