Τι ακριβώς μπορεί να κάνει μέχρι στιγμής το Gen-2 της εταιρείας τεχνητής νοημοσύνης, Runway


Μετά το παγκόσμιο φαινόμενο του ChatGPT που μας έβαλε για τα καλά στο νόημα της χρήσης της τεχνητής νοημοσύνης στην καθημερινότητά μας, φαίνεται πως ένα νέο πρόγραμμα είναι έτοιμο να πάει ένα βήμα παρακάτω, δημιουργώντας βάσει της εν λόγω τεχνολογίας ολόκληρα βίντεο! Ο λόγος για το Gen-2 της Runway, μιας νεοσύστατης εταιρίας τεχνητής νοημοσύνης με έδρα τη Νέα Υόρκη, η οποία και ανακοίνωσε ένα νέο μοντέλο της εφαρμογής που μπορεί να παράγει βίντεο από κείμενο χρησιμοποιώντας τεχνητή νοημοσύνη.

Το Gen-2 και είναι μια βελτιωμένη έκδοση του προηγούμενου μοντέλου, του Gen-1, το οποίο μπορούσε μόνο να μετασχηματίσει ήδη υπάρχοντα βίντεο με βάση εισόδους κειμένου ή και εικόνας. Αυτή τη φορά, το Gen-2 μπορεί να δημιουργήσει από το μηδέν βίντεο διάρκειας έως και τριών δευτερολέπτων, ακολουθώντας οποιαδήποτε περιγραφή κειμένου του χρήστη και χωρίς να απαιτείται κάποιο προϋπάρχον βίντεο ή εικόνα αναφοράς.

Η Runway ανέπτυξε το Gen-2 χρησιμοποιώντας μια μέθοδο γνωστή ως diffusion και το εκπαίδευσε χρησιμοποιώντας ένα ευρύ σύνολο δεδομένων εικόνων και βίντεο. Η εταιρεία δημοσίευσε μάλιστα ένα ακαδημαϊκό paper που περιγράφει λεπτομερώς τις τεχνικές ανάπτυξης της εφαρμογής, ενώ για την ώρα το έκανε διαθέσιμο στο Discord με λίστα αναμονής για τη χρήση του.

Σκοπός της Runway είναι να χρησιμοποιηθεί η εφαρμογή της από παραγωγούς περιεχομένου για την παρουσίαση διαφόρων projects και για τις ανάγκες στησίματος storyboarding στο πλαίσιο της εκπαίδευσης.

Εταιρείες όπως οι Meta και Google έχουν ήδη δημοσιεύσει διάφορα ερευνητικά papers σχετικά με αντίστοιχα μοντέλα τεχνητής νοημοσύνης, χωρίς ωστόσο να έχουν παρουσιάσει για την ώρα κάποιο ολοκληρωμένο ή developing προϊόν.

Δείτε το σχετικό βίντεο για το Gen-2 της Runway: