Οι γεννήτριες εικόνων AI έχουν βάλει τους ιστορικούς τέχνης σε μια αντιπαράθεση, καθώς περισσότεροι καλλιτέχνες χρησιμοποιούν αυτά τα εργαλεία για να ανανεώσουν την πρακτική τους. «Είναι οι φωτογραφίες πραγματική τέχνη;» μουρμούρισαν τον 19ο Αιώνα. «Θεέ μου, μισώ αυτόν τον τύπο του Πόλοκ», φώναξαν βλέποντας έναν πιτσιλισμένο καμβά που ο καλλιτέχνης φαινομενικά δεν άγγιξε ποτέ. Δεν είναι λοιπόν περίεργο που οι δημιουργοί AI έχουν βάλει τους ιστορικούς τέχνης σε αντιπαράθεση, καθώς περισσότεροι καλλιτέχνες χρησιμοποιούν αυτά τα εργαλεία για να ενημερώσουν την πρακτική τους. Λατρεύω να βουτάω σε αυτό που κάνει το αίμα των ανθρώπων να βράζει στον κόσμο της τέχνης και αυτό το καλοκαίρι η τεχνητή νοημοσύνη εισήλθε στο leaderboard των ερεθιστικών. Μα γιατί? Και τι μπορεί να μας διδάξει για την ιστορία της τέχνης και την οπτική κατανάλωση; Το DALL-E 2, ένα πρόγραμμα δημιουργίας κειμένου σε εικόνα τεχνητής νοημοσύνης, κυκλοφόρησε ζωντανά στο κοινό αυτό το φθινόπωρο. Η αρχική έκδοση του μοντέλου - που πήρε το όνομα του από το αξιαγάπητο ρομπότ WALL-E της Disney του 2008 και τον σουρεαλιστή καλλιτέχνη Salvador Dalí - κυκλοφόρησε τον Ιανουάριο του 2021 από το ερευνητικό εργαστήριο OpenAI. Μια έκδοση της τεχνολογίας, το DALL-E Mini, κυκλοφόρησε νωρίς στην πλατφόρμα Hugging Face, κατακτώντας το Twitter ως αίσθηση meme και φέρνοντας το πρόγραμμα στο διεθνές ενδιαφέρον πέρα από τους ειδικούς της τεχνητής νοημοσύνης. Πάνω από 1,5 εκατομμύρια χρήστες δημιουργούν περισσότερες από 2 εκατομμύρια εικόνες την ημέρα με το DALL-E. Το DALL-E 2 χρησιμοποιεί το μοντέλο «GPT-3» του CLIP (Contrastive Language-Image Pre-Training, που ανακοινώθηκε από το OpenAI πέρυσι), ένα σύστημα υπολογιστικής όρασης, για τη δημιουργία εικόνων 1024×1024 pixel από πληκτρολογημένα μηνύματα κειμένου. Το εργαλείο εκπαιδεύτηκε χρησιμοποιώντας 650 εκατομμύρια ζεύγη εικόνων και λεζάντες που ελήφθησαν από το Διαδίκτυο. Αφού συνέλεξαν ζεύγη εικόνας-κειμένου, οι ερευνητές εκπαίδευσαν το μοντέλο CLIP να δημιουργεί κείμενο για να περιγράψει με ακρίβεια μια εικόνα, δημιουργώντας ένα μαθηματικά εξαρτώμενο μοντέλο. Στη συνέχεια, το DALL-E αντέστρεψε αυτή τη διαδικασία, δημιουργώντας εικόνες που περιγράφονται καλά από εισαγωγές κειμένου με βάση τα δεδομένα του CLIP. Οι χρήστες μπορούν επίσης να χρησιμοποιήσουν το DALL-E 2 για να "ζωγραφίσουν" εικόνες — επεκτείνοντας τις προϋπάρχουσες εικόνες πέρα από τα προηγούμενα σύνορά τους — και για να επεξεργαστούν μια προϋπάρχουσα εικόνα χρησιμοποιώντας εντολές κειμένου. Όταν εισάγετε το αίτημά σας για το DALL-E 2, σας δίνεται η οδηγία να «ξεκινήσετε με μια λεπτομερή περιγραφή» και το παράδειγμα «μιας ιμπρεσιονιστικής ελαιογραφίας με ηλίανθους σε μωβ βάζο». Αλλά, τι πραγματικά «καταλαβαίνει» το DALL-E 2 από το στυλ των ιμπρεσιονιστών; Ή κάποιο καλλιτεχνικό ύφος ή κίνηση, εν προκειμένω; Χρησιμοποιώντας την ίδια προτροπή «μια ντομάτα που σκαρφαλώνει σε μια σκάλα δίπλα στη θάλασσα» δοκίμασα την τέχνη του DALL-E 2. Για τους ιμπρεσιονιστές («Ένας ιμπρεσιονιστικός πίνακας μιας ντομάτας που σκαρφαλώνει σε μια σκάλα δίπλα στη θάλασσα»), το DALL-E 2 φαίνεται να προσδιορίζει ότι είναι ένα στυλ που βασίζεται σε χαλαρές πινελιές και χρωματικές αντιθέσεις που δείχνουν την επίδραση του φωτός. Έκανε εκπληκτικά καλή δουλειά στο να επισημάνει τι σημαίνει τέχνη του «18ου αιώνα». Προσθέτοντας στοιχεία υφής στα πλάγια και δημιουργώντας μια πραγματικά περίεργη εικόνα. Αυτό που είναι επίσης ενδιαφέρον είναι ότι το DALL-E 2 αντιπροσώπευε πώς μοιάζουν σήμερα τα έργα τέχνης του 18ου αιώνα, με την χρωματική παλέτα τους να είναι θαμπωμένη από τον χρόνο. Η προσωπική μου αγαπημένη ήταν η ερμηνεία του DALL-E στο στυλ του Robert Mapplethorpe. Η μονόχρωμη εικόνα έδωσε στην ντομάτα μια εμφανώς πηγαία εμφάνιση, ένα σέξι νεύμα στις φιγούρες του Mapplethorpe. Η προτροπή «Γλυπτό του Χένρι Μουρ» με έκανε επίσης να χαμογελάσω. Υπήρχαν μερικά στυλ που ο DALL-E ήταν λιγότερο ικανός στην αναδημιουργία, όπως το De Stijl ή οι σουρεαλιστές. Κατάφερε να ερμηνεύσει το "Mondrian" στην προτροπή, προσθέτοντας ευθείες γραμμές που κόβουν την εικόνα. Αρκετά κοντά. Η ντομάτα του Γουόρχολ, επίσης, αιχμαλώτισε λίγη από την επιπεδότητα που σχετίζεται με τη δουλειά του και η κυβιστική προσπάθεια ήταν —κατά τόπους— γωνιακή. Το παιχνίδι με το DALL-E 2 θέτει δύο ερωτήματα: σε ποιο βαθμό αυτή η τεχνολογία μπορεί πραγματικά να «κατανοήσει» την τέχνη και είναι χρήσιμο να δούμε την ιστορία της τέχνης ποσοτικοποιημένη στο «μυαλό» μιας μηχανής; Ο Rinat Akhmetov, επικεφαλής προϊόντος στην εταιρεία συμβούλων Τεχνητής Νοημοσύνης Provectus είπε ότι ενώ το DALL-E 2 δεν έχει τη συναισθηματική ικανότητα ενός ανθρώπινου μελετητή, «το μοντέλο έχει δει περισσότερες εικόνες, πίνακες ζωγραφικής, στυλ κ.λπ., από τους περισσότερους ειδικούς της ανθρωπότητας». Είναι αλήθεια ότι το DALL-E 2 βελτιστοποίησε όντως εκατοντάδες δισεκατομμύρια παραμέτρους στην αναζήτησή του για γνώση, αλλά είναι σημαντικό να θυμόμαστε ότι οι εικόνες που κατανάλωνε δεν ήταν απαραίτητα «ουδέτερες». Όπως οι καλλιτέχνες προβάλλουν το βλέμμα τους στους καμβάδες τους, το DALL-E 2 έχει απορροφήσει ένα σύνολο δεδομένων χωρίς τις δικές του προκαταλήψεις. Ο José Lizarraga, ανώτερος σύμβουλος καινοτομίας για την Algorithmic Justice League, μας μίλησε για αυτό το θέμα του βλέμματος: «Αυτό που είναι εντυπωσιακό για την τέχνη που δημιουργείται από την τεχνητή νοημοσύνη είναι ότι εξαρτάται από συστήματα και ένα σύνολο οπτικών τεχνουργημάτων που εξακολουθούν να κεντρίζουν το λευκό ετεροφυλόφιλο ανδρικό βλέμμα — λόγω του ποιος εκπροσωπείται στον κόσμο του τεχνολογικού σχεδιασμού και της ανάπτυξης και ποιος επιμελείται το περιεχόμενο… Ομοίως, έχει αποδειχθεί ότι δημιουργεί προσβλητικές και ρατσιστικές εικόνες λόγω των αφιλτράριστων δεδομένων που χρησιμοποιεί η τεχνητή νοημοσύνη». Ο καθηγητής Sunil Manghani στο Πανεπιστήμιο του Σαουθάμπτον, ο οποίος πρόσφατα ξεκίνησε μια ομάδα ειδικού ενδιαφέροντος για τις Τέχνες και την Τεχνητή Νοημοσύνη, συμφωνεί. Οι προκαταλήψεις στο σύνολο δεδομένων δεν επηρεάζουν μόνο το βλέμμα που διαμορφώνεται από τις δημιουργίες του DALL-E 2, αλλά και την ακρίβειά του στην αναδημιουργία ορισμένων ειδών. «Θα υπάρξουν ιστορικές προκαταλήψεις», είπε ο Manghani σε μια συνέντευξη. «Τα πολύ πρώιμα έργα θα είναι πιθανότατα λιγότερο σε αφθονία, ενώ τα πολύ σύγχρονα έργα μπορεί επίσης να παραμορφωθούν (εν μέρει για λόγους πνευματικών δικαιωμάτων). Αυτό μας αφήνει στη «μέση» με ίσως υψηλή υπεροχή στυλ όπως ο ιμπρεσιονισμός, ο σουρεαλισμός και ο εξπρεσιονισμός». Πού πέφτει λοιπόν αυτή η τεχνολογία στη συνεχιζόμενη συγγραφή της ιστορίας της τέχνης; Ο Manghani δίνει μια εύστοχη μεταφορά για τη δημιουργία εικόνων του DALL-E 2: «Αν πετάξω ένα νόμισμα τρεις φορές και κερδίσω κα τις τρεις φορές, μπορεί να οδηγηθώ στο να σκεφτώ ότι υπάρχει μεγαλύτερη πιθανότητα να κερδίζω. Αλλά αν πετάξω το νόμισμα 1 εκατομμύριο φορές, θα είναι ξεκάθαρο ότι είναι 50/50. Ως εκ τούτου, τα μοντέλα διάχυσης εικόνας, ενώ είναι εξαιρετικά έξυπνα όσον αφορά τη μέθοδο λειτουργούν πραγματικά μόνο από προηγούμενες εικόνες. Με αυτή την έννοια, γιατί να τα προσθέσουμε στην ιστορία της τέχνης; Το DALL-E 2 ξαναφτιάχνει ό,τι ήταν πριν.» Ωστόσο, αυτές οι εικόνες — ενώ βασίζονται σε ένα σταθερό σύνολο δεδομένων από το παρελθόν — είναι νέες. Ο Maghani βλέπει την ουσία του ζητήματος ως αυτό που ορίζουμε την "ιστορία της τέχνης" ως εξής: "Εάν αντιμετωπίζετε [την ιστορία της τέχνης] ως πειθαρχία που πρέπει να αστυνομεύεται, τότε έχετε την τάση να απορρίψετε τις εικόνες του DALL-E 2. Εάν αντιμετωπίζετε την ιστορία της τέχνης ως απλώς την έκφραση μιας κοσμικής ιστορίας της δημιουργίας εικόνων (που πηγαίνει πίσω στις απαρχές του πολιτισμού), τότε λογικά θα πρέπει να αποδεχτείτε τώρα το DALL-E 2." Πολύ λίγο μετά την κυκλοφορία της τεχνολογίας στο Hugging Face, τα meme DALL-E σάρωσαν το διαδίκτυο. Μέσα σε δύο μήνες από την ανακοίνωση του DALL-E 2, η τεχνολογία χρησιμοποιήθηκε για την παραγωγή του πρώτου εξωφύλλου του περιοδικού Cosmopolitan που δημιουργήθηκε από AI. Μεγάλες επωνυμίες όπως η Heinz και η Nestlé έχουν επίσης αξιοποιήσει την τεχνολογία για διαφημιστικές καμπάνιες — η Nestlé επέλεξε μια ιδιαίτερα ιστορική οπτική της τέχνης, ξεπερνώντας τον πίνακα του Johannes Vermeer του 1657 The Milkmaid . Η τεχνολογία αρχίζει να εδραιώνεται βαθιά στην οπτική κουλτούρα. Ο καλλιτέχνης της τεχνητής νοημοσύνης Mario Klingemann επισημαίνει ότι η τάση του DALL-E για γνώση της τέχνης δεν είναι απαραίτητα ο απώτερος σκοπός του. «Νομίζω ότι η αναπαραγωγή στυλ τέχνης δεν είναι η αληθινή απαίτηση για αυτά τα μοντέλα ούτως ή άλλως», είπε σε συνέντευξή του. «Οι πραγματικές τους δυνατότητες έγκειται στο να μάθουν τι είναι σχετικό και σημαντικό σε όλες τις μορφές δημιουργίας εικόνων και αντίληψης και στη συνέχεια ελπίζουμε να [μας] επιτρέψουν να ανακαλύψουμε νέους τρόπους έκφρασης». Το DALL-E θα μπορούσε να γίνει καθοριστικό στην καλλιτεχνική εκπαίδευση και χωρίς αμφιβολία θα ενσωματωθεί στις πρακτικές των καλλιτεχνών. Ο Rishabh Misra, ανώτερος μηχανικός μηχανικής μάθησης στο Twitter, αναφέρει τις δυνατότητες της τεχνητής νοημοσύνης ως ανεξάρτητης μορφής τέχνης. «Η τεχνητή νοημοσύνη έχει αλλάξει δραστικά τη φύση των δημιουργικών διαδικασιών και διαταράσσει τη βιομηχανία της τέχνης. Το AI μπορεί να αντιμετωπιστεί ως μια δημιουργική οντότητα από μόνη της, ικανή να αναπαράγει πτυχές της δημιουργικής καλλιτεχνικής συμπεριφοράς και να αυξήσει την ανθρώπινη δημιουργικότητα». Η Aditya Ramesh, επικεφαλής ερευνητής στο έργο DALL-E, σχολίασε τη σημασία του DALL-E για τους λάτρεις της τέχνης: «Η τέχνη που δημιουργείται από την τεχνητή νοημοσύνη δημιουργεί την ευκαιρία για εξατομικευμένη παραγωγή τέχνης. Ο DALL·E μάς έχει δείξει ότι πολλοί άνθρωποι βρίσκουν αξία στη διαδικασία δημιουργίας τέχνης και ενασχόλησης με μια κοινότητα δημιουργών, ακόμα κι αν δεν έχουν λάβει επίσημη καλλιτεχνική κατάρτιση». Το αν οι εικόνες που δημιουργούνται μέσω του DALL-E έχουν εγγενή αξία ως αυτόνομα έργα τέχνης ανοίγει μια εντελώς διαφορετική συζήτηση. Αλλά το OpenAI έχει ήδη προβλέψει τις δυνατότητες του DALL-E ως δύναμης δημιουργίας εικόνων, εφαρμόζοντας κανονισμούς περιεχομένου και προληπτικά anti-deep fake χαρακτηριστικά, που σημαίνει ότι δεν μπορούν να δημιουργηθούν αναγνωρίσιμα πρόσωπα. Φαίνεται ότι για να βρεθεί μια οριστική απάντηση στο ποια είναι η θέση του DALL-E 2 στην ιστορία της τέχνης απαιτεί μια περιορισμένη άποψη του τι είναι ιστορία της τέχνης και μια αναγωγική κατανόηση των δυνατοτήτων της τεχνολογίας. Πηγή: hyperallergic
|