Η Τεχνητή Νοημοσύνη έχει μπει για τα καλά στη ζωή του σύγχρονου ανθρώπου, ωστόσο φαίνεται πως ο ίδιος δεν έχει υπολογίσει το ενεργειακό κόστος που έχει η «τριβή» του με τις τεχνολογίες AI σε ό,τι αφορά το περιβάλλον.
Τη στιγμή που οι επιστήμονες κρούουν τον κώδωνα του κινδύνου ως προς την ανάγκη εξοικονόμησης ενέργειας, οι τεχνολογίες Τεχνητής Νοημοσύνης φαίνεται πως ακόμα κινούνται σε ένα ιδιαίτερα ενεργοβόρο μονοπάτι.
Το Liberal.gr μίλησε για το ζήτημα αυτό με τον Σπύρο Λιώλη, μέλος του Τεχνολογικού Συμβουλίου του Forbes και ανώτερο σύμβουλο της εταιρείας EYP MCF, με έδρα τη Νέα Υόρκη, που ασχολείται με το σχεδιασμό, την αρχιτεκτονική και την υλοποίηση εγκαταστάσεων Data Centers.
Συνέντευξη στον Χρήστο Θ. Παναγόπουλο
Κύριε Λιώλη, υπάρχει πλέον μια πληθώρα αναφορών στο Διαδίκτυο σχετικά με τις τεχνολογίες Τεχνητής Νοημοσύνης, όμως ακόμα κανείς δεν φαίνεται να έχει σκεφτεί τις συνέπειες που έχουν τα συστήματα AI στο περιβάλλον. Τι ακριβώς συμβαίνει; Ποιος είναι ο περιβαλλοντικός αντίκτυπος της Τεχνητής Νοημοσύνης;
Μια πρόσφατη συζήτηση με ηγέτες του κλάδου με οδήγησε να εξετάσω το περιβαλλοντικό κόστος του μοντέλου Παραγωγικής Τεχνητής Νοημοσύνης και τον αντίκτυπό του στις εγκαταστάσεις των κέντρων δεδομένων. Η έρευνά μου ξεκίνησε με την εισαγωγή προτροπών στον ίδιο τον πόρο:
Πόση ενέργεια του κέντρου δεδομένων σε κιλοβάτ (kW) καταναλώνει καθημερινά το ChatGPT για να απαντήσει σε τυπικά ερωτήματα χρηστών; Κατά μέσο όρο, σε πόσα ερωτήματα απαντά το ChatGPT;
ChatGPT: Δεν καταναλώνω ενέργεια άμεσα, καθώς υπάρχω αποκλειστικά σε διακομιστές υπολογιστών και χρησιμοποιώ την υπολογιστική ισχύ που παρέχουν οι εν λόγω διακομιστές για να παράγω απαντήσεις σε ερωτήματα χρηστών. [...] Ωστόσο, ορισμένες εκτιμήσεις δείχνουν ότι τα μεγάλα κέντρα δεδομένων μπορούν να καταναλώνουν από μερικά μεγαβάτ έως μερικές εκατοντάδες μεγαβάτ ενέργειας, ανάλογα με το μέγεθος και τη χρήση τους. [...] Ωστόσο, μπορώ να σας δώσω μια πρόχειρη εκτίμηση με βάση ορισμένες παραδοχές. [...] Έτσι, μια πολύ χονδρική προσέγγιση της κατανάλωσης ενέργειας για ένα μόνο πέρασμα προς τα εμπρός για την απάντηση ενός τυπικού ερωτήματος είναι περίπου 0,00085 κιλοβατώρες (kWh).
Η συνεχιζόμενη έρευνα επί του θέματος αποκάλυψε ορισμένα εκπληκτικά στοιχεία σχετικά με την ενεργειακή κατανάλωση του μοντέλου.
Σύμφωνα με ορισμένα μοντέλα, εκτιμάται ότι η εκπαίδευση του GPT-3 κατανάλωσε 1.287 μεγαβατώρες (MWh), οι οποίες εξέπεμψαν 552 τόνους ισοδύναμου διοξειδίου του άνθρακα (CO2e).
Το μοντέλο GPT-3, το οποίο έχει 175 δισεκατομμύρια παραμέτρους, μπορεί να απαιτήσει χιλιάδες τσιπ μονάδων επεξεργασίας γραφικών (GPU) (υπολογίζεται σε 30.000) και εκατομμύρια ώρες GPU για τη δημιουργία μιας μόνο απάντησης.
Ένας επιστήμονας δεδομένων υπολόγισε ότι μόνο τον Ιανουάριο του 2023 η κατανάλωση ηλεκτρικής ενέργειας του ChatGPT μπορεί να έφτανε τις 23.364.000 kWh. Πρόκειται για μια εντυπωσιακή χρήση ενέργειας από ένα και μόνο μοντέλο Παραγωγικής Τεχνητής Νοημοσύνης.
Μιλήσατε για την Παραγωγική Τεχνητή Νοημοσύνη. Ποια μοντέλα χρησιμοποιούνται ευρέως στις μέρες μας;
Υπάρχουν πολλές τεχνολογίες και μοντέλα Παραγωγικής Τεχνητής Νοημοσύνης που χρησιμοποιούνται σήμερα, όπως το DALL-E και το GPT-3, μεταξύ άλλων, και ενώ η τεχνολογία βρίσκεται ακόμη στα σπάργανα, αρχίζει να κάνει θραύση σε πολλούς κλάδους, όπως το μάρκετινγκ και τα μέσα ενημέρωσης, οι χρηματοπιστωτικές υπηρεσίες, τα παιχνίδια, τα 3D και τα βίντεο, η μόδα, τα υφάσματα και άλλες επιστήμες υλικών, για τη δημιουργία νέων σχεδίων και εμπειριών.
Η τεχνολογία επιτρέπει σε μηχανικούς, επιστήμονες, σχεδιαστές και καλλιτέχνες να πειραματιστούν γρήγορα με διαφορετικά στυλ, σύνθετα υλικά και υλικά, με αποτέλεσμα πιο δημιουργικά, αποδοτικά, φιλικά προς το περιβάλλον και εξατομικευμένα προϊόντα. Μαζί με τη δημιουργία και τη δοκιμή ψηφιακών διδύμων, η παραγωγική τεχνητή νοημοσύνη προβλέπεται να αποτελέσει μία από τις ταχύτερα αναπτυσσόμενες αγορές.
Ποιος είναι ο αντίκτυπος της Παραγωγικής Τεχνητής Νοημοσύνης στα Data Centers;
Ο αντίκτυπος της Παραγωγικής Τεχνητής Νοημοσύνης στα κέντρα δεδομένων θα είναι σημαντικός, καθώς τα συστήματα αυτά απαιτούν μεγάλες ποσότητες υπολογιστικής ισχύος και αποθήκευσης για την εκπαίδευση και τη δημιουργία νέου περιεχομένου, και η βάση της Παραγωγικής ΤΝ είναι ακριβώς αυτό - να αναλύει τεράστιες ποσότητες ιστορικών δεδομένων για τη δημιουργία νέου περιεχομένου, το οποίο με τη σειρά του μπορεί να χρησιμοποιηθεί στο μέλλον.
Καθώς τα κέντρα δεδομένων συνεχίζουν να εξελίσσονται και να επεκτείνονται, οι παραδοσιακές μέθοδοι του κύκλου ζωής του κέντρου δεδομένων ενδέχεται να μην επαρκούν πλέον. Το επίπεδο πολυπλοκότητας του περιβάλλοντος απαιτεί νέο τρόπο σκέψης. Η δημιουργική τεχνητή νοημοσύνη μεταμορφώνει τον τρόπο με τον οποίο σχεδιάζονται, λειτουργούν, βελτιστοποιούνται και συντηρούνται τα κέντρα δεδομένων. Τα ίδια τα οφέλη της Παραγωγικής ΤΝ μπορούν να χρησιμοποιηθούν για να φέρουν επανάσταση στον τρόπο με τον οποίο κατασκευάζονται και διαχειρίζονται τα κέντρα δεδομένων.
Τα κέντρα δεδομένων, επομένως, θα είναι τόσο ευεργέτης της Παραγωγικής ΤΝ, όσο και ωφελούμενος.
Πώς τα Data Centers καθιστούν δυνατή τη χρήση του μοντέλου Παραγωγικής Τεχνητής Νοημοσύνης;
Τα Data Centers υποστηρίζουν την Παραγωγική ΤΝ μέσω υπολογιστών υψηλής απόδοσης (HPC), φιλοξενώντας εξειδικευμένο υλικό, αποθήκευση δεδομένων και δικτύωση. Μία από τις μεγαλύτερες προκλήσεις που σχετίζονται με τη Παραγωγική ΤΝ είναι η ανάγκη για πόρους υψηλής υπολογιστικής έντασης, όπως οι GPU, για την επεξεργασία των τεράστιων όγκων δεδομένων που απαιτούνται για την αποτελεσματική εκπαίδευση αυτών των συστημάτων. Αυτό μπορεί να οδηγήσει σε σημαντική αύξηση της κατανάλωσης ενέργειας και των απαιτήσεων ψύξης για τα κέντρα δεδομένων, καθώς και στην ανάγκη για πιο προηγμένες υποδομές και δικτύωση για την αντιμετώπιση της αυξημένης ζήτησης.
Η δημιουργία σύγχρονης, ανθεκτικής υποδομής κέντρων δεδομένων HPC, η οποία είναι επίσης βελτιστοποιημένη για γενετικά φορτία εργασίας AI, παρέχει μια μεγάλη ευκαιρία στους φορείς εκμετάλλευσης Data Centers να καλύψουν αυτή τη εξειδικευμένη αγορά.
Οι πρώτοι που υιοθετούν το μοντέλο της Παραγωγικής ΤΝ είναι παίκτες στους τομείς της γενικής εφαρμογής. Οι τυπικές περιπτώσεις χρήσης περιλαμβάνουν βασική ή προηγμένη αναζήτηση και δημιουργία μέσων και εικόνων με βάση υπάρχοντα δημόσια δεδομένα από το Διαδίκτυο, όπως η δημιουργία εγγράφων, μηνυμάτων ηλεκτρονικού ταχυδρομείου εκστρατείας, ακόμη και κομμάτια ανταγωνιστικής πληροφόρησης.
Η πρώιμη υστερία της Παραγωγικής ΤΝ δίνει τώρα έδαφος σε πιο προσαρμοσμένες, βιομηχανικά εξειδικευμένες περιπτώσεις χρήσης σε όλους τους κλάδους, συμπεριλαμβανομένου του τομέα των αρχιτεκτονικών, κατασκευαστικών και τεχνικών υπηρεσιών (ACE). Αυτές οι περιπτώσεις χρήσης βασίζουν την Παραγωγική ΤΝ όχι μόνο στο διαδίκτυο, αλλά, ίσως το πιο σημαντικό, σε μεγάλα εσωτερικά σύνολα δεδομένων, βιβλιοθήκες γνώσεων και μόνιμους υπαλλήλους, μαζί με επαγγελματίες που σκέφτονται μπροστά στον οργανισμό.
Ενώ οι εγκαταστάσεις των κέντρων δεδομένων συχνά θεωρούνταν κτίρια αποθηκών που δεν είχαν ελκυστικό σχεδιασμό, σήμερα οι αρχιτέκτονες και οι μηχανικοί χρησιμοποιούν λύσεις Παραγωγικής Τεχνητής Νοημοσύνης, όπως το DALL-E και το Midjourney, για να σχεδιάσουν εννοιολογικές εικόνες κτιρίων για τα έργα τους. Σχέδια και σκίτσα που θα χρειάζονταν εβδομάδες για να δημιουργηθούν και ώρες υπολογισμού για να αποδοθούν, τώρα χρειάζονται μερικές πληκτρολογήσεις και κλικ και μπορούν να τροποποιηθούν επί τόπου.
Επιπλέον, η Παραγωγική Τεχνητή Νοημοσύνη μπορεί να αποφέρει οφέλη κατά τις φάσεις λεπτομερούς σχεδιασμού και κατασκευής, αναλύοντας τις επιλογές σχεδιασμού, καταναλώνοντας κριτήρια ως δεδομένα εισόδου (π.χ. Uptime Institute, IA-942 ή άλλες μηχανικές ηλεκτρικές εγκαταστάσεις (MEP)) και βελτιστοποιώντας τις εξόδους ψύξης ισχύος χώρου (SPC). Μπορεί επίσης να βοηθήσει με επιλογές χρονοπρογραμματισμού, διακίνησης υλικών, μηχανημάτων κατασκευής, όπως γερανοί, και να εκτελέσει σενάρια «what-if» (σ.σ. «τι θα γινόταν αν…;»), για να ελέγξει τις επιπτώσεις του χρονοπρογραμματισμού και να υποβάλει έκθεση σχετικά με την πρόοδο σε σχέση με το προγραμματισμένο, να εντοπίσει καθυστερήσεις στην αλυσίδα εφοδιασμού και ακόμη και να συστήσει βήματα ανάκαμψης ή ταχείας υλοποίησης.
Ποιο είναι το μέλλον της Τεχνητής Νοημοσύνης σε οικονομικό επίπεδο;
Σύμφωνα με την εταιρεία ερευνών αγοράς MarketsandMarkets, η παγκόσμια αγορά Τεχνητής Νοημοσύνης αναμένεται να αυξηθεί από 11,3 δισ. δολάρια το 2023 σε 51,8 δισ. δολάρια έως το 2028, με σύνθετο ετήσιο ρυθμό ανάπτυξης 35,6% κατά τη διάρκεια της περιόδου πρόβλεψης.
Μεγάλο μέρος αυτής της ανάπτυξης μπορεί να αποδοθεί στην Παραγωγική ΤΝ, ή στα συστήματα που μπορούν να παράγουν νέο περιεχόμενο, όπως κείμενο, εικόνες ή ήχους, σε απάντηση σε προτροπές που δίνονται από τους χρήστες - σε σχέση με την Προγνωστική ΤΝ, η οποία παρέχει απαντήσεις ή προβλέψεις με βάση τα υπάρχοντα δεδομένα.
Στην πραγματικότητα, δεν υπάρχουν πολλές συζητήσεις που κάνω σήμερα, είτε επαγγελματικές είτε ψυχαγωγικές, που να μην αναφέρουν το ChatGPT της Open AI, μία από τις τελευταίες εξελίξεις στον τομέα της Παραγωγικής Τεχνητής Νοημοσύνης. Τα θέματα ποικίλλουν από το πώς χρησιμοποιείται για τη σύνταξη μηνυμάτων ηλεκτρονικού ταχυδρομείου και μηνυμάτων, τον προγραμματισμό εκδηλώσεων και διακοπών ή απλώς για διασκέδαση.
Έχει περιορισμούς η Παραγωγική Τεχνητή Νοημοσύνη; Πόσο εύλογα είναι τα σενάρια περί παραγκωνισμού του σύγχρονου ανθρώπου;
Παρόλο που η Παραγωγική Τεχνητή Νοημοσύνη είναι μια ισχυρή τεχνολογία για τη βελτιστοποίηση πολλών πτυχών των εγκαταστάσεων του κέντρου δεδομένων, έχει τους δικούς της περιορισμούς και μειονεκτήματα.
Πρώτον, όπως συμβαίνει και με άλλες τεχνολογίες Τεχνητής Νοημοσύνης ή τεχνολογίες που βασίζονται σε δεδομένα, τα μοντέλα Παραγωγικής ΤΝ απαιτούν σημαντικό όγκο δεδομένων υψηλής ποιότητας, για να είναι αποτελεσματικά. Η επεξεργασία τεράστιων ποσοτήτων δεδομένων απαιτεί γρήγορη πρόσβαση σε εργαλειοθήκες υπολογιστών, αποθήκευσης και δικτύων. Ειδικά για την κατασκευή Data Centers, τα δεδομένα αυτά μπορεί να είναι δύσκολο να αποκτηθούν λόγω της πολυπλοκότητας και της μεταβλητότητας της διαδικασίας κατασκευής, καθώς και της ποικιλίας των πηγών δεδομένων με την πάροδο των ετών, συμπεριλαμβανομένων των παλαιών συστημάτων υποδομής καθώς και αρχείων CAD, αρχείων προγραμματισμού και υπολογιστικών φύλλων, μεταξύ άλλων.
Με αυτή την ποικιλία και πολυπλοκότητα, τα μοντέλα Παραγωγικής Τεχνητής Νοημοσύνης ενδέχεται να μην είναι σε θέση να λάβουν υπόψη όλες τις μεταβλητές και τους περιορισμούς που εμπλέκονται στην κατασκευή κέντρων δεδομένων, γεγονός που θα μπορούσε να περιορίσει την αποτελεσματικότητά τους.
Δεύτερον, τα τρέχοντα μοντέλα Παραγωγικής ΤΝ ενδέχεται να μην σχεδιάζουν λύσεις που είναι πρακτικές ή εφικτές στον πραγματικό κόσμο, σε μια δεδομένη τοποθεσία. Για παράδειγμα, ένα μοντέλο θα μπορούσε να δημιουργήσει έναν σχεδιασμό που είναι βελτιστοποιημένος για ενεργειακή απόδοση, αλλά μπορεί να μην είναι δομικά υγιής ή να μην πληροί τις κανονιστικές απαιτήσεις.
Τέλος, η Παραγωγική Τεχνητή Νοημοσύνη δεν αντικαθιστά την ανθρώπινη εμπειρία ή τεχνογνωσία. Αν και μπορεί να βοηθήσει στη βελτιστοποίηση ορισμένων πτυχών της κατασκευής Data Centers, θα πρέπει πάντα να χρησιμοποιείται σε συνδυασμό με την ανθρώπινη γνώση, την πρακτική εμπειρία και τη ρεαλιστική κρίση για να διασφαλιστεί ότι το τελικό προϊόν είναι ασφαλές, αποδοτικό και αποτελεσματικό.