where art is always in focus

15.5.25

Ένα τεχνολογικό επίτευγμα: υλοποίηση σύγχρονης ΤΝ με απαρχαιωμένο υλισμικό

3' διάβασμα
 
 

 

 

πείραμα με έναν επεξεργαστή του 1997 απέδειξε ότι μόλις 128 MB μνήμης RAM είναι αρκετά για να αξιοποιήσουν τη δύναμη της τεχνητής νοημοσύνης

 

 


Η τεχνητή νοημοσύνη (ΤΝ) έχει αναμφίβολα γίνει σήμερα μια από τις πιο δημοφιλείς τεχνολογικές εξελίξεις. Αυτό έχει οδηγήσει στον πειραματισμό της με διάφορους τρόπους, με την ενσωμάτωσή της σε εταιρικά περιβάλλοντα να αποτελεί μία από τις κύριες χρήσεις της.
Υπάρχουν παραδείγματα όπου εταιρείες αποφάσισαν να εφαρμόσουν εργαλεία τεχνητής νοημοσύνης απευθείας στις δραστηριότητές τους.

Ενώ όμως η τεχνητή νοημοσύνη (ΤΝ) φαίνεται να είναι προνόμιο των πανίσχυρων υπολογιστών, μια πρόσφατη παρουσίαση αποδεικνύει το αντίθετο. Οι ερευνητές κατάφεραν να τρέξουν ένα σύγχρονο μοντέλο τεχνητής νοημοσύνης σε έναν υπολογιστή του 1997 με έναν απλό επεξεργαστή Pentium II και 128 MB RAM. Αυτό θέτει υπό αμφισβήτηση τις βεβαιότητές μας σχετικά με τις απαιτήσεις της ΤΝ σε υλικό και ανοίγει το δρόμο για έναν βιώσιμο και χωρίς αποκλεισμούς εκδημοκρατισμό της ΤΝ.
Το κατόρθωμα επιτεύχθηκε από την EXO Labs, μια εταιρεία που ιδρύθηκε από τον Αντρέι Καρπάθι, γνωστή προσωπικότητα στον τομέα της τεχνητής νοημοσύνης, μαζί με ερευνητές από το Πανεπιστήμιο της Οξφόρδης. Χρησιμοποιώντας μια πρωτοποριακή τεχνολογική προσέγγιση, κατάφεραν να τρέξουν ένα γλωσσικό μοντέλο βασισμένο στο Llama 2 σε έναν σε έναν υπολογιστή με Windows 98, εξοπλισμένο με επεξεργαστή Pentium II συχνότητα λειτουργίας μόλις 350 MHz και 128 MB RAM, που αρχικά κυκλοφόρησε τον Μάιο του 1997. Ένα περιβάλλον υλισμικού που, με την πρώτη ματιά, φαίνεται εντελώς ανεπαρκές για τις απαιτήσεις της σύγχρονης τεχνητής νοημοσύνης.

Και όμως, το μοντέλο κατάφερε να τρέξει με έναν αξιοσέβαστο ρυθμό 39,31 συμβόλων ανά δευτερόλεπτο, χρησιμοποιώντας μόλις 260.000 παραμέτρους. Αυτό το αξιοσημείωτο αποτέλεσμα οφείλεται στη χρήση του BitNet, μιας επαναστατικής νέας αρχιτεκτονικής νευρωνικών δικτύων. Σε αντίθεση με τα παραδοσιακά μοντέλα float32, το BitNet χρησιμοποιεί τριμερή σταθμικά βάρη*, όπου κάθε βάρος έχει μόνο τρεις πιθανές τιμές (-1, 0, 1). Αυτή η απλούστευση επιτρέπει την ακραία συμπίεση του μοντέλου χωρίς σημαντική απώλεια επιδόσεων.




Χάρη στο BitNet, ένα μοντέλο που συνήθως έχει μέγεθος 7 δισεκατομμυρίων παραμέτρων μπορεί να μειωθεί σε μόλις 1,38 GB. Αυτό καθιστά δυνατή την εκτέλεσή του σε μέτριους επεξεργαστές, χωρίς τη βοήθεια καρτών γραφικών υψηλών προδιαγραφών. Σύμφωνα με την EXO Labs, η τεχνολογία αυτή θα μπορούσε ακόμη και να καταστήσει δυνατή την εκτέλεση μοντέλων με 100 δισεκατομμύρια παραμέτρους σε έναν μόνο επεξεργαστή, επιτυγχάνοντας ταχύτητες επεξεργασίας κοντά σε αυτές της ανθρώπινης ανάγνωσης. Το πείραμα αυτό όχι μόνο αποδεικνύει τη βιωσιμότητα των μοντέλων τεχνητής νοημοσύνης σε "αδύναμες" πλατφόρμες, αλλά υπογραμμίζει επίσης την καθοριστική σημασία της αλγοριθμικής βελτιστοποίησης πέρα από την καθαρή ακατέργαστη ισχύ του υλικού.

Πέρα από την τεχνική ικανότητα, η επίδειξη αυτή έχει σημαντικές κοινωνικές επιπτώσεις. Ένα από τα κύρια εμπόδια για τη μαζική υιοθέτηση της τεχνητής νοημοσύνης είναι συχνά το κόστος της, τόσο όσον αφορά τον εξοπλισμό όσο και την κατανάλωση ενέργειας. Εάν λύσεις όπως το BitNet καταστήσουν δυνατή την εκτέλεση προηγμένων μοντέλων σε υπάρχον υλισμικό ή υλισμικό παλαιότερης γενιάς, τότε η πρόσβαση στην τεχνητή νοημοσύνη θα μπορούσε να επεκταθεί πολύ πέρα από τα ερευνητικά εργαστήρια και τις εταιρείες τεχνολογίας. Στις αναπτυσσόμενες χώρες, όπου οι σύγχρονοι υπολογιστικοί πόροι είναι μερικές φορές σπάνιοι και ακριβοί, η προσέγγιση αυτή θα μπορούσε να ανοίξει νέες ευκαιρίες. Σχολεία, κέντρα υγείας ή μικρές επιχειρήσεις θα μπορούσαν να χρησιμοποιήσουν την ΤΝ για εκπαίδευση, διάγνωση ή οικονομική βελτιστοποίηση, χωρίς να χρειάζεται να επενδύσουν σημαντικά σε υποδομές τελευταίας τεχνολογίας.

Επιπλέον, από οικολογική άποψη, η επαναχρησιμοποίηση παλαιού εξοπλισμού για προηγμένες εργασίες θα περιορίσει την παραγωγή ηλεκτρονικών αποβλήτων και θα μειώσει το αποτύπωμα άνθρακα που συνδέεται με την κατασκευή νέου εξοπλισμού. Αυτό συνάδει με τις αρχές της βιωσιμότητας που επιδιώκονται όλο και περισσότερο στις τρέχουσες τεχνολογικές πολιτικές. Τέλος, αυτή η ανακάλυψη καταδεικνύει τη μεταβολή του προτύπου: το μέλλον της τεχνητής νοημοσύνης δεν εξαρτάται αποκλειστικά από τη συνεχή αύξηση των επιδόσεων του υλικού. Βασίζεται επίσης στην εφευρετικότητα του λογισμικού και στις καινοτομίες που μας επιτρέπουν να κάνουμε «περισσότερα με λιγότερα». Αυτό ανοίγει το δρόμο για μια τεχνητή νοημοσύνη πιο υπεύθυνη, πιο περιεκτική και λιγότερο ελιτίστικη.

Καλό είναι βέβαια να μην ξεχνάμε πως η προσέγγιση αυτή σε πραγματικές συνθήκες, πέρα από την αύξηση της προσβασιμότητας σε τέτοιου είδους τεχνολογίες, έχει οδηγήσει σε δραστικές αποφάσεις, όπως η εξάλειψη έως και του 90% του εργατικού δυναμικού τους προκειμένου να αντικαταστήσουν το ανθρώπινο προσωπικό με αυτοματοποιημένα συστήματα.



*μαθησιακή παράμετρος ορισμένων μοντέλων μηχανικής μάθησης, συμπεριλαμβανομένων των νευρωνικών δικτύων.
 

 

επιμέλεια-κείμενο: Κάππα Λάμδα
© periopton



Απαγορεύεται από το δίκαιο της Πνευμ. Ιδιοκτησίας
η καθ' οιονδήποτε τρόπο χρήση/αναπαραγωγή/ιδιοποίηση
του παρόντος άρθρου (ολόκληρου ή αποσπασμάτων)

 

 

με στοιχεία από farmingdale-observer