Λιανγκ Γουενφένγκ: Ο «Mr DeepSeek» ο Κινέζος σπασίκλας που έβαλε τα γυαλιά στην Αμερική - 40 ετών, γιος δασκάλου, έριξε το χρηματιστήριο με το φθηνό ΑΙ

Όλα ξεκίνησαν σαν... παιχνίδι

Ενα μικρό κινεζικό εργαστήριο Τεχνητής Νοημοσύνης κατέπληξε τον κόσμο αυτές τις ημέρες, αποκαλύπτοντας την «τεχνική συνταγή» για ένα μοντέλο ΤΝ αιχμής που κατάφερε να αναπτύξει και αναγορεύοντας τον άγνωστο επικεφαλής του σε εθνικό ήρωα, καθώς, αψηφώντας τις προσπάθειες των ΗΠΑ να τερματίσουν τις τεχνολογικές φιλοδοξίες της Κίνας, κατάφερε να ξεπεράσει τους διάσημους αμερικανούς ανταγωνιστές του.

Η DeepSeek, το εργαστήριο TN που ιδρύθηκε από έναν διαχειριστή hedge fund ονόματι Λιανγκ Γουενφένγκ, λάνσαρε την περασμένη Δευτέρα το μοντέλο της DeepSeek-R1, εξηγώντας σε μια λεπτομερή δημοσίευση πώς δημιουργείται ένα μεγάλο γλωσσικό μοντέλο με περιορισμένους πόρους το οποίο μπορεί να μαθαίνει και να βελτιώνεται αυτόματα, χωρίς ανθρώπινη επίβλεψη. 

Οι πανίσχυρες αμερικανικές εταιρείες TN, περιλαμβανομένων των OpenAI και Google DeepMind, πρωτοστάτησαν στις εξελίξεις στα συλλογιστικά μοντέλα, ένα σχετικά νέο ερευνητικό πεδίο της τεχνολογικής καινοτομίας, στο πλαίσιο του οποίου επιδιώκεται να καταστούν τα μοντέλα αυτά όσο το δυνατόν πιο «ανθρώπινα» από την άποψη των γνωστικών ικανοτήτων. 

Το προηγούμενο μήνα, η OpenAI του Σαμ Αλτμαν, με έδρα το Σαν Φρανσίσκο, κυκλοφόρησε την πλήρη έκδοση του μοντέλου της o1, αλλά επέλεξε να μην αποκαλύψει τον τρόπο λειτουργίας του. 

Διαβάστε ακόμα: DeepSeek: Τα φτωχόπαιδα της Κίνας ξεπέρασαν τα πλουσιόπαιδα της Σίλικον Βάλεϊ - Προκαλεί δέος η νέα εφαρμογή Τεχνητής Νοημοσύνης - Πως λειτουργεί (βίντεο)

Η κυκλοφορία του μοντέλου R1 της DeepSeek προκάλεσε πανικό στη Σίλικον Βάλεϊ για το αν οι πολύ πιο ισχυρές οικονομικά αμερικανικές εταιρείες ΤΝ, όπως οι Meta και Anthropic, μπορούν να διατηρήσουν το τεχνικό τους πλεονέκτημα. 

Ποιος είναι ο άνθρωπος πίσω από αυτό το εξαιρετικό τεχνολογικό επίτευγμα της –ανταγωνιστικής προς τη Δύση και ειδικά προς τις ΗΠΑ– Κίνας; 

Ο Λιανγκ Γουενφένγκ θεωρείται (ακόμα) ξένος στον κόσμο της ΤΝ, αλλά το αντικείμενο ανέκαθεν του κέντριζε το ενδιαφέρον. Στο παρελθόν λίγοι τον έπαιρναν στα σοβαρά, ακόμη και στην πατρίδα του. 

Πλέον, όμως, το επίτευγμά του αποτελεί πηγή εθνικής υπερηφάνειας και ο ίδιος είναι το… καμάρι του Πεκίνου, γεγονός που εξηγεί γιατί υπήρξε ο μοναδικός επιχειρηματίας με ειδίκευση στην ΤΝ που προσκλήθηκε σε ένα επιχειρηματικό συνέδριο παρόντος του δεύτερου πιο υψηλόβαθμου αξιωματούχου της Κίνας μετά τον Σι Τζινπίνγκ, του πρωθυπουργού της χώρας Λι Κιανγκ. 

Οπως αναφέρουν σε ρεπορτάζ τους οι Financial Times, το 2021 ο Λιανγκ άρχισε να αγοράζει χιλιάδες μονάδες επεξεργασίας γραφικών της Nvidia (πριν η κυβέρνηση Μπάιντεν περιορίσει τις αμερικανικές εξαγωγές προηγμένων τσιπ στην Κίνα), ως ένα παράπλευρο project ΤΝ, με τους ειδήμονες να κάνουν τότε λόγο για έναν εκκεντρικό δισεκατομμυριούχο που αναζητούσε καινούργιο χόμπι. 

«Οταν τον πρωτογνωρίσαμε ήταν αυτός ο πολύ σπασίκλας με το απαίσιο χτένισμα, που μιλούσε για τη δημιουργία ενός συμπλέγματος 10.000 τσιπ […] Δεν τον πήραμε στα σοβαρά» δήλωσε στους FT ένας από τους συνεργάτες του Λιανγκ. «Δεν μπορούσε να διατυπώσει το όραμά του. Ελεγε μόνο “θέλω να το φτιάξω αυτό και θα αλλάξει το παιχνίδι”. 

Πιστεύαμε ότι αυτό ήταν δυνατό μόνο από γίγαντες όπως η ByteDance και η Alibaba». Το γεγονός ότι ο κόσμος της ΤΝ τον υποτίμησε, λειτούργησε ως πηγή ισχύος για τον Λιάνγκ. Κατάφερε να κάνει περιουσία μέσω του High-Flyer, του hedge-fund που συνίδρυσε το 2015, χρησιμοποιώντας συστήματα ΤΝ και αλγορίθμους για να εντοπίζει μοτίβα που θα μπορούσαν να επηρεάζουν τις τιμές των μετοχών. Με τον καιρό η ομάδα του απέκτησε τεράστια εμπειρία στη χρήση τσιπ της Nvidia για να βγάζει χρήματα από τις συναλλαγές μετοχών. Το 2023, ο φιλόδοξος κινέζος επιχειρηματίας ίδρυσε την DeepSeek, ανακοινώνοντας την πρόθεσή του να αναπτύξει προηγμένα συστήματα ΤΝ. 

«Ο Λιανγκ δημιούργησε μια εξαιρετική ομάδα υποδομής, που καταλαβαίνει πραγματικά πώς λειτουργούν τα τσιπ» είπε ένας εκ των ιδρυτών μιας ανταγωνιστικής εταιρείας μεγάλων γλωσσικών μοντέλων (LLM). «Πήρε μαζί του τους καλύτερους από το hedge fund στην DeepSeek». Αφού η Ουάσινγκτον απαγόρευσε στην Nvidia να εξάγει τα πιο ισχυρά της τσιπ στην Κίνα, οι εγχώριες εταιρείες ΤΝ αναγκάστηκαν να βρουν καινοτόμους τρόπους για να μεγιστοποιήσουν την υπολογιστική ισχύ ενός περιορισμένου αριθμού τσιπ. Ωστόσο, η ομάδα του Λιανγκ είχε ήδη τη λύση στο πρόβλημα. «Οι μηχανικοί της DeepSeek ξέρουν πώς να ξεκλειδώνουν τις δυνατότητες αυτών των μονάδων επεξεργασίας γραφικών, ακόμα και αν δεν είναι τελευταίας τεχνολογίας» δήλωσε ένας ερευνητής με ειδίκευση στην ΤΝ, που πρόσκειται στην εταιρεία. 

Οι γνώστες του κλάδου λένε ότι η σχεδόν απόλυτη εστίαση της DeepSeek στην έρευνα την καθιστά επικίνδυνο ανταγωνιστή, κυρίως επειδή η εταιρεία είναι πρόθυμη να μοιράζεται τις όποιες ανακαλύψεις της, αντί να τις προστατεύει με στόχο το κέρδος. Η DeepSeek δεν έχει συγκεντρώσει χρήματα από χρηματοδότες ούτε έχει προβεί σε σημαντικές κινήσεις για τη δημιουργία εσόδων από τα μοντέλα της. Ο Λιάνγκ, ο οποίος μετέχει προσωπικά στα ερευνητικά προγράμματα της DeepSeek, χρησιμοποιεί τα έσοδα του hedge fund του για να αμείβει πλουσιοπάροχα τα κορυφαία ταλέντα στην ΤΝ. Μαζί με την ByteDance, τη μητρική εταιρεία του TikTok, η DeepSeek είναι γνωστή για την παροχή των υψηλότερων αμοιβών σε μηχανικούς ΤΝ στην Κίνα, με το προσωπικό της να εδρεύει σε γραφεία στην Χανγκτσόου και στο Πεκίνο. 

«Τα γραφεία της DeepSeek είναι σαν μια πανεπιστημιούπολη για κορυφαίους ερευνητές» είπε ο συνεταίρος του Λιανγκ στους Financial Times. «Η ομάδα πιστεύει στο όραμα του Λιανγκ, (ο οποίος θέλει) να δείξει στον κόσμο ότι οι Κινέζοι μπορούν να είναι δημιουργικοί και να φτιάξουν κάτι από το μηδέν». Είναι αλήθεια πως ο Λιανγκ έστησε την DeepSeek ως μια απόλυτα «τοπική» εταιρεία, στελεχώνοντάς την με διδάκτορες κορυφαίων κινεζικών πανεπιστημίων. Σε συνέντευξή του σε κινεζικά ΜΜΕ πέρυσι είχε επισημάνει ότι η ομάδα του δεν αποτελούνταν από άτομα που είχαν σπουδάσει στο εξωτερικό: «Είναι όλοι ντόπιοι. Πρέπει να αναπτύξουμε μόνοι μας τα κορυφαία ταλέντα». 

Ο Λιάνγκ Γουενφένγκ γεννήθηκε πριν από 40 χρόνια στην πόλη Ζαντζιάνγκ της επαρχίας Γκουανγκντόνγκ και είναι γιος δασκάλου Δημοτικού. Σπούδασε Μηχανική Υπολογιστών, Τηλεπικοινωνιών και Δικτύων στο Πανεπιστήμιο της Τζετζιάνγκ. Αφού στράφηκε στην ΤΝ έθεσε αμέσως υψηλούς στόχους, επιδιώκοντας εξαρχής να αναπτύξει ένα μοντέλο με σχετικά περιορισμένο κόστος, που θα γινόταν ανταγωνιστικό σε παγκόσμιο επίπεδο. 

«Δεν θέλουμε απλώς να δημιουργήσουμε ένα μοντέλο, θέλουμε να επαναπροσδιορίσουμε την καινοτομία», είχε πει. Η κυκλοφορία του DeepSeek-V2 το 2024 τράβηξε αμέσως την προσοχή. «Δεν περιμέναμε τόσο έντονη αντίδραση. Βελτιστοποιήσαμε το κόστος και ορίσαμε δίκαιες τιμές». Καθοριστική αποδείχτηκε η επιλογή δημιουργίας ενός μοντέλου ανοιχτού κώδικα, καθώς σύμφωνα με τον κινέζο επιχειρηματία και ερευνητή «η καινοτομία δεν προστατεύεται από τη μυστικότητα, αλλά από την ταχύτητα και την προσαρμογή». 

Οσον αφορά το μέλλον, «πάντα βλέπαμε την ΤΝ ως Δυτικό προϊόν. Γιατί όμως πρέπει να είμαστε απλώς χρήστες και όχι πρωταγωνιστές;  Στην Κίνα η καινοτομία θεωρούνταν πολυτέλεια. Τώρα έχουμε πόρους για να επενδύσουμε στη βασική έρευνα. Εάν θέλεις άμεσα αποτελέσματα, προσλαμβάνεις εμπειρία. Αλλά εάν θέλεις να αλλάξεις τον κόσμο, αναζητάς την περιέργεια και το πάθος».

Πηγή: Protagon.gr

Ακολουθήστε το eirinika.gr στο Google News για ενδιαφέρουσες ειδήσεις από την Ελλάδα και τον κόσμο

Πατήστε εδώ για να διαβάσετε όλες τις αναρτήσεις του eirinika.gr