Τι είναι η DeepSeek: Η DeepSeek είναι μια κινεζική εταιρεία τεχνητής νοημοσύνης (AI) με έδρα το Hangzhou που προέκυψε πριν από μερικά χρόνια από μια πανεπιστημιακή startup. Ο δηλωμένος στόχος του είναι να δημιουργήσει μια τεχνητή γενική νοημοσύνη, έναν όρο για μια νοημοσύνη σε ανθρώπινο επίπεδο που καμία εταιρεία τεχνολογίας δεν έχει επιτύχει ακόμη. Δεν έχει φτάσει ακόμη εκεί, αλλά αυτός μπορεί να είναι ένας λόγος για τον οποίο οι επιστήμονες υπολογιστών στο DeepSeek έχουν υιοθετήσει μια διαφορετική προσέγγιση για την κατασκευή του μοντέλου AI τους, με αποτέλεσμα να φαίνεται πολλές φορές φθηνότερο στη λειτουργία του από τους ανταγωνιστές του στις ΗΠΑ.
Η εταιρεία εντυπωσιάζει εδώ και καιρό αθόρυβα τον κόσμο της τεχνητής νοημοσύνης με τις τεχνικές της καινοτομίες, συμπεριλαμβανομένης της αναλογίας κόστους προς απόδοση αρκετές φορές χαμηλότερη από αυτή των μοντέλων που κατασκευάζονται από τη Meta (Llama) και την OpenAI (Chat GPT). Δεν έχει κάνει τόσο θόρυβο για τις δυνατότητες των καινοτομιών της όσο οι εταιρείες της Silicon Valley. Οι τελευταίες έχουν κυκλοφορήσει ανακοινώσεις προϊόντων εδώ και μήνες, καθώς επείγονται όλο και περισσότερο να δημιουργήσουν επιτέλους αποδόσεις από τις επενδύσεις πολλών δισεκατομμυρίων δολαρίων. Θα πρέπει να αναμένουμε ωστόσο να δούμε περισσότερα από το χαρούμενο λογότυπο της μπλε φάλαινας του DeepSeek, καθώς όλο και περισσότεροι άνθρωποι σε όλο τον κόσμο το κατεβάζουν για να πειραματιστούν.
Είναι το μοντέλο DeepSeek AI για το οποίο οι άνθρωποι ενθουσιάζονται περισσότερο προς το παρόν, καθώς ισχυρίζεται ότι έχει απόδοση ανάλογη με το μοντέλο o1 της OpenAI, το οποίο κυκλοφόρησε στους χρήστες του Chat GPT τον Δεκέμβριο. Την Δευτέρα 27.1.2025 ήταν η πιο δημοφιλής δωρεάν εφαρμογή που κατεβάστηκε στο κατάστημα εφαρμογών της Apple στο Ηνωμένο Βασίλειο και σε άλλα μέρη του κόσμου.
Το ζήτημα με τα άλλα πολλά μοντέλα τεχνητής νοημοσύνης από OpenAI, Google, Meta και άλλες εταιρείες είναι ότι το μοντέλο αυτό χρησιμοποιεί ένα διαφορετικό είδος εσωτερικής αρχιτεκτονικής που απαιτεί λιγότερη χρήση μνήμης, μειώνοντας έτσι σημαντικά το υπολογιστικό κόστος κάθε αναζήτησης ή αλληλεπίδρασης με το σύστημα τύπου chatbot. Έχει επαινεθεί από ερευνητές για την ικανότητά του να αντιμετωπίζει σύνθετες συλλογιστικές εργασίες, ιδιαίτερα στα μαθηματικά και την κωδικοποίηση και φαίνεται να παράγει αποτελέσματα συγκρίσιμα με τους ανταγωνιστές, με ένα κλάσμα της υπολογιστικής ισχύος που χρειάζονται εκείνοι. Η DeepSeek ανέφερε ότι χρειάστηκαν δύο μήνες και λιγότερα από 6 εκατομμύρια δολάρια για την ανάπτυξη του μοντέλου, αν και ορισμένοι παρατηρητές προειδοποιούν ότι πιθανόν το ποσό έχει σκόπιμα υποτιμηθεί. Ωστόσο, είναι έτσι κι αλλιώς πολύ μικρότερο από τα δισεκατομμύρια που ξοδεύουν οι εταιρείες τεχνολογίας της Silicon Valley για την ανάπτυξη AI και είναι λιγότερο δαπανηρό στη λειτουργία του.
Πρόσωπο-κλειδί είναι ο Liang Wenfeng, ο οποίος κάποτε διαχειριζόταν ένα κινεζικό hedge fund που τώρα χρηματοδοτεί το DeepSeek.
Εκατοντάδες δισεκατομμύρια δολάρια εξαφανίστηκαν από την κεφαλαιοποίηση μεγάλων τεχνολογικών μετοχών μετά τη διάδοση των ειδήσεων για την απόδοση του chatbot DeepSeek το σαββατοκύριακο. Το χρονοδιάγραμμα ήταν σημαντικό, καθώς τις τελευταίες ημέρες οι εταιρείες τεχνολογίας των ΗΠΑ είχαν δεσμεύσει εκατοντάδες δισεκατομμύρια δολάρια επιπλέον για επενδύσεις στην τεχνητή νοημοσύνη, μεγάλο μέρος των οποίων θα διατεθεί για την κατασκευή της υπολογιστικής υποδομής και των πηγών ενέργειας που απαιτούνται, όπως πιστεύεται ευρέως, για την επίτευξη του στόχου της τεχνητής γενική νοημοσύνη. Η απόδοση του DeepSeek φαίνεται να αμφισβητεί, τουλάχιστον σε πρώτο πλάνο, αυτή την αφήγηση.
Η Nvidia είναι μια από τις εταιρείες που έχει κερδίσει τα περισσότερα από την έκρηξη της τεχνητής νοημοσύνης. Από κατασκευαστής καρτών γραφικών για βιντεοπαιχνίδια έγινε ο κυρίαρχος κατασκευαστής τσιπ στην αδηφάγα πεινασμένη βιομηχανία τεχνητής νοημοσύνης. Συγκρίθηκε με έναν μετριοπαθή έμπορο αξινών και κουβάδων στην Καλιφόρνια του 19ου αιώνα, ο οποίος έτυχε να βρισκόταν επιτόπου όταν συνέβη ο πυρετός του χρυσού και έτσι έγινε ένας τεράστιος προμηθευτής της πλουσιότερης βιομηχανίας του κόσμου. Οι εταιρείες τεχνολογίας που κοιτάζουν λοξά το DeepSeek πιθανότατα αναρωτιούνται αν πρέπει τώρα να αγοράσουν τόσο πολλά από τα εργαλεία της Nvidia. Η χρηματιστηριακή της αξία μειώθηκε κατά 600 δισ. δολάρια τη Δευτέρα.
Η DeepSeek δεν έχει φτάσει στην τεχνητή γενική νοημοσύνη, το όριο στο οποίο η τεχνητή νοημοσύνη αρχίζει να πλησιάζει και που επιδιώκουν το OpenAI και άλλοι κολοσσοί στη Silicon Valley. Η ραγδαία ανάδειξη της DeepSeek δημιουργεί την αισιοδοξία οι προηγμένες δυνατότητες τεχνητής νοημοσύνης να μπορούν τώρα πια να επιτευχθούν χωρίς την τεράστια ποσότητα υπολογιστικής ισχύος, μικροτσίπ, ενέργειας και νερού ψύξης που θεωρούνταν αναγκαία.
Δημοσιεύτηκε στον Οδηγό του Πολίτη (https://www.odigostoupoliti.eu)