prix: $0.15090 2.9605%
Valeur marchande: $22.92B 0.7601%
Chiffre d’affaires (24h): 1.55B 0%
Dominance: 0.7601%
Price: $0.15090 2.9605%
Valeur marchande: $22.92B 0.7601%
Chiffre d’affaires (24h): 1.55B 0%
Dominance: 0.7601% 0.7601%
  • prix: $0.15090 2.9605%
  • Valeur marchande: 22.92B 0.7601%
  • Chiffre d’affaires (24h): 1.55B 0%
  • Dominance: 0.7601% 0.7601%
  • prix: $0.15090 2.9605%
première page > 视频 > Les mathématiques derrière la façon dont les LLM sont formés et servis – Reiner Pope

Les mathématiques derrière la façon dont les LLM sont formés et servis – Reiner Pope

libérer: 2026/04/29 17:20 lire: 0

Auteur original:Dwarkesh Patel

Source originale:https://www.youtube.com/embed/xmkSf5IS-zw

A fait un format très différent avec Reiner Pope – une conférence au tableau où il explique comment les LLM frontaliers sont formés et servis. Il est choquant de voir tout ce que l'on peut déduire sur ce que font les laboratoires à partir d'une poignée d'équations, des prix publics des API et de quelques craies. C'est un peu technique, mais je vous encourage à accrocher, ça vaut vraiment le coup. Il y a moins d’une poignée de personnes qui comprennent l’ensemble de l’IA, de la conception matérielle à l’architecture des modèles en passant par Reiner. C'était un vrai plaisir d'apprendre de lui. Reiner est PDG de MatX, une nouvelle startup de puces (divulgation complète – je suis un investisseur providentiel). Il travaillait auparavant chez Google, où il a travaillé sur l'efficacité des logiciels, les compilateurs et l'architecture TPU. Téléchargez la transcription de la transcription ici pour discuter avec un LLM : https://gist.github.com/dwarkeshsp/79100f0fdeed69d76241903bb0604dbe 0:00:00 – Comment la taille du lot affecte le coût et la vitesse des jetons 0:31:59 – Comment les modèles MoE sont disposés sur des racks GPU 0:47:02 – Comment le parallélisme du pipeline déplace les couches de modèles entre les racks 1:03:27 – Pourquoi Ilya a dit : "Comme nous le savons maintenant, le pipeline n'est pas judicieux." 1:18:49 – En raison de RL, les modèles peuvent être 100 fois surentraînés au-delà de l'optimal Chinchilla 1:32:52 – Déduire les coûts de mémoire de contexte long à partir du prix des API 2:03:52 – Evolution convergente entre les réseaux neuronaux et la cryptographie

Sujets en vedette

  • Activité des baleines Dogecoin
    Activité des baleines Dogecoin
    Obtenez les dernières informations sur les activités des baleines Dogecoin grâce à notre analyse complète. Découvrez les tendances, les modèles et l'impact de ces baleines sur le marché Dogecoin. Restez informé grâce à notre analyse d’experts et gardez une longueur d’avance dans votre parcours de crypto-monnaie.
  • Extraction de Dogecoins
    Extraction de Dogecoins
    Le minage de Dogecoin est le processus d'ajout de nouveaux blocs de transactions à la blockchain Dogecoin. Les mineurs sont récompensés par un nouveau Dogecoin pour leur travail. Cette rubrique propose des articles liés au minage de Dogecoin, notamment sur la manière d'exploiter du Dogecoin, les meilleurs matériels et logiciels de minage et la rentabilité du minage de Dogecoin.
  • Lancement du vaisseau Spacex
    Lancement du vaisseau Spacex
    Cette rubrique fournit des articles relatifs aux lancements de SpaceX Starship, notamment les dates de lancement, les détails de la mission et l'état du lancement. Restez au courant des derniers lancements de SpaceX Starship avec cette ressource informative et complète.
  • Roi des mèmes : Dogecoin
    Roi des mèmes : Dogecoin
    Cette rubrique propose des articles liés aux mèmes les plus populaires, notamment « Le roi des mèmes : Dogecoin ». Memecoin est devenu un acteur dominant dans l’espace crypto. Ces actifs numériques sont populaires pour diverses raisons. Ils pilotent les aspects les plus innovants de la blockchain.