Preis: $0.15090 2.9605%
Marktwert: $22.92B 0.7601%
Umsatz (24h): 1.55B 0%
Dominanz: 0.7601%
Price: $0.15090 2.9605%
Marktwert: $22.92B 0.7601%
Umsatz (24h): 1.55B 0%
Dominanz: 0.7601% 0.7601%
  • Preis: $0.15090 2.9605%
  • Marktwert: 22.92B 0.7601%
  • Umsatz (24h): 1.55B 0%
  • Dominanz: 0.7601% 0.7601%
  • Preis: $0.15090 2.9605%
Titelseite > 视频 > Die Mathematik hinter der Ausbildung und Betreuung von LLMs – Reiner Pope

Die Mathematik hinter der Ausbildung und Betreuung von LLMs – Reiner Pope

freigeben: 2026/04/29 17:20 lesen: 0

Ursprünglicher Autor:Dwarkesh Patel

Originalquelle:https://www.youtube.com/embed/xmkSf5IS-zw

Habe mit Reiner Pope ein ganz anderes Format durchgeführt – eine Tafelvorlesung, in der er erläutert, wie LLMs im Grenzbereich ausgebildet und bedient werden. Es ist schockierend, wie viel man aus einer Handvoll Gleichungen, öffentlichen API-Preisen und etwas Kreide über die Arbeit der Labore schließen kann. Es ist ein bisschen technisch, aber ich ermutige Sie, durchzuhalten – es lohnt sich wirklich. Es gibt weniger als eine Handvoll Menschen, die den gesamten Bereich der KI vom Hardware-Design bis zur Modellarchitektur so gut verstehen wie Reiner. Es war eine wahre Freude, von ihm zu lernen. Reiner ist CEO von MatX, einem neuen Chip-Startup (vollständige Offenlegung: Ich bin ein Angel-Investor). Zuvor war er bei Google tätig, wo er sich mit Softwareeffizienz, Compilern und TPU-Architektur beschäftigte. Laden Sie hier den Markdown des Transkripts herunter, um mit einem LLM zu chatten: https://gist.github.com/dwarkeshsp/79100f0fdeed69d76241903bb0604dbe 0:00:00 – Wie sich die Stapelgröße auf Token-Kosten und -Geschwindigkeit auswirkt 0:31:59 – Wie MoE-Modelle über GPU-Racks verteilt werden 0:47:02 – Wie Pipeline-Parallelität Modellebenen verschiebt Racks 1:03:27 – Warum Ilya sagte: „Wie wir jetzt wissen, ist Pipelining nicht klug.“ 1:18:49 – Aufgrund von RL sind Modelle möglicherweise 100-mal übertrainiert über Chinchilla-optimal 1:32:52 – Ableitung der Kosten für langen Kontextspeicher aus API-Preisen 2:03:52 – Konvergente Entwicklung zwischen neuronalen Netzen und Kryptographie

Ausgewählte Themen

  • Dogecoin-Wal-Aktivität
    Dogecoin-Wal-Aktivität
    Erhalten Sie mit unserer umfassenden Analyse die neuesten Erkenntnisse über die Aktivitäten der Dogecoin-Wale. Entdecken Sie Trends, Muster und die Auswirkungen dieser Wale auf den Dogecoin-Markt. Bleiben Sie mit unserer Expertenanalyse auf dem Laufenden und behalten Sie auf Ihrem Weg zur Kryptowährung die Nase vorn.
  • Dogecoin-Mining
    Dogecoin-Mining
    Beim Dogecoin-Mining werden der Dogecoin-Blockchain neue Transaktionsblöcke hinzugefügt. Miner werden für ihre Arbeit mit neuen Dogecoins belohnt. Dieses Thema enthält Artikel zum Dogecoin-Mining, einschließlich der Anleitung zum Mining von Dogecoin, der besten Mining-Hardware und -Software und der Rentabilität des Dogecoin-Minings.
  • Start des Spacex-Raumschiffs
    Start des Spacex-Raumschiffs
    Dieses Thema enthält Artikel zu SpaceX-Raumschiffstarts, einschließlich Startdaten, Missionsdetails und Startstatus. Bleiben Sie mit dieser informativen und umfassenden Ressource über die neuesten Starts von SpaceX Starship auf dem Laufenden.
  • König der Meme: Dogecoin
    König der Meme: Dogecoin
    Dieses Thema enthält Artikel zu den beliebtesten Memes, darunter „The King of Memes: Dogecoin“. Memecoin hat sich zu einem dominanten Akteur im Kryptoraum entwickelt. Diese digitalen Assets sind aus verschiedenen Gründen beliebt. Sie treiben die innovativsten Aspekte der Blockchain voran.