libérer: 2026/07/01 16:02 lire: 0
Auteur original:Luis R Soenksen
Source originale:https://www.youtube.com/embed/2nu-csmHvSc
Cette conférence explore les transformateurs et les grands modèles linguistiques (LLM), l'architecture d'apprentissage en profondeur qui alimente les systèmes d'IA modernes tels que ChatGPT, Claude, Gemini, Llama et de nombreux modèles de base multimodaux. Nous commençons par présenter les principales familles de modèles de langage, y compris les architectures autorégressives, auto-encodées et encodeurs-décodeurs, et retraçons l'évolution rapide des LLM depuis les premiers modèles de transformateurs comme BERT et GPT jusqu'aux systèmes multimodaux à grande échelle d'aujourd'hui. La conférence examine ensuite comment la mise à l'échelle, le réglage des instructions, l'apprentissage par renforcement, l'augmentation de la récupération et l'ingénierie des systèmes ont transformé les capacités LLM au-delà de la simple augmentation de la taille du modèle. La seconde moitié de la conférence propose une présentation intuitive mais rigoureuse de l'architecture Transformer, expliquant les intégrations de jetons, les codages de position, l'auto-attention, les vecteurs Query-Key-Value (QKV), l'attention des produits scalaires à l'échelle, l'attention multi-têtes, les connexions résiduelles, la normalisation des couches, les réseaux à action directe et les blocs de transformateur de style GPT. Grâce à des exemples visuels et à des formulations mathématiques, les étudiants développent une compréhension de niveau ingénierie de la manière dont les transformateurs construisent des représentations contextuelles et effectuent la prédiction du jeton suivant. Enfin, nous explorons comment la même architecture s'étend au-delà du langage naturel pour inclure le texte biomédical, les dossiers de santé électroniques (DSE), les séquences biologiques, l'imagerie médicale, les graphiques et les applications de soins de santé multimodales, tout en discutant de considérations pratiques telles que les hallucinations, l'alignement des modèles, la sécurité, l'interprétabilité et le déploiement responsable en médecine et en santé mondiale. #IA #IntelligenceArtificielle #MachineLearning #DeepLearning #Transformers #LargeLanguageModels #LLMs #GPT #ChatGPT #AttentionMechanism #SelfAttention #GenerativeAI #FoundationModels #NaturalLanguageProcessing #NLP #BiomedicalAI #MedicalAI #HealthcareAI #ClinicalAI #ElectronicHealthRecords #Bioinformatics #ComputationalBiology #VisionTransformer #MultimodalAI #AIEducation #GraduateCourse #AIInMedicine #GlobalHealth #MedicalEducation #MachineLearningCourse
Steve McGrath
2026-07-02 03:17
Because Bitcoin
2026-07-02 03:15
xtg Family autour du monde
2026-07-02 03:15
Вард Rose
2026-07-02 03:15
Ben Crypto
2026-07-02 03:15
Kripto Detayı
2026-07-02 02:56
mother zainab
2026-07-02 02:56
Coreymillia2012
2026-07-02 02:56
ANURAG ARYA APKA DOST APKA SEHYOGI
2026-07-02 02:56
Sélectionnez la devise
US Dollar
USD
Chinese Yuan
CNY
Japanese Yen
JPY
South Korean Won
KRW
New Taiwan Dollar
TWD
Canadian Dollar
CAD
Euro
EUR
Pound Sterling
GBP
Danish Krone
DKK
Hong Kong Dollar
HKD
Australian Dollar
AUD
Brazilian Real
BRL
Swiss Franc
CHF
Chilean Peso
CLP
Czech Koruna KČ
CZK
Singapore Dollar
SGD
Indian Rupee
INR
Saudi Riyal
SAR
Vietnamese Dong
VND
Thai Baht
THB
Sélectionnez la devise
US Dollar
USD-$
Chinese Yuan
CNY-¥
Japanese Yen
JPY-¥
South Korean Won
KRW -₩
New Taiwan Dollar
TWD-NT$
Canadian Dollar
CAD-$
Euro
EUR - €
Pound Sterling
GBP-£
Danish Krone
DKK-KR
Hong Kong Dollar
HKD- $
Australian Dollar
AUD-$
Brazilian Real
BRL -R$
Swiss Franc
CHF -FR
Chilean Peso
CLP-$
Czech Koruna KČ
CZK -KČ
Singapore Dollar
SGD-S$
Indian Rupee
INR -₹
Saudi Riyal
SAR -SAR
Vietnamese Dong
VND-₫
Thai Baht
THB -฿