Introduction aux LLM de bout en bout : de l'Architecture au Fine-Tuning
Cet article déconstruit la complexité des grands modèles de langage, de l'architecture fondamentale du Transformer jusqu'à l'ajustement fin (SFT) avec PyTorch.
Lire l'article →Machine Learning, Deep Learning, NLP, Reconnaissance Vocale et Mathématiques pour l'IA. Du fondamental au déploiement en production.
Cet article déconstruit la complexité des grands modèles de langage, de l'architecture fondamentale du Transformer jusqu'à l'ajustement fin (SFT) avec PyTorch.
Lire l'article →Analyse approfondie des trois piliers de Qwen3 : mode pensée/non-pensée unifié, mécanisme de budget de pensée et distillation fort-faible. Architecture MoE 128 experts (8 actifs/token), pré-entraînement sur 36T tokens en 119 langues, pipeline post-training GRPO. Performances SOTA vs DeepSeek-R1 et OpenAI-o1.
Lire l'article →Décryptage complet de GPT-OSS-20B : architecture Mixture-of-Experts (4 experts actifs sur 16), SwiGLU, GQA, RoPE, quantification MXFP4 et entraînement multilingue sur 2T tokens. Benchmarks, code et implications pour l'Afrique.
Lire l'article →Plongée technique dans la construction d'un système ASR pour le Wolof, une langue parlée par 90% des Sénégalais. Du traitement du signal à la modélisation acoustique — comment l'IA peut combattre l'exclusion numérique linguistique en Afrique subsaharienne.
Lire l'article →Des réseaux de neurones aux architectures profondes. Comprendre la rétropropagation, les fonctions d'activation et construire son premier modèle avec TensorFlow/Keras sur Fashion MNIST. Tutoriel accessible de zéro au fonctionnel.
Lire l'article →Une analogie culinaire pour comprendre la différence fondamentale entre l'apprentissage humain et l'apprentissage machine. Comment un algorithme de ML aborde-t-il un problème comparé à l'intuition humaine ? Pédagogie et humour au rendez-vous.
Lire l'article →Travaux pratiques de régression linéaire avec Python, NumPy et scikit-learn. De la théorie mathématique (moindres carrés, gradient descent) à l'implémentation complète. Code commenté et visualisations pas à pas.
Lire l'article →Qu'est-ce que le Machine Learning ? Apprentissage supervisé, non-supervisé, par renforcement. Les algorithmes essentiels, les métriques d'évaluation et les cas d'usage concrets. Le point de départ de toute formation en IA.
Lire l'article →Vecteurs, matrices, espaces vectoriels, décompositions, valeurs propres — les briques mathématiques fondamentales qui sous-tendent tout algorithme de ML et de Deep Learning. Notations, théorèmes clés et intuitions géométriques.
Lire l'article →