Bonjour et bienvenue dans L'IA Aujourd’hui, le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : Des avancées majeures avec Qwen2.5-Max et DeepSeek, les défis du lancement de LUCIE et l'impact potentiel de l'IA sur le revenu de base universel. C’est parti !Commençons avec la présentation de Qwen2.5-Max. Ce nouveau modèle d'intelligence artificielle à mélange d'experts (MoE) a été pré-entraîné sur plus de 20 trillions de tokens et post-entraîné grâce au Supervised Fine-Tuning et au Reinforcement Learning from Human Feedback. Disponible via Alibaba Cloud, Qwen2.5-Max surpasse DeepSeek V3 dans plusieurs benchmarks tels que Arena-Hard, LiveBench et LiveCodeBench, tout en offrant des performances compétitives sur MMLU-Pro. Les utilisateurs peuvent désormais interagir avec Qwen2.5-Max sur Qwen Chat ou intégrer son API, compatible avec celle d'OpenAI, dans leurs applications.Passons maintenant à DeepSeek, qui fait sensation dans le monde de l'intelligence artificielle. Cette startup chinoise a réussi à entraîner ses modèles d'IA à un coût réduit à seulement 1/30e du coût habituel, défiant ainsi les géants du secteur. Leur application est rapidement devenue virale, surpassant même ChatGPT dans les classements des magasins d'applications. DeepSeek a atteint cet exploit en optimisant le matériel existant plutôt qu'en s'appuyant sur des puces sophistiquées. Ils ont entraîné uniquement les parties essentielles de leurs modèles, réduisant le gaspillage de ressources. De plus, ils ont utilisé une technique innovante de compression pour réduire les coûts d'inférence et ont mis l'accent sur l'apprentissage par renforcement pour améliorer l'efficacité.Cette réussite a eu un impact significatif sur le marché américain. DeepSeek est devenue l'application la plus populaire sur l'App Store d'Apple aux États-Unis, dépassant les modèles d'OpenAI. Cette avancée a provoqué une chute de plus de 12 % des actions de Nvidia, soulevant des questions sur la domination potentielle des entreprises américaines comme OpenAI et Nvidia dans l'industrie de l'IA. Malgré les restrictions américaines sur l'exportation de puces avancées vers la Chine, DeepSeek a réussi à développer des modèles performants, remettant en question l'idée que la puissance matérielle est le principal moteur de l'innovation en IA.Cependant, tout ne se passe pas sans embûches dans le domaine de l'IA. Le lancement de LUCIE, un modèle de langage open source français, en est un exemple. Dévoilé le 22 janvier 2025 lors du Paris Open Source AI Summit, LUCIE est le fruit d'une collaboration entre Linagora et le consortium OpenLLM France. Malgré un entraînement sur un corpus de 3 000 milliards de tokens et une architecture ambitieuse inspirée de Llama 3.1, le lancement a été entaché de problèmes techniques et des résultats décevants. Les utilisateurs ont rencontré des temps d'attente prolongés et des erreurs flagrantes dans les réponses fournies par LUCIE. Cette situation souligne l'importance d'une communication transparente et d'une phase de test maîtrisée lors du déploiement de nouveaux modèles d'IA.Sur un autre plan, l'essor de l'intelligence artificielle relance le débat sur le revenu de base universel. L'idée que l'IA pourrait automatiser de nombreuses tâches humaines soulève des questions sur l'avenir du travail. Si l'IA venait à remplacer une grande partie des emplois actuels, le RBU pourrait devenir une nécessité pour couvrir les besoins de base de la population. L'IA pourrait même contribuer à financer ce RBU en générant une valeur économique supplémentaire grâce à l'automatisation et à l'efficacité. Cependant, cette vision s'accompagne de défis technologiques, comme la résolution des problèmes d'"hallucination" de l'IA, et sociopolitiques, tels que l'acceptation publique d'un tel système.Enfin, DeepSeek continue de bousculer l'industrie de l'IA en dévoilant des modèles toujours plus performants. Leur modèle phare, le R1, est réputé rivaliser avec l'équivalent o1 d'OpenAI. De plus, leur modèle multimodal Janus Pro surpasserait des solutions établies comme Stable Diffusion et DALL-E 3. Ces modèles sont désormais disponibles sur des plateformes telles qu'Azure AI Foundry de Microsoft et GitHub, permettant une adoption plus large. Cependant, des enquêtes sont en cours pour déterminer si DeepSeek a utilisé des ressources d'OpenAI dans le développement de ses modèles, ce qui pourrait entraîner des implications légales.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.