Actu Smile

DeepSeek, l'avis de notre Expert-Testeur sur ce nouveau modèle

  • Date de l’événement 29 Jan. 2025
  • Temps de lecture min.

Découvrez l’avis de Jamel Ben Amar, CTO Smile, sur DeepSeek R1 le nouveau modèle d’IA Open Source, performant et à faible coût qui bouleverse l'industrie de l'IA.

Constat et état des lieux

DeepSeek, une startup chinoise spécialisée en intelligence artificielle, a récemment dévoilé DeepSeek R1, un modèle de raisonnement avancé qui rivaliserait avec les meilleures solutions d’OpenAI, tout en étant développé à une fraction de leur coût. Son développement aurait coûté seulement 6 millions de dollars, contre plus de 600 millions pour GPT-4 d’OpenAI, bien que ce chiffre reste à confirmer. Au-delà de son accessibilité financière, son coût d’utilisation est également bien inférieur, avec moins de 4 dollars par million de jetons, contre plus de 100 dollars pour OpenAI. Open source et distribué sous une licence permissive, DeepSeek R1 se distingue par sa capacité à divulguer entièrement ses étapes de raisonnement, renforçant ainsi la transparence et la compréhension des décisions prises par l’IA.

 

Des répercussions importantes dans l’industrie de l’IA 

L’arrivée fulgurante de DeepSeek R1 a provoqué une onde de choc dans l’industrie de l’intelligence artificielle, entraînant des répercussions majeures sur les marchés financiers. En quelques jours, les actions américaines ont vu s’envoler 2 billions de dollars de capitalisation boursière, tandis que NVIDIA a perdu plus de 500 milliards de dollars. Ce séisme financier met en péril l’avantage historique de la Silicon Valley en matière d’IA, remettant en question sa domination face à l’ascension rapide des acteurs chinois. Désormais, toutes les attentions se tournent vers la Chine, dont la montée en puissance dans l’intelligence artificielle pourrait redéfinir les rapports de force technologiques mondiaux.

 

L’avis de notre Expert 

DeepSeek R1 marque un tournant majeur dans l’intelligence artificielle, redéfinissant les standards établis et remettant en question les hypothèses sur les ressources nécessaires à la création de modèles performants. "DeepSeek R1 représente un changement de paradigme dans l'IA, remettant en question les hypothèses sur les ressources nécessaires pour construire des modèles performants." Contrairement à une idée répandue, ces modèles ne sont pas totalement nouveaux. "Nous testons DeepSeek-Coder-V2 depuis 2 mois et sommes impressionnés par sa capacité à intégrer le contexte, l'environnement et les frameworks utilisés par nos développeurs, pour une autocomplétion intelligente et un raisonnement pertinent." Ces tests, réalisés on-premise avec un modèle DeepSeek-Coder-V2-Lite-Instruct de 16B, démontrent le potentiel de cette technologie à s’adapter aux environnements spécifiques des développeurs, ouvrant la voie à des applications avancées et optimisées en IA générative.

DeepSeek offre une alternative plus accessible, transparente et efficiente aux modèles d'IA dominants comme GPT et Gemini. Son développement en Chine marque un tournant dans le paysage de l'IA, remettant en question l'hégémonie américaine et ouvrant de nouvelles perspectives pour l'innovation.

test

Jamel Ben Amar

CTO