Gemma 3 : que vaut le nouveau modèle d’IA open source de Google ?

Google dévoile Gemma 3, 9 mois après Gemma 2 ! Plus puissant et accessible, il fonctionne sur un seul GPU ou TPU et comprend plus de 140 langues. Avec des capacités améliorées en analyse de texte et d’image, il s’intègre facilement aux outils existants. Google renforce aussi la sécurité avec ShieldGemma 2, un filtre anti-contenus sensibles.

Ce qu'il faut retenir :

Gemma 3 est un modèle d'IA plus performant et accessible, optimisé pour fonctionner sur un seul GPU ou TPU.
Il prend en charge plus de 140 langues, facilitant son adoption à l'international.
Ses capacités avancées en analyse de texte et d'image permettent de traiter des contenus variés, y compris des vidéos courtes.
Google met l'accent sur la sécurité avec ShieldGemma 2, un outil dédié à la détection des contenus sensibles.

Google accélère l’innovation avec Gemma 3

Un an après le lancement de la première version de Gemma, et 9 mois après Gemma 2, Google continue sur sa lancée en annonçant Gemma 3, une nouvelle génération de modèles d’intelligence artificielle open source. Conçu pour être léger, performant et adaptable, ce modèle s’appuie sur la technologie de Gemini 2.0 et vise à démocratiser l’IA, en permettant son exécution sur divers matériels, du PC classique aux infrastructures cloud.

Des performances optimisées

Gemma 3 se distingue par sa capacité à offrir des performances de pointe tout en restant léger. Contrairement à d’autres modèles nécessitant plusieurs cartes graphiques haut de gamme, Gemma 3 peut fonctionner sur un seul GPU ou TPU, le rendant bien plus accessible aux chercheurs et entreprises disposant d’une puissance de calcul limitée.

Dans les premiers tests de préférence utilisateur sur le benchmark LMArena, Gemma 3 a surpassé des concurrents tels que Llama-405B, DeepSeek-V3 et o3-mini, confirmant son efficacité à taille égale.

Différentes tailles de modèles pour s’adapter aux besoins

Gemma 3 est décliné en quatre versions :

1B paramètres : pour des applications légères et mobiles.
4B paramètres : équilibré entre puissance et consommation de ressources.
12B paramètres : idéal pour des tâches avancées avec des besoins plus conséquents.
27B paramètres : la version la plus puissante, optimisée pour un seul GPU haut de gamme.

Une IA vraiment multilingue

Gemma 3 est compatible avec plus de 140 langues. Contrairement à d'autres modèles qui peinent à comprendre autre chose que l’anglais, ce nouveau modèle peut traiter efficacement des textes complexes dans de nombreuses langues, pour faciliter son adoption à l’international.

Les entreprises et développeurs peuvent concevoir des applications capables de s’adapter à divers marchés sans nécessiter de lourdes phases de traduction ou d'entraînement supplémentaire.

Des capacités avancées en analyse de texte et d’image

L’une des plus grosses évolutions de Gemma 3 réside dans ses capacités de raisonnement multimodal. Il ne se contente pas d’analyser du texte : il peut également traiter des images et même de courtes vidéos.

Une fenêtre de contexte étendue pour une meilleure compréhension

Gemma 3 propose une fenêtre de contexte de 128 000 tokens, un atout pour les applications nécessitant une compréhension approfondie de longs documents. Cette fonctionnalité permet d’éviter la fragmentation des conversations et d’améliorer la pertinence des réponses.

Automatisation avec l’appel de fonctions

Grâce à la prise en charge de l’appel de fonctions, Gemma 3 permet aux développeurs de concevoir des systèmes intelligents capables d’exécuter des tâches automatisées en fonction des interactions...

Derniers événements

Derniers Articles