Gemma 4 de Google sous Apache 2.0 : vraiment open source ?

Google a publié Gemma 4 le 2 avril 2026 sous licence Apache 2.0, une première pour la famille Gemma. Quatre variantes sont disponibles, de 2,3 à 31 milliards de paramètres. Mais la question que se posent développeurs et entreprises est légitime : cette licence signifie-t-elle que Gemma 4 est vraiment open source ?


Le problème : les licences Gemma ont longtemps freiné les usages

Les versions précédentes (Gemma 1, 2 et 3) utilisaient les « Gemma Terms of Use », une licence propriétaire qui imposait des restrictions concrètes. Parmi elles : une limite de 700 millions d’utilisateurs actifs mensuels pour l’usage commercial, l’obligation de transmettre ces conditions à tout redistributeur, et un droit explicitement réservé à Google de « restreindre à distance l’utilisation de tout service Gemma ». Le modèle pouvait être révoqué. La licence était juridiquement contraignante sur les usages. Pour des équipes qui construisent des produits sur la durée, c’était un risque réel.

gemma-4-apache-2-0-comparaison-licence-osi

L’agitation : le « open source washing » reste un réflexe de méfiance justifié

Le terme « open source » appliqué aux modèles d’IA est contesté depuis plusieurs années. L’Open Source Initiative a publié en octobre 2024 sa définition officielle de l’IA open source (OSAID v1.0). Elle exige trois composantes : les poids du modèle sous licence approuvée OSI, le code source complet pour l’entraînement, et les informations sur les données d’entraînement suffisantes pour reproduire le système.

Gemma 4 remplit la première condition. Les deux autres restent incomplètes. Google décrit ses données d’entraînement comme « large-scale multimodal pre-training data » avec une date de coupure janvier 2025, sans détailler la composition du corpus. Le code d’entraînement complet n’est pas publié. Hugging Face le note explicitement dans son billet de lancement : les informations sur le mix d’entraînement ne sont pas disponibles.

Llama 4 de Meta est dans la même situation. La majorité des modèles dits « ouverts » ne satisfont pas la définition OSI. Seuls quelques modèles académiques comme OLMo ou Pythia la remplissent réellement. La tendance se retrouve aussi dans les outils IA open source qui s’appuient sur ces modèles : la transparence de la licence ne garantit pas celle du code sous-jacent.


La solution : ce que Apache 2.0 change concrètement

Sur le plan légal, le changement est substantiel. Apache 2.0 est une licence standard reconnue par l’OSI, sans restrictions d’usage commercial, sans seuil d’utilisateurs, sans droit de révocation. Google ne peut plus imposer de contraintes supplémentaires une fois le modèle distribué sous cette licence.

Ce que Apache 2.0 autorise sans condition : usage commercial illimité, redistribution libre (avec attribution), fine-tuning et modification sans restriction, intégration dans des produits propriétaires.

Une « Gemma Prohibited Use Policy » existe toujours et reste référencée dans la model card officielle. Sauf qu’elle n’est plus juridiquement contraignante : sous Apache 2.0, elle constitue une recommandation éthique, pas une restriction légale opposable. C’est un changement de nature fondamental.

La qualification la plus précise reste « modèle à poids ouverts sous licence open source approuvée OSI ». Google lui-même utilise le terme « open models » dans ses communications, pas « open source AI ». La nuance est volontaire.

DroitStatut sous Apache 2.0Ancien statut (Gemma 1-3)
Usage commercial sans restriction✅ Aucune limite❌ Conditions et seuils d’utilisateurs
Redistribution✅ Libre, avec attribution❌ Obligation de transmettre les Gemma Terms
Modification et fine-tuning✅ Sans restriction⚠️ Cadré par la politique d’usage
Révocation par Google❌ Impossible sous Apache 2.0✅ Google pouvait résilier et exiger la suppression
Restrictions d’usage contraignantes❌ Aucune✅ Prohibited Use Policy juridiquement intégrée

C’est ce que permettent concrètement les cas d’usage Gemma déjà en production, comme la traduction multilingue de sites web.


FAQ

Peut-on utiliser Gemma 4 dans un produit commercial sans payer de droits à Google ?

Oui. La licence Apache 2.0 n’impose aucune redevance ni seuil d’utilisateurs pour un usage commercial. C’est la différence principale avec les versions précédentes de Gemma.

Les données d’entraînement de Gemma 4 sont-elles accessibles ?

Non. Google fournit une description générale du corpus mais ne divulgue pas la composition détaillée ni le code d’entraînement complet. Gemma 4 ne satisfait pas la définition stricte de l’IA open source selon l’OSI.

Gemma 4 est-il plus ouvert que Llama 4 de Meta ?

Sur la licence, oui. Apache 2.0 est plus permissive que la Meta Community License, qui impose un seuil de 700 millions d’utilisateurs actifs mensuels et des restrictions sur l’entraînement de modèles dérivés. Sur la transparence des données d’entraînement, les deux sont comparables : ni l’un ni l’autre ne les divulgue.

Conclusion

Le passage à Apache 2.0 est un signal clair : Google abandonne le contrôle légal sur l’utilisation de Gemma et supprime les restrictions commerciales qui freinaient son adoption. La licence est Apache 2.0, approuvée par l’OSI. Ça, personne ne peut le contester. Ce qui reste ouvert au débat, c’est l’étiquette « open source » appliquée au modèle lui-même, puisque les données d’entraînement ne sont pas publiées.