CONFIDENTIALITÉMMXXVI

Des outils IA qui ne s'entraînent pas sur vos prompts.
Ce que cela veut dire, et ce que cela ne veut pas dire.

L'entraînement sur les prompts utilisateurs a été le modèle économique par défaut de l'IA grand public depuis la première génération de chatbots. L'économie est évidente : chaque conversation est une annotation gratuite. Le problème est tout aussi évident pour quiconque travaille avec du matériel confidentiel. Cette page expose où se situent les outils majeurs aujourd'hui, comment Namulai est configuré, et ce que la formule pas d'entraînement couvre vraiment en pratique.

Essayer Namulai gratuitement30 jours d'essai gratuit · 19,80 €/mois ensuite · résiliable à tout moment

01 / LE DÉFAUT

Pourquoi l'entraînement sur les données utilisateurs est devenu la norme

Les modèles fondation s'améliorent quand ils voient plus de données, et les conversations utilisateurs sont une source inhabituellement riche : elles reflètent de vraies tâches, de vrais domaines, et le genre de cas limites qu'un jeu d'entraînement curaté capture rarement. Pour le fournisseur, récolter ces données est presque gratuit. Pour l'utilisateur, le coût est opaque, parce que le prompt a déjà été envoyé avant qu'aucun dialogue de consentement n'ait été lu sérieusement.

La conséquence pratique, c'est que tout ce qui est collé dans un palier grand public par défaut d'un chatbot majeur — code source, mails clients, brouillons de contrats — a historiquement eu une chance non nulle d'influencer les futurs poids du modèle. Que ce matériel puisse jamais être extrait du modèle résultant est une question de recherche distincte et non résolue.

02 / L'ÉTAT DES LIEUX

Où en sont les outils IA majeurs

Le tableau s'est amélioré, de manière inégale. OpenAI a changé le défaut de ChatGPT en 2024 pour que les conversations grand public ne soient pas utilisées pour l'entraînement sauf opt-in, avec une posture différente pour ChatGPT Team et Enterprise où l'entraînement est désactivé par défaut et engagé contractuellement. Anthropic a déclaré que Claude ne s'entraîne pas sur les conversations API ou produit payant, avec des exceptions plus étroites pour la revue de sécurité.

Google Gemini, Meta AI et plusieurs fournisseurs plus petits gardent des défauts plus permissifs sur les paliers gratuits. Le résumé honnête, c'est que le pas-d'entraînement est désormais atteignable pour la plupart des cas d'usage professionnels, mais cela demande de lire les conditions spécifiques au palier sur lequel vous êtes, plutôt que de supposer une réponse uniforme par catégorie.

03 / NOTRE POLITIQUE

La politique de Namulai sur l'entraînement

Namulai n'entraîne aucun modèle sur vos prompts ou vos complétions. Nous ne faisons tourner aucun pipeline d'entraînement. Le produit est une interface et un routeur d'inférence, pas un laboratoire de modèles.

En dessous, l'inférence passe par OpenRouter, qui a la conservation côté fournisseur désactivée par défaut pour les fournisseurs qui le supportent. Cela veut dire que le fournisseur amont ne logue pas le prompt à des fins d'entraînement, sous réserve de la conservation opérationnelle courte standard nécessaire à la détection d'abus, qui se mesure typiquement en jours plutôt qu'en mois. Nous persistons votre historique de conversation dans notre propre base pour que vous puissiez le relire plus tard, et nous le supprimons sur demande. C'est tout le flux de données.

04 / PRÉCISION

Ce que pas d'entraînement couvre et ne couvre pas

Pas d'entraînement est un engagement tourné vers l'avenir sur les futures versions de modèles. Cela ne déroule pas rétroactivement le corpus de pré-entraînement sur lequel les modèles sous-jacents ont été bâtis, qui a été assemblé par les fournisseurs originels à partir de données web publiques et de sources sous licence, bien avant l'existence de votre compte.

Cela ne veut pas dire non plus que votre prompt est invisible pendant la requête elle-même. Le modèle doit voir votre prompt pour y répondre, au même sens qu'un moteur de recherche doit voir votre requête. Cet usage en contexte cesse quand la réponse est rendue. La distinction entre l'exposition transitoire en contexte et l'absorption permanente dans le prochain entraînement est celle qui compte, et c'est celle sur laquelle nous nous engageons.

05 / VÉRIFICATION

Comment vérifier la posture d'un outil sur l'entraînement

Les pages marketing ne sont pas des contrats. Les déclarations vérifiables vivent dans trois endroits : les conditions générales, l'addenda de traitement des données, et toute liste de sous-traitants publiée. Lisez-les dans cet ordre.

Pour tout outil que vous envisagez, cherchez une clause explicite et précise indiquant que le contenu client n'est pas utilisé pour entraîner les modèles, avec le palier sur lequel vous êtes nommé. Cherchez une fenêtre de conservation exprimée en jours ou mois plutôt qu'en durée indéterminée. Cherchez une liste de sous-traitants publiée, parce qu'une promesse de pas-d'entraînement ne vaut que ce que vaut le maillon le plus faible de la chaîne. Si l'un de ces éléments manque, l'hypothèse prudente est que l'outil n'est pas configuré comme la page d'accueil le laisse entendre, et il faut le traiter en conséquence.

06 / FAQ

Entraînement et conservation, questions fréquentes

Namulai utilise-t-il mes conversations pour entraîner de l'IA ?

Non. Nous n'opérons pas de pipeline d'entraînement et nous ne transmettons pas de contenu de conversation à un tiers à des fins d'entraînement. Vos prompts servent à générer la réponse du modèle en temps réel, sont persistés dans notre base pour que vous puissiez revenir à la conversation, et sont supprimés quand vous supprimez la conversation ou votre compte.

Et OpenRouter et les fournisseurs sous-jacents ?

Namulai route l'inférence via OpenRouter avec la conservation côté fournisseur désactivée par défaut. Les fournisseurs sous-jacents voient le prompt le temps de la requête et appliquent une conservation opérationnelle courte, typiquement en jours, pour la détection d'abus. Ils ne conservent pas le contenu pour l'entraînement sous la configuration que nous utilisons.

Les modèles eux-mêmes ont-ils été entraînés sur des données sans consentement ?

Les modèles fondation précèdent Namulai et ont été pré-entraînés par leurs fournisseurs originels sur de larges corpus de texte web public et de matériel sous licence. Nous n'avons aucun contrôle sur ce pré-entraînement historique et nous ne prétendrions pas le contraire. Notre engagement s'applique à ce qui se passe avec vos données à partir du moment où elles entrent dans Namulai.

Comment vérifier que rien n'est conservé ?

Vous pouvez lire nos conditions et la politique de données OpenRouter, qui décrivent toutes deux la configuration en termes concrets. Vous pouvez aussi supprimer une conversation ou votre compte entier depuis les paramètres et observer que les enregistrements sont purgés de MongoDB sous 30 jours via les index TTL. Nous sommes heureux d'accompagner un client potentiel à travers l'architecture sur demande.

Utilisez des modèles de pointe pour du vrai travail, sans nourrir le prochain entraînement.

Essayer Namulai gratuitement

30 jours d'essai gratuit · 19,80 €/mois ensuite · résiliable à tout moment

Des outils IA qui ne s'entraînent pas sur vos prompts. Ce que cela veut dire, et ce que cela ne veut pas dire.