Porte Critique v1: comment on a arrêté de livrer de mauvais atomes
Derrière la chaîne de vérification en quatre étapes qui s'exécute sur chaque réponse chimie de cheemly. Pourquoi RDKit, OPSIN et Semantic Scholar.
Qu’est-ce que le Critic Gate ?
Le Critic Gate est une couche de vérification déterministe qui contrôle chaque réponse de chimie produite par Cheemly avant qu’elle ne soit montrée à l’utilisateur. Contrairement au modèle de langage qui rédige la réponse, ce portail n’exécute aucune IA — c’est du code simple et auditable qui, soit valide un résultat, soit le renvoie pour réécriture. Son rôle est de rendre impossible la diffusion de structures hallucinées et de citations inventées.
Pourquoi un portail séparé
Les grands modèles de langage sont fluides mais peu fiables sur les faits exacts : ils inventent des SMILES d’apparence plausible et citent des articles qui n’existent pas. On ne corrige pas cela en demandant au modèle d’« être prudent ». La seule correction durable consiste à vérifier la sortie face à une vérité de terrain à l’aide d’un logiciel qui n’a aucune raison de chercher à plaire. Cette séparation — un rédacteur fluide doublé d’un vérificateur strict — est au cœur de la conception de Cheemly.
Les quatre vérifications
- Validité du SMILES : RDKit analyse chaque structure. Si elle ne s’analyse pas, elle n’est pas diffusée.
- Conservation des atomes : pour toute réaction, les atomes des réactifs doivent égaler ceux des produits. Une réaction qui perd ou invente des atomes est rejetée.
- Aller-retour des noms : OPSIN convertit les noms IUPAC en structures et inversement ; une non-correspondance signale une erreur de nomenclature.
- Existence des citations : chaque DOI est vérifié auprès de Semantic Scholar. Un article impossible à vérifier est supprimé.
Que se passe-t-il en cas d’échec
Une vérification échouée ne produit pas de message d’erreur pour l’utilisateur. La réponse est plutôt renvoyée au rédacteur avec l’échec précis en guise de retour et — si nécessaire — escaladée vers un modèle plus puissant. Après un nombre borné de tentatives, tout ce qui échoue encore est présenté avec un badge de faible confiance plutôt que comme un fait. L’utilisateur ne reçoit jamais silencieusement une structure erronée.
Pourquoi c’est le fossé concurrentiel
La conservation des atomes est une loi de la nature, pas une préférence de style. L’encoder comme un portail strict signifie que le socle de Cheemly est défini par la chimie, et non par l’assurance avec laquelle le modèle s’exprime. C’est là toute la différence entre un outil de chimie et un chatbot qui parle de chimie.
Questions fréquentes
- Le Critic Gate utilise-t-il de l’IA ?
- Non. Le Critic Gate est du code déterministe — analyse RDKit, arithmétique du bilan atomique, allers-retours OPSIN et recherches de citations. Il n’a ni modèle de langage ni aléatoire, ses verdicts sont donc reproductibles et auditables.
- Que se passe-t-il lorsqu’une réponse échoue au Critic Gate ?
- La réponse est renvoyée au rédacteur avec l’échec précis en guise de retour et peut être escaladée vers un modèle plus puissant. Après un nombre borné de tentatives, tout ce qui échoue encore est affiché avec un badge de faible confiance plutôt que présenté comme un fait.
- Pourquoi ChatGPT ne peut-il pas simplement faire cela ?
- Les LLM généralistes génèrent la chimie de façon probabiliste et n’ont aucune vérification intégrée face à une vérité de terrain ; ils diffusent donc des structures et des citations plausibles mais fausses. Un portail de vérification déterministe est un choix d’architecture, pas une consigne que l’on peut ajouter.