Puerta Crítica v1: cómo dejamos de enviar átomos equivocados
Detrás de la cadena de verificación de cuatro pasos que se ejecuta en cada respuesta química de cheemly. Por qué elegimos RDKit, OPSIN y Semantic Scholar.
¿Qué es el Critic Gate?
El Critic Gate es una capa de verificación determinista que comprueba cada respuesta de química que produce Cheemly antes de mostrarla al usuario. A diferencia del modelo de lenguaje que redacta la respuesta, la puerta no ejecuta ninguna IA: es código simple y auditable que o bien aprueba un resultado o bien lo devuelve para que se reescriba. Su trabajo es hacer imposible que se envíen estructuras alucinadas y citas inventadas.
Por qué una puerta independiente
Los grandes modelos de lenguaje son fluidos pero poco fiables en hechos exactos: inventan SMILES de aspecto plausible y citan artículos que no existen. No puedes arreglar esto pidiéndole al modelo que «tenga cuidado». La única solución duradera es verificar la salida frente a la verdad de referencia con software que no tiene ningún incentivo para complacer. Esa separación —un redactor fluido más un verificador estricto— es el núcleo del diseño de Cheemly.
Las cuatro comprobaciones
- Validez del SMILES: RDKit analiza cada estructura. Si no se analiza, no se envía.
- Conservación de átomos: Para cualquier reacción, los átomos de los reactivos deben igualar los de los productos. Una reacción que pierde o inventa átomos se rechaza.
- Viaje de ida y vuelta del nombre: OPSIN convierte los nombres IUPAC a estructuras y viceversa; una discrepancia señala un error de nomenclatura.
- Existencia de la cita: Cada DOI se comprueba frente a Semantic Scholar. Un artículo que no se puede verificar se elimina.
Qué ocurre cuando falla
Una comprobación fallida no produce un mensaje de error para el usuario. En su lugar, la respuesta se reenvía al redactor con el fallo específico como retroalimentación y —si es necesario— se escala a un modelo más potente. Tras un número acotado de reintentos, cualquier cosa que siga fallando se muestra con una insignia de baja confianza en lugar de presentarse como un hecho. El usuario nunca recibe en silencio una estructura errónea.
Por qué esto es el foso
La conservación de átomos es una ley de la naturaleza, no una preferencia de estilo. Codificarla como una puerta estricta significa que el nivel mínimo de Cheemly lo fija la química, no lo seguro que suene el modelo. Esa es la diferencia entre una herramienta de química y un chatbot que habla de química.
Preguntas frecuentes
- ¿El Critic Gate utiliza IA?
- No. El Critic Gate es código determinista: análisis con RDKit, aritmética de balance de átomos, viajes de ida y vuelta con OPSIN y búsquedas de citas. No tiene modelo de lenguaje ni aleatoriedad, por lo que sus veredictos son reproducibles y auditables.
- ¿Qué ocurre cuando una respuesta no supera el Critic Gate?
- La respuesta se devuelve al redactor con el fallo específico como retroalimentación y puede escalarse a un modelo más potente. Tras un número acotado de reintentos, cualquier cosa que siga fallando se muestra con una insignia de baja confianza en lugar de presentarse como un hecho.
- ¿Por qué ChatGPT no puede hacer esto sin más?
- Los LLM generales generan química de forma probabilística y no tienen ninguna comprobación de verdad de referencia integrada, por lo que envían estructuras y citas plausibles pero erróneas. Una puerta de verificación determinista es una decisión arquitectónica, no un mensaje que puedas añadir.