Sometemos modelos a cargas contradictorias de pliegos y contratos para medir el punto en que la fiabilidad se degrada. El objetivo es definir umbrales operativos seguros, no titulares.
AI-Gen Lab. Donde estresamos la IA antes de que llegue a tu negocio.
Nuestro laboratorio de investigación aplicada: pruebas de fatiga de modelos, desarrollo experimental de agentes autónomos y análisis de vulnerabilidades de seguridad. Lo que aquí sobrevive, se convierte en producto.
Honestidad científica: mostramos el método, reservamos el motor.
El Lab existe para una cosa: fallar pronto y en privado, para que tú no falles tarde y en producción. Publicamos lo que aprendemos —patrones de riesgo, límites reales, criterios de control— pero no la arquitectura interna, los evaluadores ni los pesos que dan ventaja a nuestros clientes.
- Sin claims de "100% de acierto". Reportamos tasas, límites y condiciones de fallo.
- Reproducibilidad interna, no demos irreproducibles de cara a galería.
- Revisión humana experta antes de elevar cualquier hallazgo a un cliente.
- Propiedad intelectual reservada: el conocimiento que da ventaja competitiva queda reservado.
Líneas de investigación abiertas.
Una selección de lo que estamos probando. Resultados de alto nivel; el detalle técnico se comparte bajo NDA con clientes y socios.
Prototipos de agentes que estructuran documentación, comparan versiones y proponen borradores — siempre con un punto de parada obligatorio antes de cualquier acción con consecuencias.
Evaluamos prompt injection, fuga de datos y manipulación de salidas contra el catálogo OWASP LLM. Lo que rompemos aquí se convierte en controles del toolkit de Assurance.
Métricas, no impresiones.
Dos indicadores guían el trabajo del Lab y alimentan los informes de Assurance. Se describen aquí a nivel conceptual; su cálculo interno queda reservado.
En el banco de pruebas.
Clause Diff Engine
Comparación semántica de cláusulas entre versiones de un contrato, señalando cambios de obligación, plazo y penalización.
No apto para producción. Resultados sujetos a validación humana.
Tender Risk Map
Mapa visual de riesgos de una licitación: obligaciones omitidas, incoherencias y desviaciones frente al pliego, con trazabilidad a la fuente.
Alimenta el motor de C2Pro. Preparado para validación con organizaciones piloto.
Vendor Probe
Cuestionario asistido de due diligence que evalúa la postura de seguridad y gobernanza de un proveedor de software con IA.
Base del toolkit de Assurance. Revisión experta obligatoria.
¿Un caso documental complejo que ningún software resuelve bien?
Seleccionamos un número reducido de retos reales para investigar junto a organizaciones piloto. Acceso temprano a prototipos, condiciones de fundador y un informe de hallazgos bajo NDA.
- Acceso temprano a prototipos del Lab
- Informe de hallazgos bajo NDA
- Sin uso de tus documentos para entrenar modelos externos