Teliquos

Teliquos

Evaluaciones interactivas de sistemas IA con feedback instantáneo

Proyectos de estudiantes en sistemas de IA

Aquí puedes ver trabajos reales de nuestros estudiantes. Estos proyectos muestran cómo aplican conceptos de pruebas de IA en casos prácticos: desde validación de modelos de lenguaje hasta análisis de rendimiento en sistemas de visión computacional. Cada proyecto refleja conocimiento técnico aplicado y enfoque metodológico en la evaluación de sistemas inteligentes.

Proyectos destacados

Estos trabajos representan diferentes áreas de testing en IA: validación de modelos, análisis de datasets, pruebas de robustez y evaluación de sistemas en producción. Los estudiantes documentaron proceso, metodología y resultados obtenidos.

Proyecto de validación de modelo de clasificación de imágenes médicas

Validación de modelo de clasificación médica

Sistema de testing para modelo de clasificación de radiografías. Incluye análisis de precisión por clase, detección de falsos positivos críticos, validación cruzada con dataset real de hospital. Se documentaron casos límite y se propusieron mejoras en preprocesado de imágenes.

Python TensorFlow Pytest Confusion Matrix
94.3% Precisión
1,200 Casos test
8 Semanas
Implementado en entorno de validación clínica
Proyecto de análisis de robustez en chatbot de atención al cliente

Testing de robustez en chatbot

Evaluación de sistema conversacional basado en GPT-3 para atención al cliente. Se diseñaron 340 casos de prueba incluyendo inputs malformados, consultas ambiguas, intentos de prompt injection y análisis de respuestas bajo carga. Documentación completa de comportamiento ante edge cases.

OpenAI API Postman Selenium JMeter
340 Escenarios
87% Cobertura
6 Semanas
Detectó 12 vulnerabilidades críticas de seguridad

Análisis de bias en sistema de recomendación

Evaluación de sesgos demográficos en algoritmo de recomendación de contenido educativo. Se analizó distribución de recomendaciones por género, edad y región. Métrica de equidad implementada y validada con dataset sintético. Propuestas de mitigación documentadas con impacto medido.

Pandas Scikit-learn Fairlearn Jupyter
5.2% Sesgo inicial
15K Registros
7 Semanas
Reducción de sesgo al 1.8% tras implementación

Validación de modelo de detección de fraude

Testing de sistema de detección de transacciones fraudulentas usando redes neuronales. Se validaron umbrales de decisión, análisis de falsos negativos costosos, evaluación de drift en producción simulada. Métricas de negocio integradas en suite de pruebas automatizada.

PyTorch MLflow Docker Grafana
98.1% Recall
2.3M Transacciones
9 Semanas
Pipeline CI/CD completo con monitoreo automático