Ejercicio 5: La IA no sabe contar (El test del Sudoku)
Introducción: Existe el mito de que la IA es una supercomputadora lógica que nunca se equivoca. Hoy vamos a demostrar que Gemini es, en realidad, un "artista del lenguaje" que a menudo alucina cuando se enfrenta a reglas lógicas sencillas. Si la IA te miente en un juego de niños, ¿te puedes fiar de ella para algo importante?
🧪 Fase 1: El Desafío
Entra en
y elige un Sudoku (nivel fácil o medio).LiveSudoku Haz una captura de pantalla del tablero sin resolver.
Sube la imagen a Gemini con el siguiente prompt:
"Analiza esta imagen y resuelve el Sudoku. Muéstrame el tablero final y explícame los pasos que has seguido para completar las filas y columnas."
🔍 Fase 2: La Auditoría (Caza al error)
No des por hecho que la respuesta es correcta. Revisa el resultado con ojo crítico:
¿Se ha saltado las reglas? Busca números repetidos en la misma fila, columna o región de 3x3.
¿Ha pisado casillas? Comprueba si ha intentado poner un número en una posición que ya estaba ocupada en la imagen original.
El careo: Si encuentras un error, dile: "En la fila X has repetido el número Y, ¿estás seguro de que es correcto?". Observa cómo pide perdón y, probablemente, vuelve a fallar.
✍️ Evidencia en el Blog: "Pillando al mentiroso digital"
Crea una entrada con los siguientes elementos:
La Prueba del Delito: Sube la captura del Sudoku original y la captura de la respuesta de Gemini donde se vea claramente el error (márcalo con un círculo rojo en la herramienta recortes).
La Confianza Ciega: Pega el texto donde la IA afirma que su solución es correcta. Es importante mostrar cómo "miente con seguridad".
Análisis Técnico (La Reflexión):
¿Por qué crees que una IA capaz de escribir código de programación o poemas falla en un Sudoku?
Explicación: Investiga y explica brevemente qué es una "alucinación" en un modelo de lenguaje (LLM).
Conclusión: ¿Qué nos enseña este ejercicio sobre el uso de la IA en trabajos escolares o investigación profesional?
No hay comentarios:
Publicar un comentario