¿Qué es el aprendizaje automático? Una guía sencilla
Jazmie JamaludinImagina enseñar a un niño a reconocer un gato. No le das un libro de reglas que diga "cuatro patas, orejas puntiagudas, bigotes, cola". Señalas a los gatos. "Eso es un gato". "Eso también es un gato". Después de suficientes ejemplos, algo hace clic, y el niño puede identificar un gato que nunca antes había visto, incluso uno gordo, sin pelo o medio escondido detrás de una cortina. El aprendizaje automático funciona de manera muy similar. En lugar de programar una computadora con instrucciones explícitas para cada situación, le muestras ejemplos y le permites que descubra el patrón.
Ese simple cambio, de escribir reglas a aprender de los datos, es una de las ideas más importantes en la tecnología moderna. Impulsa silenciosamente el filtro de spam que mantiene tu bandeja de entrada limpia, la aplicación que reconoce tu cara, las recomendaciones que deciden qué ver a continuación y los chatbots que ahora pueden mantener una conversación. En esta guía, desglosaremos qué es realmente el aprendizaje automático, cómo aprende, sus principales modalidades y los límites honestos que debes conocer antes de confiarle algo importante. Sin ecuaciones, sin jerga sin explicar.
De las reglas a los ejemplos: qué ha cambiado
Durante la mayor parte de la historia de la computación, el software era una lista de instrucciones. Un programador anticipaba cada situación y escribía una regla para ella: si esto, entonces aquello. Esto funciona a la perfección para tareas con lógica clara, como calcular impuestos o ordenar nombres alfabéticamente. Pero se desmorona en el momento en que el mundo se vuelve desordenado. ¿Cómo escribirías reglas para reconocer una dirección manuscrita? La escritura a mano varía infinitamente. El número de sentencias "si" sería infinito.
El aprendizaje automático invierte el enfoque. En lugar de detallar las reglas, le das a la computadora miles de ejemplos etiquetados y una forma de medir cuán incorrectas son sus suposiciones. El sistema se ajusta a sí mismo, una y otra vez, para cometer menos errores. El "aprendizaje" es simplemente este proceso de ajuste hasta que se capturan los patrones en los datos. Si has leído nuestro resumen de qué es la inteligencia artificial, el aprendizaje automático es el motor que hace que la mayor parte de la IA actual funcione.
Una breve palabra sobre los "modelos"
Escucharás la palabra modelo constantemente. Un modelo es simplemente el resultado final del entrenamiento, el patrón capturado, almacenado como un gran conjunto de números, al que puedes introducir nuevos datos para obtener una predicción. Piénsalo como la experiencia que el sistema ha destilado. Un modelo de spam ha "aprendido" cómo suele ser el correo basura; un modelo meteorológico ha aprendido cómo suelen desarrollarse las condiciones. El modelo no son los datos y no es el código, es el resumen aprendido intermedio.
Cómo "aprende" realmente una máquina
Hagamos esto concreto con el filtro de spam, porque casi todo el mundo tiene uno. Empiezas con un montón de correos electrónicos ya etiquetados como "spam" o "no spam". El modelo analiza las características de cada mensaje, las palabras utilizadas, si hay muchos enlaces, detalles sospechosos del remitente, y hace una suposición. Al principio, las suposiciones son básicamente aleatorias. Pero cada vez que se equivoca, el sistema ajusta un poco su configuración interna para que sea más probable que acierte la siguiente vez.
Repite esto con cientos de miles de correos electrónicos y el modelo mejora gradualmente. La parte crucial es el ciclo de retroalimentación: una suposición, una medida de cuán incorrecta fue y una pequeña corrección. Los investigadores llaman a la medida de la incorrección una función de pérdida, y a la corrección suave entrenamiento. No necesitas las matemáticas para captar el espíritu: práctica más corrección, escalado enormemente. Profundizamos en esto en nuestro artículo sobre cómo se entrenan los modelos de IA.
Por qué la calidad de los datos es tan importante
Debido a que un modelo aprende completamente de sus ejemplos, la calidad de esos ejemplos lo decide todo. Si le alimentas datos sesgados, limitados o descuidados, aprenderá fielmente esas fallas. Un modelo de contratación entrenado principalmente con un tipo de empleado exitoso preferirá silenciosamente a personas como ellos. Este es el origen del viejo dicho "basura entra, basura sale", y es por eso que gran parte del aprendizaje automático en el mundo real es un trabajo poco glamoroso de limpieza y equilibrio de datos en lugar de algoritmos inteligentes.
Los tres principales estilos de aprendizaje
No todo el aprendizaje automático funciona de la misma manera. Es útil conocer las tres grandes familias, porque la correcta depende del tipo de ejemplos que tengas y de lo que intentes hacer.
| Estilo | Cómo aprende | Ejemplo cotidiano |
|---|---|---|
| Supervisado | Aprende de ejemplos etiquetados (se proporciona la "respuesta") | Filtros de spam, aprobación de préstamos, etiquetado de fotos |
| No supervisado | Encuentra agrupaciones ocultas sin etiquetas dadas | Segmentos de clientes, detección de anomalías |
| Por refuerzo | Aprende por prueba y error, recompensado por buenos resultados | IA para juegos, robótica, recomendaciones |
Aprendizaje supervisado
Este es el estilo más común. Proporcionas ejemplos y las respuestas correctas, y el modelo aprende a mapear una a la otra. Muéstrale fotos etiquetadas como "perro" o "no perro", y aprende a clasificar nuevas fotos. La mayoría de las aplicaciones comerciales, la detección de fraudes, la previsión de la demanda, la detección médica, son supervisadas, porque la respuesta que quieres predecir es algo de lo que ya tienes registros históricos.
Aprendizaje no supervisado
Aquí no hay etiquetas. Simplemente le das al modelo un montón de datos y le pides que encuentre la estructura. Podría descubrir que tus clientes se agrupan naturalmente en unos pocos grupos distintos, o marcar una transacción que no se parece a nada que haya visto antes. Es potente para la exploración, cuando aún no sabes lo que buscas.
Aprendizaje por refuerzo
Este aprende haciendo. El sistema toma acciones, recibe recompensas o penalizaciones, y gradualmente elabora una estrategia que le otorga la mayor recompensa. Así es como la IA dominó juegos complejos y cómo los robots aprenden a caminar. También es parte de cómo se pulen los chatbots modernos, al ser recompensados por respuestas útiles y bien juzgadas.
Donde el aprendizaje automático se encuentra con la IA de la que se habla
Probablemente hayas notado que la IA de los titulares, los sistemas que escriben ensayos, responden preguntas y generan imágenes, se siente diferente a un humilde filtro de spam. Lo es, pero se basa en los mismos cimientos. Estos sistemas utilizan una rama del aprendizaje automático llamada aprendizaje profundo, que apila muchas capas de detección de patrones para manejar datos extraordinariamente complejos como el lenguaje y las imágenes. Si quieres la versión amigable, nuestra guía sobre aprendizaje profundo sin matemáticas retoma exactamente donde termina este artículo, y nuestro recorrido sobre cómo funcionan las redes neuronales explica los bloques de construcción.
Los sistemas más grandes de este tipo se conocen como modelos de lenguaje grandes, y se basan en modelos fundamentales amplios y reutilizables. El punto clave: el aprendizaje automático es la familia, y estos sistemas llamativos son simplemente sus miembros más ambiciosos. El mismo principio, aprender de ejemplos, subyace a todos ellos.
Para qué es bueno el aprendizaje automático y dónde flaquea
El aprendizaje automático brilla en tareas donde hay muchos datos y los patrones son demasiado sutiles o numerosos para que un humano los escriba. Detectar fraudes en millones de transacciones, predecir qué máquinas se averiarán, reconocer el habla, traducir idiomas, recomendar productos, todo esto aprovecha sus puntos fuertes. Es incansable, rápido y, a menudo, detecta señales que las personas pasan por alto por completo.
Pero tiene verdaderos puntos ciegos. Puede estar equivocada con confianza, especialmente en situaciones que no se parecen en nada a las de sus datos de entrenamiento. No comprende verdaderamente la causa y el efecto, detecta correlaciones, por lo que a veces se aferra a algo irrelevante que coincidió en los ejemplos. Y debido a que los sistemas modernos pueden generar tonterías con fluidez, a veces alucinan, produciendo respuestas que suenan correctas pero no lo son. Para una imagen más completa y honesta, nuestro artículo sobre los límites de la IA vale la pena leerlo antes de confiar en esto para decisiones importantes.
Necesita los ejemplos correctos, no solo muchos de ellos
Un modelo entrenado solo con fotos de días soleados tendrá dificultades bajo la lluvia. Uno entrenado con los hábitos de compra de ayer puede juzgar mal un cambio repentino en las tendencias. El aprendizaje automático es un espejo de sus datos, y el mundo sigue avanzando, por lo que los modelos implementados necesitan ser monitoreados y actualizados en lugar de ser tratados como terminados para siempre.
Cómo empezar sin sentirse abrumado
No necesitas construir nada para beneficiarte del aprendizaje automático; la mayoría de las herramientas útiles ya lo tienen incorporado. La habilidad práctica es saber dónde realmente añade valor: tareas repetitivas con muchos datos históricos, predicciones que haces a menudo o patrones ocultos en información demasiado grande para ser examinada a simple vista. Empieza poco a poco, con una tarea en la que un error sea fácil de corregir, y mantén a un humano en el bucle mientras generas confianza.
También se combina naturalmente con ideas más nuevas como la IA multimodal, que permite a los sistemas trabajar con imágenes, audio y texto juntos, abriendo aplicaciones que las herramientas puramente textuales no pueden tocar. Y si estás pensando en cómo los sistemas de aprendizaje podrían automatizar flujos de trabajo reales en una empresa, nuestra guía interdisciplinaria sobre una estrategia de IA agéntica para negocios muestra a dónde conduce. Siempre que desees ayuda para adaptarlo a tu propia situación, siempre puedes ponerte en contacto.
Preguntas frecuentes
¿Es el aprendizaje automático lo mismo que la inteligencia artificial?+
¿Necesito ser bueno en matemáticas para entenderlo?+
¿Cuántos datos necesita el aprendizaje automático?+
¿Puede un modelo de aprendizaje automático equivocarse?+
Referencias
- Stanford HAI. "Índice y Fundamentos de la Inteligencia Artificial." hai.stanford.edu.
- DeepLearning.AI. "Fundamentos del Aprendizaje Automático." deeplearning.ai.
- Google AI. "Educación en Aprendizaje Automático." ai.google.