¿Qué es el aprendizaje automático? Una guía sencilla

Jazmie Jamaludin

Imagina enseñar a un niño a reconocer un gato. No le das un libro de reglas que diga "cuatro patas, orejas puntiagudas, bigotes, cola". Señalas a los gatos. "Eso es un gato". "Eso también es un gato". Después de suficientes ejemplos, algo hace clic, y el niño puede identificar un gato que nunca antes había visto, incluso uno gordo, sin pelo o medio escondido detrás de una cortina. El aprendizaje automático funciona de manera muy similar. En lugar de programar una computadora con instrucciones explícitas para cada situación, le muestras ejemplos y le permites que descubra el patrón.

Ese simple cambio, de escribir reglas a aprender de los datos, es una de las ideas más importantes en la tecnología moderna. Impulsa silenciosamente el filtro de spam que mantiene tu bandeja de entrada limpia, la aplicación que reconoce tu cara, las recomendaciones que deciden qué ver a continuación y los chatbots que ahora pueden mantener una conversación. En esta guía, desglosaremos qué es realmente el aprendizaje automático, cómo aprende, sus principales modalidades y los límites honestos que debes conocer antes de confiarle algo importante. Sin ecuaciones, sin jerga sin explicar.

De las reglas a los ejemplos: qué ha cambiado

Durante la mayor parte de la historia de la computación, el software era una lista de instrucciones. Un programador anticipaba cada situación y escribía una regla para ella: si esto, entonces aquello. Esto funciona a la perfección para tareas con lógica clara, como calcular impuestos o ordenar nombres alfabéticamente. Pero se desmorona en el momento en que el mundo se vuelve desordenado. ¿Cómo escribirías reglas para reconocer una dirección manuscrita? La escritura a mano varía infinitamente. El número de sentencias "si" sería infinito.

El aprendizaje automático invierte el enfoque. En lugar de detallar las reglas, le das a la computadora miles de ejemplos etiquetados y una forma de medir cuán incorrectas son sus suposiciones. El sistema se ajusta a sí mismo, una y otra vez, para cometer menos errores. El "aprendizaje" es simplemente este proceso de ajuste hasta que se capturan los patrones en los datos. Si has leído nuestro resumen de qué es la inteligencia artificial, el aprendizaje automático es el motor que hace que la mayor parte de la IA actual funcione.

Una breve palabra sobre los "modelos"

Escucharás la palabra modelo constantemente. Un modelo es simplemente el resultado final del entrenamiento, el patrón capturado, almacenado como un gran conjunto de números, al que puedes introducir nuevos datos para obtener una predicción. Piénsalo como la experiencia que el sistema ha destilado. Un modelo de spam ha "aprendido" cómo suele ser el correo basura; un modelo meteorológico ha aprendido cómo suelen desarrollarse las condiciones. El modelo no son los datos y no es el código, es el resumen aprendido intermedio.

Patrones, no instrucciones

El software tradicional sigue reglas escritas por un humano. El aprendizaje automático escribe sus propias reglas al encontrar patrones en los ejemplos, por lo que maneja tareas complejas del mundo real que la lógica codificada a mano nunca podría.

Fuente: Stanford HAI

Cómo "aprende" realmente una máquina

Hagamos esto concreto con el filtro de spam, porque casi todo el mundo tiene uno. Empiezas con un montón de correos electrónicos ya etiquetados como "spam" o "no spam". El modelo analiza las características de cada mensaje, las palabras utilizadas, si hay muchos enlaces, detalles sospechosos del remitente, y hace una suposición. Al principio, las suposiciones son básicamente aleatorias. Pero cada vez que se equivoca, el sistema ajusta un poco su configuración interna para que sea más probable que acierte la siguiente vez.

Repite esto con cientos de miles de correos electrónicos y el modelo mejora gradualmente. La parte crucial es el ciclo de retroalimentación: una suposición, una medida de cuán incorrecta fue y una pequeña corrección. Los investigadores llaman a la medida de la incorrección una función de pérdida, y a la corrección suave entrenamiento. No necesitas las matemáticas para captar el espíritu: práctica más corrección, escalado enormemente. Profundizamos en esto en nuestro artículo sobre cómo se entrenan los modelos de IA.

Por qué la calidad de los datos es tan importante

Debido a que un modelo aprende completamente de sus ejemplos, la calidad de esos ejemplos lo decide todo. Si le alimentas datos sesgados, limitados o descuidados, aprenderá fielmente esas fallas. Un modelo de contratación entrenado principalmente con un tipo de empleado exitoso preferirá silenciosamente a personas como ellos. Este es el origen del viejo dicho "basura entra, basura sale", y es por eso que gran parte del aprendizaje automático en el mundo real es un trabajo poco glamoroso de limpieza y equilibrio de datos en lugar de algoritmos inteligentes.

Los tres principales estilos de aprendizaje

No todo el aprendizaje automático funciona de la misma manera. Es útil conocer las tres grandes familias, porque la correcta depende del tipo de ejemplos que tengas y de lo que intentes hacer.

Las tres principales familias del aprendizaje automático
Estilo	Cómo aprende	Ejemplo cotidiano
Supervisado	Aprende de ejemplos etiquetados (se proporciona la "respuesta")	Filtros de spam, aprobación de préstamos, etiquetado de fotos
No supervisado	Encuentra agrupaciones ocultas sin etiquetas dadas	Segmentos de clientes, detección de anomalías
Por refuerzo	Aprende por prueba y error, recompensado por buenos resultados	IA para juegos, robótica, recomendaciones

Aprendizaje supervisado

Este es el estilo más común. Proporcionas ejemplos y las respuestas correctas, y el modelo aprende a mapear una a la otra. Muéstrale fotos etiquetadas como "perro" o "no perro", y aprende a clasificar nuevas fotos. La mayoría de las aplicaciones comerciales, la detección de fraudes, la previsión de la demanda, la detección médica, son supervisadas, porque la respuesta que quieres predecir es algo de lo que ya tienes registros históricos.

Aprendizaje no supervisado

Aquí no hay etiquetas. Simplemente le das al modelo un montón de datos y le pides que encuentre la estructura. Podría descubrir que tus clientes se agrupan naturalmente en unos pocos grupos distintos, o marcar una transacción que no se parece a nada que haya visto antes. Es potente para la exploración, cuando aún no sabes lo que buscas.

Aprendizaje por refuerzo

Este aprende haciendo. El sistema toma acciones, recibe recompensas o penalizaciones, y gradualmente elabora una estrategia que le otorga la mayor recompensa. Así es como la IA dominó juegos complejos y cómo los robots aprenden a caminar. También es parte de cómo se pulen los chatbots modernos, al ser recompensados por respuestas útiles y bien juzgadas.

Donde el aprendizaje automático se encuentra con la IA de la que se habla

Probablemente hayas notado que la IA de los titulares, los sistemas que escriben ensayos, responden preguntas y generan imágenes, se siente diferente a un humilde filtro de spam. Lo es, pero se basa en los mismos cimientos. Estos sistemas utilizan una rama del aprendizaje automático llamada aprendizaje profundo, que apila muchas capas de detección de patrones para manejar datos extraordinariamente complejos como el lenguaje y las imágenes. Si quieres la versión amigable, nuestra guía sobre aprendizaje profundo sin matemáticas retoma exactamente donde termina este artículo, y nuestro recorrido sobre cómo funcionan las redes neuronales explica los bloques de construcción.

Los sistemas más grandes de este tipo se conocen como modelos de lenguaje grandes, y se basan en modelos fundamentales amplios y reutilizables. El punto clave: el aprendizaje automático es la familia, y estos sistemas llamativos son simplemente sus miembros más ambiciosos. El mismo principio, aprender de ejemplos, subyace a todos ellos.

Una familia, muchas caras

Desde filtros de spam hasta chatbots, los sistemas difieren enormemente en escala, pero comparten un motor: aprender patrones de los datos en lugar de seguir reglas escritas a mano por un humano.

Fuente: DeepLearning.AI

Para qué es bueno el aprendizaje automático y dónde flaquea

El aprendizaje automático brilla en tareas donde hay muchos datos y los patrones son demasiado sutiles o numerosos para que un humano los escriba. Detectar fraudes en millones de transacciones, predecir qué máquinas se averiarán, reconocer el habla, traducir idiomas, recomendar productos, todo esto aprovecha sus puntos fuertes. Es incansable, rápido y, a menudo, detecta señales que las personas pasan por alto por completo.

Pero tiene verdaderos puntos ciegos. Puede estar equivocada con confianza, especialmente en situaciones que no se parecen en nada a las de sus datos de entrenamiento. No comprende verdaderamente la causa y el efecto, detecta correlaciones, por lo que a veces se aferra a algo irrelevante que coincidió en los ejemplos. Y debido a que los sistemas modernos pueden generar tonterías con fluidez, a veces alucinan, produciendo respuestas que suenan correctas pero no lo son. Para una imagen más completa y honesta, nuestro artículo sobre los límites de la IA vale la pena leerlo antes de confiar en esto para decisiones importantes.

Necesita los ejemplos correctos, no solo muchos de ellos

Un modelo entrenado solo con fotos de días soleados tendrá dificultades bajo la lluvia. Uno entrenado con los hábitos de compra de ayer puede juzgar mal un cambio repentino en las tendencias. El aprendizaje automático es un espejo de sus datos, y el mundo sigue avanzando, por lo que los modelos implementados necesitan ser monitoreados y actualizados en lugar de ser tratados como terminados para siempre.

Cómo empezar sin sentirse abrumado

No necesitas construir nada para beneficiarte del aprendizaje automático; la mayoría de las herramientas útiles ya lo tienen incorporado. La habilidad práctica es saber dónde realmente añade valor: tareas repetitivas con muchos datos históricos, predicciones que haces a menudo o patrones ocultos en información demasiado grande para ser examinada a simple vista. Empieza poco a poco, con una tarea en la que un error sea fácil de corregir, y mantén a un humano en el bucle mientras generas confianza.

También se combina naturalmente con ideas más nuevas como la IA multimodal, que permite a los sistemas trabajar con imágenes, audio y texto juntos, abriendo aplicaciones que las herramientas puramente textuales no pueden tocar. Y si estás pensando en cómo los sistemas de aprendizaje podrían automatizar flujos de trabajo reales en una empresa, nuestra guía interdisciplinaria sobre una estrategia de IA agéntica para negocios muestra a dónde conduce. Siempre que desees ayuda para adaptarlo a tu propia situación, siempre puedes ponerte en contacto.

Preguntas frecuentes

¿Es el aprendizaje automático lo mismo que la inteligencia artificial?+

No exactamente. La inteligencia artificial es el objetivo amplio de hacer que las máquinas se comporten de manera inteligente. El aprendizaje automático es el enfoque más exitoso para lograrlo, aprendiendo de los datos en lugar de seguir reglas escritas a mano. Así que el aprendizaje automático es una parte de la IA, la parte responsable de la mayor parte de lo que funciona hoy en día.

¿Necesito ser bueno en matemáticas para entenderlo?+

No. La idea central, aprender patrones de ejemplos a través de suposiciones y correcciones, es intuitiva. Construir sistemas desde cero implica matemáticas, pero entender lo que hace el aprendizaje automático, dónde ayuda y dónde falla no requiere ninguna.

¿Cuántos datos necesita el aprendizaje automático?+

Depende de la tarea. Problemas simples pueden aprenderse de unos pocos miles de buenos ejemplos, mientras que otros complejos como la comprensión del lenguaje necesitan grandes cantidades. Crucialmente, la calidad y la variedad importan más que la cantidad bruta; los datos sesgados o limitados conducen a un modelo sesgado y limitado.

¿Puede un modelo de aprendizaje automático equivocarse?+

Absolutamente, y a menudo con confianza. Los modelos predicen basándose en patrones de datos pasados, por lo que pueden fallar en cualquier situación inusual o en situaciones que el mundo ha cambiado desde entonces. Por eso, las decisiones importantes deben mantener a un humano revisando la producción en lugar de confiar ciegamente en ella.

Referencias

Stanford HAI. "Índice y Fundamentos de la Inteligencia Artificial." hai.stanford.edu.
DeepLearning.AI. "Fundamentos del Aprendizaje Automático." deeplearning.ai.
Google AI. "Educación en Aprendizaje Automático." ai.google.

Regresar al blog

Artículo agregado a tu carrito

¿Qué es el aprendizaje automático? Una guía sencilla

De las reglas a los ejemplos: qué ha cambiado

Una breve palabra sobre los "modelos"

Cómo "aprende" realmente una máquina

Por qué la calidad de los datos es tan importante

Los tres principales estilos de aprendizaje

Aprendizaje supervisado

Aprendizaje no supervisado

Aprendizaje por refuerzo

Donde el aprendizaje automático se encuentra con la IA de la que se habla

Para qué es bueno el aprendizaje automático y dónde flaquea

Necesita los ejemplos correctos, no solo muchos de ellos

Cómo empezar sin sentirse abrumado

Preguntas frecuentes

Referencias

AUTOMATICE. OPTIMICE. DOMINE.

País/región

Idioma

De las reglas a los ejemplos: qué ha cambiado

Una breve palabra sobre los "modelos"

Cómo "aprende" realmente una máquina

Por qué la calidad de los datos es tan importante

Los tres principales estilos de aprendizaje

Aprendizaje supervisado

Aprendizaje no supervisado

Aprendizaje por refuerzo

Donde el aprendizaje automático se encuentra con la IA de la que se habla

Para qué es bueno el aprendizaje automático y dónde flaquea

Necesita los ejemplos correctos, no solo muchos de ellos

Cómo empezar sin sentirse abrumado

Preguntas frecuentes

Referencias

AUTOMATICE. OPTIMICE. DOMINE.