Deep Learning Explicado Sin Matemáticas
Jazmie JamaludinDurante décadas, conseguir que un ordenador reconociera la foto de un perro fue uno de los problemas más difíciles de la tecnología. Los ingenieros intentaron escribir reglas: "busca pelo, busca un hocico, busca orejas caídas", y los resultados fueron vergonzosos. Luego, alrededor de principios de la década de 2010, algo cambió. Casi de la noche a la mañana, las máquinas empezaron a reconocer imágenes, comprender el habla y traducir idiomas de forma asombrosa. El avance detrás de ese salto tiene un nombre que suena intimidante, pero que en realidad no lo es: el aprendizaje profundo (deep learning).
Si alguna vez te has preguntado qué hace funcionar a la IA moderna, el aprendizaje profundo es la respuesta la mayoría de las veces. Es la técnica detrás de los asistentes de tu teléfono, los sistemas que subtitulan vídeos automáticamente y los chatbots que pueden escribir un poema a petición. En esta guía te explicaremos qué es el aprendizaje profundo, a qué se refiere realmente la palabra "profundo" y por qué funciona tan bien, todo ello sin una sola ecuación. Al final, comprenderás la sala de máquinas de la IA actual en un lenguaje sencillo.
Qué significa realmente "profundo"
El aprendizaje profundo es una rama del aprendizaje automático, la idea general de enseñar a los ordenadores mostrándoles ejemplos en lugar de deletrear reglas. Lo que diferencia al aprendizaje profundo es su estructura. Aprende a través de muchas capas de procesamiento apiladas, cada una de las cuales se basa en la anterior. La palabra "profundo" se refiere simplemente al número de estas capas. Un sistema superficial podría tener una o dos; uno profundo puede tener docenas o cientos.
Imagina una cadena de montaje. La primera estación se encarga de algo rudimentario, tal vez solo detectando bordes y manchas de color en una imagen. La siguiente estación combina esos bordes en formas simples. La siguiente ensambla las formas en partes: un ojo, una rueda, una hoja. En la estación final, el sistema reconoce objetos enteros. Ninguna capa individual entiende la imagen; la inteligencia surge de la cadena. Este enfoque por capas, de construcción ascendente, es el corazón del aprendizaje profundo.
Por qué esto superó el enfoque antiguo
El método antiguo requería que los humanos decidieran, de antemano, qué características importaban, las instrucciones de "buscar piel". El aprendizaje profundo eliminó ese cuello de botella. Con suficientes ejemplos, el sistema descubre las características útiles por sí mismo, a menudo encontrando patrones que ningún humano habría pensado en especificar. Esa capacidad de aprender sus propias representaciones, en lugar de depender de las que le entregamos, es exactamente la razón por la que el aprendizaje profundo superó a todo lo anterior.
El bloque de construcción: una neurona artificial
El aprendizaje profundo funciona con redes neuronales artificiales, inspiradas libremente en el cerebro. La unidad básica es una neurona artificial, y puedes pensar en ella como una diminuta máquina de toma de decisiones. Recibe varias entradas, sopesa la importancia de cada una, las suma y envía una señal si el total es lo suficientemente fuerte. Por sí sola es casi trivialmente simple, un interruptor que se inclina de una forma u otra.
La magia viene de conectar millones de estos pequeños interruptores en capas, con la salida de cada neurona alimentando la siguiente capa. El aprendizaje ocurre ajustando los "pesos", la importancia que tiene cada conexión. Durante el entrenamiento, la red hace una suposición, ve cuán equivocada estaba y ajusta un poco cada peso para hacerlo mejor la próxima vez. Repite esto con enormes conjuntos de datos y la red se cablea gradualmente en algo genuinamente capaz. Desglosamos el lado del entrenamiento en nuestra guía sobre cómo se entrenan los modelos de IA.
No necesitas las matemáticas para entender la idea
En el fondo, todo esto es solo aritmética realizada a una escala asombrosa, miles de millones de pequeñas multiplicaciones y adiciones. Pero no necesitas seguir las matemáticas para captar el espíritu: una vasta red de partes simples, cada una ajustándose ligeramente, hasta que todo el conjunto convierte de forma fiable las entradas en salidas útiles. Es menos una fórmula inteligente y más una red extensa y autoajustable.
Qué cambió para que funcionara
Las redes neuronales no son nuevas; las ideas centrales se remontan a décadas. Entonces, ¿por qué el aprendizaje profundo no despegó hasta la década de 2010? Tres cosas se alinearon a la vez, y entenderlas explica por qué la IA se aceleró de repente.
| Ingrediente | Qué aportó | Por qué fue importante |
|---|---|---|
| Big data | Millones de imágenes, textos y grabaciones etiquetadas | Las redes profundas son insaciables, solo brillan con muchos ejemplos |
| Chips potentes | Procesadores gráficos que realizan muchas sumas a la vez | Hicieron que entrenar redes enormes fuera práctico en lugar de imposiblemente lento |
| Mejores métodos | Formas más inteligentes de entrenar redes profundas sin que se estancaran | Resolvieron problemas técnicos que habían frenado el campo durante años |
Cuando la abundancia de datos se unió a una capacidad de cómputo asequible y a técnicas de entrenamiento refinadas, las redes profundas que habían sido curiosidades teóricas de repente dieron resultados. Esa convergencia, no una invención solitaria, es la verdadera historia del origen del auge de la IA moderna.
Dónde aparece el aprendizaje profundo en tu día a día
Es casi seguro que utilizas el aprendizaje profundo muchas veces al día sin darte cuenta. Cuando tu teléfono se desbloquea al reconocer tu cara, eso es una red profunda. Cuando un asistente de voz transcribe lo que dices, es aprendizaje profundo. La organización automática de fotos, la traducción en tiempo real, las recomendaciones de vídeos, las alertas de fraude en tu tarjeta, las huellas del aprendizaje profundo están por todas partes.
Su mayor impacto, sin embargo, ha sido en el lenguaje. Los grandes modelos de lenguaje detrás de los chatbots actuales son aprendizaje profundo a una escala extraordinaria, y se construyen sobre modelos fundamentales amplios y reutilizables que pueden adaptarse a innumerables tareas. Los sistemas más nuevos incluso combinan palabras, imágenes y sonido, un enfoque llamado IA multimodal, todo ello impulsado por el mismo principio de aprendizaje por capas.
Las limitaciones honestas
El aprendizaje profundo es potente, pero no mágico, y vale la pena conocer sus debilidades antes de confiarle algo importante. Primero, consume muchos datos y energía; entrenar un modelo grande requiere una enorme cantidad de ejemplos y potencia de cálculo. Segundo, es una especie de caja negra; los millones de pesos de la red hacen difícil explicar exactamente por qué llegó a una respuesta determinada, lo cual es un problema real en campos como la medicina o los préstamos.
Tercero, aprende correlación, no comprensión. Una red profunda no tiene sentido común, puede ser engañada por entradas que nos parecen sin sentido, y puede producir resultados fluidos y seguros que son simplemente incorrectos, un fallo a menudo llamado alucinación. Para una visión fundamentada de dónde estos sistemas encuentran un límite, nuestro artículo sobre los límites de la IA es una lectura esencial.
Hereda los defectos de sus datos
Dado que una red profunda aprende puramente de ejemplos, cualquier sesgo o laguna en esos datos se incorpora, a veces de forma invisible. Un modelo entrenado en una pequeña parte del mundo tendrá un rendimiento deficiente fuera de ella. Por eso, los equipos responsables dedican tanto esfuerzo a seleccionar, probar y supervisar sus datos en lugar de asumir que más capas lo solucionarán todo.
El aprendizaje profundo en el panorama general
Ayuda a mantener la jerarquía clara. La inteligencia artificial es el objetivo general. El aprendizaje automático es la ruta principal para lograrlo. El aprendizaje profundo es la técnica de aprendizaje automático más potente que tenemos, y es lo que hizo posible la reciente ola de IA. Los sistemas construidos sobre él pueden manejar una sorprendente cantidad de contexto a la vez, algo que exploramos en nuestra guía sobre las ventanas de contexto de la IA.
Para la mayoría de las personas, la conclusión práctica es simple: el aprendizaje profundo es la razón por la que la IA de repente parece capaz, y saber aproximadamente cómo funciona te ayuda a juzgar qué confiar y qué verificar. Si estás considerando cómo estas capacidades podrían encajar en operaciones reales, nuestra visión interdisciplinaria de una estrategia de negocios con IA agéntica conecta los puntos, y siempre puedes contactarnos para hablar al respecto.
Preguntas frecuentes
¿Cuál es la diferencia entre aprendizaje automático y aprendizaje profundo?+
¿El aprendizaje profundo realmente copia el cerebro humano?+
¿Por qué el aprendizaje profundo necesita tanta potencia computacional?+
¿Puede el aprendizaje profundo explicar sus decisiones?+
Referencias
- DeepLearning.AI. "Deep Learning Specialization Foundations." deeplearning.ai.
- MIT. "Introduction to Deep Learning." mit.edu.
- Stanford HAI. "Foundations of Modern AI." hai.stanford.edu.