Deep Learning Explicado Sin Matemáticas

Jazmie Jamaludin

Durante décadas, conseguir que un ordenador reconociera la foto de un perro fue uno de los problemas más difíciles de la tecnología. Los ingenieros intentaron escribir reglas: "busca pelo, busca un hocico, busca orejas caídas", y los resultados fueron vergonzosos. Luego, alrededor de principios de la década de 2010, algo cambió. Casi de la noche a la mañana, las máquinas empezaron a reconocer imágenes, comprender el habla y traducir idiomas de forma asombrosa. El avance detrás de ese salto tiene un nombre que suena intimidante, pero que en realidad no lo es: el aprendizaje profundo (deep learning).

Si alguna vez te has preguntado qué hace funcionar a la IA moderna, el aprendizaje profundo es la respuesta la mayoría de las veces. Es la técnica detrás de los asistentes de tu teléfono, los sistemas que subtitulan vídeos automáticamente y los chatbots que pueden escribir un poema a petición. En esta guía te explicaremos qué es el aprendizaje profundo, a qué se refiere realmente la palabra "profundo" y por qué funciona tan bien, todo ello sin una sola ecuación. Al final, comprenderás la sala de máquinas de la IA actual en un lenguaje sencillo.

Qué significa realmente "profundo"

El aprendizaje profundo es una rama del aprendizaje automático, la idea general de enseñar a los ordenadores mostrándoles ejemplos en lugar de deletrear reglas. Lo que diferencia al aprendizaje profundo es su estructura. Aprende a través de muchas capas de procesamiento apiladas, cada una de las cuales se basa en la anterior. La palabra "profundo" se refiere simplemente al número de estas capas. Un sistema superficial podría tener una o dos; uno profundo puede tener docenas o cientos.

Imagina una cadena de montaje. La primera estación se encarga de algo rudimentario, tal vez solo detectando bordes y manchas de color en una imagen. La siguiente estación combina esos bordes en formas simples. La siguiente ensambla las formas en partes: un ojo, una rueda, una hoja. En la estación final, el sistema reconoce objetos enteros. Ninguna capa individual entiende la imagen; la inteligencia surge de la cadena. Este enfoque por capas, de construcción ascendente, es el corazón del aprendizaje profundo.

Por qué esto superó el enfoque antiguo

El método antiguo requería que los humanos decidieran, de antemano, qué características importaban, las instrucciones de "buscar piel". El aprendizaje profundo eliminó ese cuello de botella. Con suficientes ejemplos, el sistema descubre las características útiles por sí mismo, a menudo encontrando patrones que ningún humano habría pensado en especificar. Esa capacidad de aprender sus propias representaciones, en lugar de depender de las que le entregamos, es exactamente la razón por la que el aprendizaje profundo superó a todo lo anterior.

Capas que aprenden por sí mismas
Los métodos anteriores requerían que los humanos definieran qué buscar. El aprendizaje profundo descubre sus propias características a través de capas apiladas, razón por la cual resolvió problemas como el reconocimiento de imágenes y voz que desconcertaron a los investigadores durante décadas.
Fuente: DeepLearning.AI

El bloque de construcción: una neurona artificial

El aprendizaje profundo funciona con redes neuronales artificiales, inspiradas libremente en el cerebro. La unidad básica es una neurona artificial, y puedes pensar en ella como una diminuta máquina de toma de decisiones. Recibe varias entradas, sopesa la importancia de cada una, las suma y envía una señal si el total es lo suficientemente fuerte. Por sí sola es casi trivialmente simple, un interruptor que se inclina de una forma u otra.

La magia viene de conectar millones de estos pequeños interruptores en capas, con la salida de cada neurona alimentando la siguiente capa. El aprendizaje ocurre ajustando los "pesos", la importancia que tiene cada conexión. Durante el entrenamiento, la red hace una suposición, ve cuán equivocada estaba y ajusta un poco cada peso para hacerlo mejor la próxima vez. Repite esto con enormes conjuntos de datos y la red se cablea gradualmente en algo genuinamente capaz. Desglosamos el lado del entrenamiento en nuestra guía sobre cómo se entrenan los modelos de IA.

No necesitas las matemáticas para entender la idea

En el fondo, todo esto es solo aritmética realizada a una escala asombrosa, miles de millones de pequeñas multiplicaciones y adiciones. Pero no necesitas seguir las matemáticas para captar el espíritu: una vasta red de partes simples, cada una ajustándose ligeramente, hasta que todo el conjunto convierte de forma fiable las entradas en salidas útiles. Es menos una fórmula inteligente y más una red extensa y autoajustable.

Qué cambió para que funcionara

Las redes neuronales no son nuevas; las ideas centrales se remontan a décadas. Entonces, ¿por qué el aprendizaje profundo no despegó hasta la década de 2010? Tres cosas se alinearon a la vez, y entenderlas explica por qué la IA se aceleró de repente.

Por qué el aprendizaje profundo despegó cuando lo hizo
Ingrediente Qué aportó Por qué fue importante
Big data Millones de imágenes, textos y grabaciones etiquetadas Las redes profundas son insaciables, solo brillan con muchos ejemplos
Chips potentes Procesadores gráficos que realizan muchas sumas a la vez Hicieron que entrenar redes enormes fuera práctico en lugar de imposiblemente lento
Mejores métodos Formas más inteligentes de entrenar redes profundas sin que se estancaran Resolvieron problemas técnicos que habían frenado el campo durante años

Cuando la abundancia de datos se unió a una capacidad de cómputo asequible y a técnicas de entrenamiento refinadas, las redes profundas que habían sido curiosidades teóricas de repente dieron resultados. Esa convergencia, no una invención solitaria, es la verdadera historia del origen del auge de la IA moderna.

Dónde aparece el aprendizaje profundo en tu día a día

Es casi seguro que utilizas el aprendizaje profundo muchas veces al día sin darte cuenta. Cuando tu teléfono se desbloquea al reconocer tu cara, eso es una red profunda. Cuando un asistente de voz transcribe lo que dices, es aprendizaje profundo. La organización automática de fotos, la traducción en tiempo real, las recomendaciones de vídeos, las alertas de fraude en tu tarjeta, las huellas del aprendizaje profundo están por todas partes.

Su mayor impacto, sin embargo, ha sido en el lenguaje. Los grandes modelos de lenguaje detrás de los chatbots actuales son aprendizaje profundo a una escala extraordinaria, y se construyen sobre modelos fundamentales amplios y reutilizables que pueden adaptarse a innumerables tareas. Los sistemas más nuevos incluso combinan palabras, imágenes y sonido, un enfoque llamado IA multimodal, todo ello impulsado por el mismo principio de aprendizaje por capas.

Oculto a simple vista
El desbloqueo facial, la transcripción de voz, la traducción, las recomendaciones, las comodidades cotidianas que damos por sentadas son el aprendizaje profundo trabajando silenciosamente, la misma técnica que ahora impulsa la IA conversacional.
Fuente: MIT

Las limitaciones honestas

El aprendizaje profundo es potente, pero no mágico, y vale la pena conocer sus debilidades antes de confiarle algo importante. Primero, consume muchos datos y energía; entrenar un modelo grande requiere una enorme cantidad de ejemplos y potencia de cálculo. Segundo, es una especie de caja negra; los millones de pesos de la red hacen difícil explicar exactamente por qué llegó a una respuesta determinada, lo cual es un problema real en campos como la medicina o los préstamos.

Tercero, aprende correlación, no comprensión. Una red profunda no tiene sentido común, puede ser engañada por entradas que nos parecen sin sentido, y puede producir resultados fluidos y seguros que son simplemente incorrectos, un fallo a menudo llamado alucinación. Para una visión fundamentada de dónde estos sistemas encuentran un límite, nuestro artículo sobre los límites de la IA es una lectura esencial.

Hereda los defectos de sus datos

Dado que una red profunda aprende puramente de ejemplos, cualquier sesgo o laguna en esos datos se incorpora, a veces de forma invisible. Un modelo entrenado en una pequeña parte del mundo tendrá un rendimiento deficiente fuera de ella. Por eso, los equipos responsables dedican tanto esfuerzo a seleccionar, probar y supervisar sus datos en lugar de asumir que más capas lo solucionarán todo.

El aprendizaje profundo en el panorama general

Ayuda a mantener la jerarquía clara. La inteligencia artificial es el objetivo general. El aprendizaje automático es la ruta principal para lograrlo. El aprendizaje profundo es la técnica de aprendizaje automático más potente que tenemos, y es lo que hizo posible la reciente ola de IA. Los sistemas construidos sobre él pueden manejar una sorprendente cantidad de contexto a la vez, algo que exploramos en nuestra guía sobre las ventanas de contexto de la IA.

Para la mayoría de las personas, la conclusión práctica es simple: el aprendizaje profundo es la razón por la que la IA de repente parece capaz, y saber aproximadamente cómo funciona te ayuda a juzgar qué confiar y qué verificar. Si estás considerando cómo estas capacidades podrían encajar en operaciones reales, nuestra visión interdisciplinaria de una estrategia de negocios con IA agéntica conecta los puntos, y siempre puedes contactarnos para hablar al respecto.

Preguntas frecuentes

¿Cuál es la diferencia entre aprendizaje automático y aprendizaje profundo?+
El aprendizaje profundo es un tipo de aprendizaje automático. Todo el aprendizaje profundo es aprendizaje automático, pero no a la inversa. Lo que lo hace "profundo" son sus muchas capas apiladas, que le permiten aprender patrones complejos y descubrir características útiles por sí mismo en lugar de depender de características definidas por un humano.
¿El aprendizaje profundo realmente copia el cerebro humano?+
Solo de forma vaga. La idea de "neuronas" conectadas se inspiró en la biología, pero las redes neuronales artificiales son mucho más simples y funcionan de forma bastante diferente a un cerebro real. La analogía del cerebro es una imagen inicial útil, no una descripción literal de lo que está sucediendo.
¿Por qué el aprendizaje profundo necesita tanta potencia computacional?+
Una red profunda puede tener millones o miles de millones de conexiones, y el entrenamiento ajusta cada una de ellas a través de enormes conjuntos de datos. Es un número inmenso de cálculos pequeños, por lo que se necesitan chips especializados y mucha energía para entrenar modelos grandes en un tiempo razonable.
¿Puede el aprendizaje profundo explicar sus decisiones?+
A menudo no de forma clara. Debido a que el razonamiento se distribuye a través de innumerables conexiones ponderadas, puede ser difícil decir con precisión por qué un modelo dio una respuesta particular. Esta cualidad de "caja negra" es un área activa de investigación y una preocupación real en entornos de alto riesgo como la atención médica y las finanzas.

Referencias

  1. DeepLearning.AI. "Deep Learning Specialization Foundations." deeplearning.ai.
  2. MIT. "Introduction to Deep Learning." mit.edu.
  3. Stanford HAI. "Foundations of Modern AI." hai.stanford.edu.
Regresar al blog

AUTOMATICE. OPTIMICE. DOMINE.

Optimice sus operaciones y ofrezca una experiencia de cliente fluida. Deje que nuestros expertos implementen tecnología de vanguardia y flujos de trabajo optimizados para que pueda concentrarse en lo que mejor sabe hacer.