Acondicionamiento (prompting) few-shot frente a zero-shot, explicado

Jazmie Jamaludin

Imagina que contratas a un nuevo y brillante asistente en su primera mañana. Podrías simplemente decir: "Clasifica estos correos electrónicos de clientes en urgentes y no urgentes". O podrías primero entregarle tres correos electrónicos que ya has clasificado y decir: "¿Ves cómo hice estos? Ahora haz el resto de la misma manera". Ambos enfoques pueden funcionar. Pero el segundo casi siempre produce resultados que se sienten más como tu juicio y menos como una suposición. Esa pequeña diferencia, entre solo pedir y mostrar algunos ejemplos primero, es el corazón de una de las habilidades más útiles que puedes adquirir al trabajar con la IA moderna.

En esta guía desglosaremos dos términos con los que te toparás constantemente una vez que empieces a usar seriamente las herramientas de IA: zero-shot prompting y few-shot prompting. No necesitas tener conocimientos técnicos. Al final sabrás qué significa cada uno, cuándo recurrir a cuál, por qué mostrar ejemplos puede transformar una producción mediocre en algo realmente útil, y las trampas comunes que silenciosamente sabotean a quienes lo intentan. Mantendremos todo concreto y práctico, porque el objetivo es ayudarte a obtener mejores respuestas de la IA sin escribir una sola línea de código.

Qué significa realmente "shot"

Primero, aclaremos la jerga, porque la palabra "shot" (disparo) suena mucho más misteriosa de lo que es. En este contexto, un "shot" simplemente significa un ejemplo que proporcionas dentro de tu solicitud. El número que le precede te indica cuántos ejemplos estás ofreciendo antes de pedirle a la IA que realice la tarea real.

Así, zero-shot significa que no das ningún ejemplo. Describes lo que quieres y dejas que el modelo lo resuelva a partir de su conocimiento general. One-shot significa que proporcionas un único ejemplo resuelto. Few-shot significa que proporcionas un puñado, generalmente de dos a cinco, antes de pedirle al modelo que continúe el patrón. Eso es realmente todo lo que hay en la terminología. Una vez que ves "shot" como una abreviatura de "ejemplo", todo el tema se vuelve mucho menos intimidante.

Si es la primera vez que piensas detenidamente en cómo formular solicitudes a una IA, ayuda leer primero nuestros conceptos básicos de ingeniería de prompts, ya que few-shot y zero-shot son realmente solo dos estilos dentro de ese arte más amplio.

Un "shot" es solo un ejemplo
Zero-shot significa que no das ninguno y dejas que el modelo infiera la tarea; few-shot significa que muestras de dos a cinco ejemplos resueltos antes de preguntar.
Fuente: Práctica general entre los principales proveedores de IA

Zero-shot prompting: solo pregunta

Zero-shot es la forma en que la mayoría de la gente usa naturalmente la IA sin darse cuenta de que tiene un nombre. Escribes una pregunta o instrucción y esperas que el modelo ya entienda lo suficiente como para responder bien. "Escribe una respuesta amable rechazando esta reunión". "Resume este informe en tres puntos". "Traduce este párrafo a un lenguaje más simple". Sin ejemplos, solo una solicitud clara.

La razón por la que zero-shot funciona en absoluto es que los grandes modelos de lenguaje han absorbido una enorme cantidad de texto durante el entrenamiento. Han visto efectivamente millones de respuestas amables, resúmenes y traducciones, por lo que a menudo pueden producir una versión razonable bajo demanda. Si quieres entender por qué estos modelos pueden responder a instrucciones para las que nunca fueron programados explícitamente, nuestra explicación sobre qué son los grandes modelos de lenguaje lo explica en términos sencillos.

Cuándo brilla el zero-shot

Zero-shot es el punto de partida adecuado para tareas comunes y bien entendidas donde no hay un formato inusual o un estilo de la casa que coincidir. Resumir, reescribir, generar ideas, responder preguntas generales, redactar una primera versión de algo, todo esto tiende a funcionar maravillosamente con una única instrucción clara. Es rápido, mantiene tu prompt corto, y para el trabajo diario a menudo es todo lo que necesitas. La regla de oro: prueba zero-shot primero. Solo añade la complejidad de los ejemplos cuando la solicitud simple te decepcione.

Few-shot prompting: muestra, luego pregunta

Few-shot prompting es lo que utilizas cuando zero-shot produce respuestas que son técnicamente correctas pero incorrectas para ti. El resultado es demasiado largo, demasiado formal, tiene el formato incorrecto o clasifica las cosas de manera diferente a como lo hace tu equipo. En lugar de describir tus preferencias con un detalle minucioso, simplemente las demuestras.

Aquí está el patrón en el lenguaje cotidiano. Supón que quieres que las reseñas de productos sean etiquetadas por sentimiento. Un prompt few-shot podría verse así: "Reseña: 'Llegó tarde y la caja estaba aplastada.' Sentimiento: Negativo. Reseña: 'Funciona exactamente como se describe, muy contento.' Sentimiento: Positivo. Reseña: 'Está bien, nada especial.' Sentimiento: Neutral. Ahora clasifica: 'El color era diferente al de la foto, pero la calidad es excelente.'" Has mostrado tres ejemplos etiquetados, y el modelo ahora refleja tu estilo de etiquetado para el nuevo.

Ese reflejo es la magia. Los ejemplos no solo le dicen al modelo qué hacer; muestran el formato exacto, el tono y el nivel de detalle que esperas. Esto está estrechamente relacionado con los métodos más sofisticados de nuestra guía de técnicas avanzadas de prompting, donde los ejemplos se convierten en un bloque de construcción para flujos de trabajo mucho más capaces.

Por qué los ejemplos funcionan tan bien

Un ejemplo contiene una gran cantidad de información de forma compacta. Cuando escribes una respuesta de muestra, estás comunicando silenciosamente docenas de decisiones a la vez: la extensión de la respuesta, si usar viñetas, la formalidad del lenguaje, qué detalles importan y cuáles ignorar. Describir todo eso con palabras tomaría párrafos y aun así se te escaparían cosas. Un buen ejemplo lo dice todo al instante. Por eso, mostrar suele ser mejor que decir cuando la tarea tiene una forma específica que te interesa.

Zero-shot vs few-shot de un vistazo
Aspecto Zero-shot Few-shot
Lo que proporcionas Solo una instrucción Una instrucción más de dos a cinco ejemplos
Ideal para Tareas comunes y flexibles Formatos específicos y estilo de la casa
Longitud del prompt Corto y rápido Más largo, utiliza más de la ventana de contexto
Consistencia Varía más entre ejecuciones Más predecible y conforme al patrón
Riesgo principal Output genérico o fuera de estilo Ejemplos que sesgan o inducen a error

Cómo elegir entre ellos

La decisión es más sencilla de lo que parece. Hazte una pregunta: ¿esta tarea tiene una forma específica que me importa? Si la respuesta es no, empieza con zero-shot. Si la respuesta es sí, y especialmente si vas a ejecutar el mismo tipo de tarea repetidamente, invierte un par de minutos en escribir dos o tres buenos ejemplos y cambia a few-shot.

Un flujo de trabajo práctico es comenzar con zero-shot, observar el resultado y solo escalar si decepciona. Si el modelo no entendió la tarea por completo, un ejemplo bien elegido a menudo lo soluciona. Si entendió la tarea pero se equivocó en el formato o el tono, dos o tres ejemplos suelen ser suficientes para fijarlo. Rara vez hay mucho beneficio en acumular más de unos cinco ejemplos para el trabajo diario; las ganancias se estancan y solo consumes más de la limitada memoria de trabajo del modelo sin recompensa.

Una sencilla lista de verificación mental

Recurre a few-shot cuando necesites un formato consistente en muchos elementos, cuando la tarea sea inusual o específica de un dominio, cuando zero-shot siga desviándose en el tono, o cuando quieras empujar al modelo hacia casos límite que de otro modo podría pasar por alto. Quédate con zero-shot cuando la tarea sea común, cuando valores la velocidad, cuando estés explorando en lugar de producir un artefacto final, o cuando simplemente aún no sepas cómo es lo "bueno" y quieras que el modelo te sorprenda.

Acertar con el few-shot: los detalles que importan

Few-shot es potente pero no infalible, y algunos escollos silenciosos confunden a la gente. El primero es elegir ejemplos poco representativos. El modelo trata tus ejemplos como la definición de la tarea, por lo que si las tres muestras son reseñas positivas, es posible que tienda a etiquetar todo como positivo. Elige ejemplos que cubran el rango real de casos que esperas, incluidos los incómodos.

El segundo escollo es el formato inconsistente en tus propios ejemplos. Si un ejemplo termina con un punto y otro no, o uno usa dos puntos y otro un guion, el modelo puede reproducir fielmente ese desorden. Trata tus ejemplos como una guía de estilo y mantenlos limpios y uniformes. El tercero es la sensibilidad al orden: en algunas situaciones la secuencia de tus ejemplos puede influir sutilmente en la respuesta, así que si estás clasificando en categorías, intenta no agrupar todas las de una misma categoría al principio.

Finalmente, recuerda que los ejemplos ocupan espacio. Cada modelo tiene un límite de cuánto texto puede considerar a la vez, y los ejemplos largos consumen ese presupuesto. Para la mayoría de las tareas empresariales esto no es un problema, pero si estás alimentando un documento grande junto con tus ejemplos, sé consciente de la compensación. Elegir entre un enfoque más simple o más rico es parte de la pregunta más amplia de elegir el modelo de IA adecuado para el trabajo, ya que los modelos difieren mucho en la cantidad que pueden contener.

Dónde encaja esto en el trabajo real

Una vez que interiorices la idea de "mostrar y luego preguntar", encontrarás usos en todas partes. Los equipos de atención al cliente usan few-shot para que las respuestas de la IA suenen como la voz de su marca. Los especialistas en marketing lo usan para generar docenas de descripciones de productos en un formato consistente. Los equipos de operaciones lo usan para extraer datos estructurados, como fechas y cantidades, de correos electrónicos desordenados. Los reclutadores lo usan para resumir solicitudes según una plantilla fija. En todos los casos, el patrón es el mismo: mostrar dos o tres ejemplos de "estándar de oro" y luego dejar que la IA escale ese estándar a un montón de nuevas entradas.

Esta es también la razón por la que few-shot se combina tan naturalmente con la automatización. Cuando conectas la IA a tus herramientas para que pueda ejecutar tareas por sí misma, un resultado confiable y predecible se vuelve esencial, y los ejemplos son una de las formas más económicas de conseguirlo. Si esta dirección te interesa, nuestro artículo sobre cómo construir tu primer agente de IA muestra cómo estos hábitos de prompting alimentan algo más autónomo. Y cuando evalúes qué herramientas manejan esto bien, nuestra lista de verificación sobre herramientas de IA para empresas es un buen complemento.

Prueba zero-shot primero, escala cuando te decepcione
La mayoría de las tareas diarias no necesitan ningún ejemplo. Añádelos solo cuando el formato, el tono o la consistencia importen, y no superes los cinco.
Fuente: Guía común de los principales laboratorios de investigación de IA

Un ejemplo práctico que puedes adaptar

Supongamos que tienes una pequeña tienda en línea y quieres respuestas cortas y optimistas a preguntas comunes. Zero-shot podría darte algo rígido y corporativo. Así que cambias a few-shot: "Pregunta: '¿Hacen envíos los fines de semana?' Respuesta: '¡Excelente pregunta! Preparamos los pedidos de lunes a viernes, así que los pedidos de fin de semana salen a primera hora del lunes.' Pregunta: '¿Puedo cambiar mi dirección después de hacer el pedido?' Respuesta: 'Claro, solo responde aquí dentro de una hora y lo solucionaremos por ti.' Ahora responde con el mismo estilo cálido y breve: '¿Está disponible el envoltorio de regalo?'" El modelo ahora conoce tu extensión, tu amabilidad y tu costumbre de terminar con una nota útil. Esa es toda la técnica, y se escala a casi cualquier cosa que hagas repetidamente.

La lección más profunda es que los buenos resultados de la IA rara vez provienen solo de una redacción inteligente. Vienen de mostrar a la máquina cómo es el éxito. Una vez que empiezas a pensar de esa manera, el prompting deja de sentirse como un juego de adivinanzas y empieza a sentirse como entrenar a un nuevo colega capaz, un ejemplo práctico a la vez. Si necesitas ayuda para aplicar esto a tus propios flujos de trabajo, no dudes en ponerte en contacto.

Preguntas frecuentes

¿Es el few-shot siempre mejor que el zero-shot?+
No. Para tareas comunes y flexibles, el zero-shot es más rápido y a menudo igual de bueno. El few-shot resulta rentable principalmente cuando necesitas un formato específico, un tono particular o resultados consistentes en muchos elementos similares. El hábito inteligente es probar zero-shot primero y solo añadir ejemplos cuando la solicitud simple se quede corta.
¿Cuántos ejemplos debo incluir?+
Para la mayoría de las tareas diarias, dos a cinco ejemplos bien elegidos son suficientes. Un ejemplo puede corregir un simple malentendido; tres o cuatro fijan el formato y el tono. Más allá de unos cinco, el beneficio suele aplanarse mientras tu prompt se alarga, por lo que más no es automáticamente mejor.
¿Necesitan mis ejemplos ser perfectos?+
Necesitan ser representativos y consistentes en lugar de impecables. Debido a que el modelo copia tus ejemplos de cerca, cualquier descuido o sesgo en ellos tiende a reproducirse. Mantén el formato uniforme, cubre el rango realista de casos, incluidos los difíciles, y obtendrás resultados mucho más estables.
¿Puedo combinar few-shot con otras técnicas?+
Sí, y a menudo ahí reside el verdadero poder. Los ejemplos se combinan bien con instrucciones claras, descripciones de roles y prompts de razonamiento paso a paso. Few-shot debe verse como un bloque de construcción confiable dentro de un conjunto de herramientas de prompting más amplio, en lugar de un truco independiente.

Referencias

  1. Google Cloud. "Orientación sobre ingeniería de prompts y prompting few-shot." cloud.google.com.
  2. IBM. "¿Qué es el prompting few-shot?" ibm.com.
  3. Stanford HAI. "Índice de IA e investigación de modelos de lenguaje." hai.stanford.edu.
Regresar al blog

AUTOMATICE. OPTIMICE. DOMINE.

Optimice sus operaciones y ofrezca una experiencia de cliente fluida. Deje que nuestros expertos implementen tecnología de vanguardia y flujos de trabajo optimizados para que pueda concentrarse en lo que mejor sabe hacer.