Una serie sobre los patrones de diseño para construir sistemas inteligentes con modelos de lenguaje. Cada patrón aborda un problema específico de arquitectura y se apoya en los anteriores.
Prompt Chaining: cuando un solo prompt no alcanza: El patrón más básico: Descomponer tareas complejas en secuencias de prompts donde el output de cada paso alimenta el siguiente. Cubre la arquitectura de pipelines, salida estructurada, y la decisión de cuándo una tarea merece ser dividida.
Routing con LLMs: toma de decisiones dinámicas en sistemas agénticos: Cuándo el flujo de ejecución depende de las características del input. Routing clasifica la intención y dirige cada caso a su handler especializado. Cubre los cuatro métodos de routing (LLM-based, embedding-based, rule-based, ML-based), el patrón híbrido rule-based + LLM fallback, y cómo medir la eficiencia del router en producción.
Parallelización con LLMs: ejecución concurrente en sistemas agénticos: Cuándo las tareas no dependen entre sí, ejecutarlas secuencialmente es un desperdicio de tiempo. Parallelization identifica componentes independientes y los ejecuta concurrentemente. Cubre task parallelism, fan-out/fan-in, map-reduce, y el problema oculto de la convergencia costosa.
Próximos patrones:
- Reflection: El patrón Generator-Critic para auto-corrección y calidad de output.
- Tool Use: Function calling y la integración de herramientas externas.
- Planning: Descomposición de objetivos complejos en sub-tareas con dependencias.
- Multi-Agent Collaboration: Agentes especializados con roles distintos y coordinación.