-
Paralelización con LLMs: Ejecución concurrente en sistemas agénticos
Paralelización para LLMs: RunnableParallel, fan-out/fan-in, map-reduce. Cuándo usarlo, anti-patrones y ejemplos reales.
-
Routing con LLMs: Toma de decisiones dinámicas en sistemas agénticos
Routing para sistemas con LLMs: cómo clasificar inputs y dirigirlos al flujo correcto con LLM-based, embedding-based, rule-based y ML routing.
-
Parámetros de generación
Los modelos de lenguaje no piensan antes de escribir: Generan token por token. Los parámetros de generación determinan cómo elige entre miles de posibilidades en cada paso.
-
Prompt Chaining: Cuando un solo prompt no alcanza
Prompt Chaining descompone tareas complejas en pasos secuenciales para evitar instruction neglect, contextual drift y error propagation. Guía práctica con código Python, patrones de producción y Context Engineering.
-
Casos de Uso Avanzados: RAG, Agentes y Fine-tuning
Guía técnica sobre casos de uso avanzados de LLM locales: RAG, agentes con herramientas, fine-tuning con LoRA/QLoRA, modelos multimodales y programación con IA local.