Contacto

Categoría: Software

prompt_chaining_b

Prompt Chaining: cuando un solo prompt no alcanza

Prompt Chaining descompone tareas complejas en pasos secuenciales para evitar instruction neglect, contextual drift y error propagation. Guía práctica con código Python, patrones de producción y Context Engineering.

Leer más
Avanzado

Casos de Uso Avanzados: RAG, Agentes y Fine-tuning

Guía técnica sobre casos de uso avanzados de LLM locales: RAG, agentes con herramientas, fine-tuning con LoRA/QLoRA, modelos multimodales y programación con IA local.

Leer más
Ejecucion

Ejecución Local de LLM: Runtimes, Operación y Cuantización

Guía completa sobre ejecución local de LLM en 2026: runtimes (llama.cpp, vLLM, SGLang), cuantización (Q4-Q8), formatos de archivo (GGUF, safetensors), selección de modelos y operaciones.

Leer más
Inference Engines

Motores de Inferencia para LLMs y Hardware de IA Local

Motores de inferencia para LLMs en 2026: guia completa de llama.cpp, vLLM, TensorRT-LLM, SGLang, ExLlamaV3, MLX y TGI. Como elegir el motor correcto segun tu hardware y carga de trabajo.

Leer más