Los modelos de lenguaje no piensan antes de escribir: Generan token por token. Los parámetros de generación determinan cómo elige entre miles de posibilidades en cada paso.
Cómo piensan los LLM: Fundamentos de Inferencia
Guía técnica sobre cómo funcionan los LLM localmente: tokens, transformers, atención, caché KV, prefill y decodificación. Fundamentos esenciales para ejecutar IA local en 2026.

