{"id":659,"date":"2026-06-15T22:41:15","date_gmt":"2026-06-15T20:41:15","guid":{"rendered":"https:\/\/atlaszn.com\/blog\/?page_id=659"},"modified":"2026-06-15T22:41:15","modified_gmt":"2026-06-15T20:41:15","slug":"fundamentos-de-llm","status":"publish","type":"page","link":"https:\/\/atlaszn.com\/blog\/fundamentos-de-llm\/","title":{"rendered":"Fundamentos de LLM"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Una serie sobre c\u00f3mo funcionan los modelos de lenguaje por dentro, c\u00f3mo ejecutarlos localmente, y c\u00f3mo explotar sus capacidades en sistemas reales.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/05\/21\/ancho-de-banda-de-memoria\/\">Ancho de banda de memoria para IA local<\/a>: Qu\u00e9 pasa cuando un LLM procesa un prompt. Arquitectura de transformadores, atenci\u00f3n, capas de feed-forward, y el proceso de generaci\u00f3n token por token. La base para entender todo lo que viene despu\u00e9s.<br><br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/05\/22\/motores-de-inferencia-para-llms-y-hardware-de-ia-local\/\">Motores de Inferencia para LLMs y Hardware de IA Local<\/a>: llama.cpp, vLLM, TensorRT-LLM, SGLang, ExLlamaV3, MLX y TGI. Como elegir el motor correcto segun tu hardware y carga de trabajo.<br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/05\/22\/como-piensan-los-llm-fundamentos-de-inferencia\/\">C\u00f3mo piensan los LLM: Fundamentos de Inferencia<\/a>: Qu\u00e9 pasa cuando un LLM procesa un prompt. Arquitectura de transformadores, atenci\u00f3n, capas de feed-forward, y el proceso de generaci\u00f3n token por token. La base para entender todo lo que viene despu\u00e9s.<br><br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/05\/23\/runtimes-cuantizacion\/\">Ejecuci\u00f3n Local de LLM: Runtimes, Operaci\u00f3n y Cuantizaci\u00f3n<\/a>: C\u00f3mo ejecutar modelos de lenguaje en hardware local. Comparativa de runtimes (Ollama, LM Studio, llama.cpp), estrategias de cuantizaci\u00f3n (GGUF, AWQ, GPTQ), y las decisiones reales entre precisi\u00f3n y rendimiento.<br><br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/05\/23\/casos-uso-avanzados-llm-rag-agentes-fine-tuning\/\">Casos de Uso Avanzados: RAG, Agentes y Fine-tuning<\/a>: M\u00e1s all\u00e1 del chat: c\u00f3mo integrar LLMs en sistemas de producci\u00f3n. Retrieval-Augmented Generation para conocimiento espec\u00edfico, agentes con capacidad de acci\u00f3n, y cu\u00e1ndo fine-tuning tiene sentido frente a prompt engineering.<br><br><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><a href=\"https:\/\/atlaszn.com\/blog\/2026\/06\/08\/parametros-de-generacion\/\">Par\u00e1metros de generaci\u00f3n<\/a>: Temperatura, top-p, top-k, repetition penalty, y los dem\u00e1s par\u00e1metros que controlan c\u00f3mo un LLM genera texto. C\u00f3mo cada uno afecta la distribuci\u00f3n de probabilidad y cu\u00e1ndo ajustar cada uno en funci\u00f3n del caso de uso.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Una serie sobre c\u00f3mo funcionan los modelos de lenguaje por dentro, c\u00f3mo ejecutarlos localmente, y c\u00f3mo explotar sus capacidades en sistemas reales. Ancho de banda de memoria para IA local: Qu\u00e9 pasa cuando un LLM procesa un prompt. Arquitectura de transformadores,&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-659","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/pages\/659","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/comments?post=659"}],"version-history":[{"count":2,"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/pages\/659\/revisions"}],"predecessor-version":[{"id":661,"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/pages\/659\/revisions\/661"}],"wp:attachment":[{"href":"https:\/\/atlaszn.com\/blog\/wp-json\/wp\/v2\/media?parent=659"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}