Cómo construí Neural, un servidor MCP que da memoria persistente a Claude Code usando PostgreSQL, pgvector y embeddings locales con Ollama. Arquitectura, decisiones de diseño y lecciones aprendidas tras 900+ memories en producción.
Google presenta TurboQuant, un algoritmo que comprime la memoria de los LLMs 6x sin perder precisión. Las acciones de Samsung, SK Hynix y Micron caen mientras Wall Street debate si el hardware de IA se ha vuelto obsoleto.