Letta (ex MemGPT): memoria a lungo termine per agenti LLM

UC Berkeley Sky Computing Lab ribattezza MemGPT in Letta il 23 settembre 2024: agent con memory hierarchy (context window, archival storage, recall), REST API, ADE. Licenza Apache 2.0.

Open SourceAI Open SourceLettaMemGPTMemoryAgenticLLMAI

Da MemGPT a Letta

Nell’ottobre 2023 Charles Packer e il team dello UC Berkeley Sky Computing Lab pubblicano il paper “MemGPT: Towards LLMs as Operating Systems”, che propone un’analogia diretta tra la gestione della memoria di un sistema operativo e quella di un modello linguistico. Il 23 settembre 2024 il progetto viene ribattezzato Letta e diventa la base tecnologica di Letta Inc., spin-off dedicato alla commercializzazione dello stack agentico. Il codice resta pubblico sotto licenza Apache 2.0.

Il cambio di nome riflette un’estensione dello scope: mentre MemGPT era focalizzato sulla memoria virtuale per LLM, Letta si propone come framework completo per agent stateful persistenti, con gestione di utenti, tool, modelli e ruoli.

Memory hierarchy

L’idea centrale introdotta dal paper MemGPT è la memory hierarchy: il contesto di un LLM viene trattato come un livello di memoria limitato — analogo alla RAM — affiancato da livelli più capienti ma più lenti. Letta distingue tre livelli: il context window del modello (memoria attiva immediata), l’archival storage (memoria a lungo termine interrogabile via semantic search) e la recall memory (log delle interazioni passate).

L’agent stesso, tramite function calling, può decidere quando spostare informazioni tra i livelli: memorizzare un fatto nell’archival storage, recuperarlo tramite query, aggiornare il core memory block che rappresenta le informazioni sempre presenti nel contesto. Questo meccanismo consente di superare i limiti del context window pur mantenendo coerenza nel tempo su sessioni lunghe.

REST API e Agent Development Environment

Letta espone un REST API per la creazione e gestione degli agent: ogni agent è un’entità persistente identificata da un ID, con stato serializzato in database relazionale (PostgreSQL o SQLite). Lo stato include la memoria, la configurazione dei tool e la cronologia dei messaggi.

L’Agent Development Environment (ADE) è un’interfaccia web per ispezionare lo stato interno di un agent: visualizzazione del core memory, navigazione dell’archival storage, debug delle chiamate a tool. L’ADE è pensato come strumento per sviluppatori durante la progettazione e l’analisi del comportamento dell’agent.

Model-agnostic

Letta è compatibile con i principali provider — OpenAI, Anthropic, Google, Mistral, Ollama, LM Studio, vLLM — e con modelli open weight eseguiti localmente. La gestione della memoria è implementata a livello di framework e non richiede supporto nativo dal modello: qualsiasi LLM capace di function calling può funzionare come cuore di un agent Letta.

Link: letta.com

Vuoi supporto? Sei sotto attacco? Stato dei servizi
Vuoi supporto? Sei sotto attacco? Stato dei servizi