Il progetto
DebugABot è un progetto di ricerca deep tech dedicato alla governance degli agenti AI autonomi e dei sistemi intelligenti embodied. Il problema affrontato è concreto: man mano che i sistemi di intelligenza artificiale acquisiscono maggiore autonomia, diventa essenziale disporre di strumenti per identificarli, diagnosticarne il comportamento e intervenire quando necessario.
Le nove primitive
L’architettura di DebugABot si articola in nove primitive organizzate in tre fasi operative:
Identify — riconoscere e tracciare:
- Model Fingerprinting: identificazione univoca del modello AI in esecuzione tramite la sua impronta comportamentale.
- Blame Attribution: attribuzione di responsabilità per le azioni compiute da un agente autonomo.
- Multi-Agent Tracing: tracciamento delle interazioni in sistemi multi-agente complessi.
Diagnose — analizzare e valutare:
- Sycophancy/Deception Detector: rilevazione di comportamenti compiacenti o ingannevoli nei modelli.
- Human Index Score: misurazione del grado di allineamento del comportamento dell’agente rispetto a standard umani.
- Active Ethical Injector: iniezione dinamica di vincoli etici nel processo decisionale dell’agente.
Intervene — controllare e contenere:
- Kill Switch: interruzione immediata e sicura di un agente autonomo.
- Behavioral Controller: modulazione in tempo reale del comportamento dell’agente.
- Rogue Intelligence Containment: contenimento di sistemi che deviano dal comportamento previsto.
Le tecnologie
Lo stack di ricerca comprende Transformers, Diffusion Models, State-Space Models, World Models, architetture neuromorfe, Embodied AI e Runtime Monitoring.