Il progetto
ALA — Advanced Laboratory Automation — è un progetto di ricerca e sviluppo congiunto tra il Gruppo INPECO (leader mondiale nell’automazione di laboratorio clinico) e l’Istituto di BioRobotica della Scuola Superiore Sant’Anna di Pisa, con un investimento complessivo di 3,5 milioni di euro e un team di 30 ricercatori.
Il progetto ha affrontato tre linee di ricerca principali:
- Software — Rilevamento di lesioni cutanee basato su deep learning: benchmark di performance super-umana, architetture DL efficienti tramite tecniche di ottimizzazione (AdaNet, AmoebaNet, NasNet), robustezza della classificazione con training regimen, data augmentation e generation
- Hardware — Dispositivo integrato di sensing multimodale e inferenza DL: layout di sistema, progettazione dei sotto-moduli, integrazione infrastrutturale
- Tracciabilità totale di campioni biologici e dati clinici lungo l’intera catena di automazione del laboratorio
L’approccio adottato è stato incrementale: partendo dall’implementazione di un modello allo stato dell’arte (SoA), per poi superarlo con tecniche proprietarie, seguendo un paradigma di sviluppo iterativo — dai prototipi a code base stabili.
Il gruppo di lavoro
- Gruppo INPECO — committente, leader mondiale nell’automazione pre-analitica e post-analitica di laboratorio
- Istituto di BioRobotica — Scuola Superiore Sant’Anna — Computer-Integrated Technologies for Robotic Surgery Laboratory, Surgical Robotics and Allied Technologies Area
- noze — architettura software AI e cloud, pipeline di dati, containerizzazione, web app e mobile app
- Centri di Dermatologia di Siena e Livorno — validazione clinica, dataset dermatologici
Il ruolo di noze
Stefano Noferi (noze) ha partecipato al progetto dal 2019 al 2023 come architetto software AI e cloud — inizialmente tramite l’Istituto di BioRobotica della Scuola Superiore Sant’Anna e successivamente in collaborazione diretta con il Gruppo INPECO — con responsabilità sulla progettazione e implementazione dell’intera infrastruttura software.
1. Architettura cloud e on-premise per la pipeline AI
Progettazione e implementazione dei sistemi cloud (Azure) e on-premise per la gestione dell’intera pipeline di intelligenza artificiale: ingestione dati, pre-processing, training, inferenza e distribuzione dei modelli. L’architettura — progettata con un approccio modulare e a microservizi — ha permesso di raccogliere dati pseudonimizzati dai vari centri dermatologici e di centralizzarne elaborazione, segmentazione e classificazione, con separazione netta tra Frontend GUI, Backend (ANN Model Class) e Patient-data API.
2. Gestione dei dati e retraining
Implementazione dei flussi di gestione dati per tre tipologie distinte:
- Dati anamnestici — informazioni cliniche del paziente raccolte via backend Azure, elaborate dal neural engine per la valutazione del rischio anamnestico
- Immagini RGB — frame acquisiti via smartphone camera API, classificati dal neural engine per image classification con segmentazione e classificazione delle lesioni
- Dati puntuali e segnali multimodali — provenienti da spettrofotometri e altre sorgenti, archiviati nel RAW data archive
Pipeline di retraining continuo dei modelli con i nuovi dati clinici validati dai dermatologi.
3. Infrastruttura containerizzata
Deployment tramite container Docker con orchestrazione Redis (Redis Director + Redis Cache) per il caching e il routing delle richieste di inferenza verso i modelli neurali. Architettura SoA trunk per la persistenza e il recupero dei dati paziente.
4. Interfacce web e mobile
Sviluppo della web app dedicata ai dermatologi (React) per la visualizzazione delle classificazioni, la revisione delle diagnosi assistite da AI e la gestione dei dataset di training. Sviluppo dell’app mobile per i pazienti (React Native) per l’acquisizione guidata delle immagini delle lesioni e la consultazione dei referti. Backend in Python/Django con API REST.
Attività condotta in collaborazione con i centri di dermatologia di Siena e Livorno per la validazione clinica dei risultati.
Tecnologie e approccio
Deep Learning con reti CNN per classificazione e segmentazione di immagini dermatologiche. Azure come piattaforma cloud, Docker per la containerizzazione, Redis per caching e orchestrazione, Python/Django e REST API per il backend, React e React Native per le interfacce. Stack Python/TensorFlow per i modelli neurali. Architettura modulare ispirata ai principi Industry 4.0 con gestione centralizzata di dati pseudonimizzati e tracciabilità end-to-end dei campioni.