AIHealth
Piattaforma clinica on-premise con LLM locali, RAG su dati FHIR/DICOM, supporto alla diagnosi, follow-up remoto. Architettura progettata per il percorso MDR.
Scopri AIHealth →
Digital Health
Sviluppo di software medicale conforme agli standard normativi CE e MDR. Sistemi di supporto alle decisioni cliniche, integrazione AI nei flussi di lavoro clinici.
Scopri →Ontologie come struttura della conoscenza biomedica
Le terminologie — SNOMED CT, LOINC, ICD — sono elenchi strutturati di concetti con identificatori, descrizioni e gerarchie. Le ontologie fanno un passo ulteriore: rappresentano non solo i concetti ma anche le relazioni tra essi — causa, parte di, partecipa a, regola — con la formalità di una logica descrittiva, in modo che un software possa ragionare sul dominio rappresentato (derivare conclusioni non esplicite, verificare coerenza, classificare istanze).
L’applicazione alla biomedicina è naturale: un’ontologia genica dice che TP53 è una proteina soppressore tumorale che partecipa al ciclo cellulare e regola l’apoptosi; un’ontologia fenotipica dice che brachidattilia è una forma di anomalia delle dita che è un’anomalia degli arti. Da una diagnosi possiamo risalire per is-a a tutte le super-classi diagnostiche; da un farmaco possiamo navigare le classi ATC; da un fenotipo possiamo trovare malattie associate.
Il principale editor open source di ontologie usato in ambito biomedico è Protégé, sviluppato a Stanford.
Protégé
Protégé è stato creato al Biomedical Informatics Research Group (oggi Stanford Center for Biomedical Informatics Research, SCBIR) sotto la guida di Mark A. Musen a partire dagli anni ‘80, originariamente come editor di ontologie a frame per progetti di informatica medica. Nel corso del tempo ha subito diverse riscritture:
- Protégé-2000 e Protégé-3.x — editor frame-based, Java, diffuso negli anni 2000
- Protégé 4.x — riscrittura con focus su OWL (Web Ontology Language, W3C Recommendation 2004), architettura basata su OWL API
- Versione attuale 4.3 (rilasciata nel corso del 2013) con supporto completo a OWL 2 (W3C Recommendation 2009)
La licenza è BSD. Il codice è ospitato su repository pubblico Stanford e GitHub, con contributi dalla comunità globale.
L’interfaccia desktop è una GUI Java (Swing) che espone le classi, le proprietà (object properties e data properties), le istanze. È complementata da WebProtégé, versione web collaborativa che consente editing multi-utente simultaneo con controllo di versione — rilasciata nel 2010 e in continuo miglioramento.
OWL e reasoner
OWL 2 — la versione attuale del Web Ontology Language — permette di esprimere assiomi come:
- Sussunzione (
SubClassOf) — Diabete mellito tipo 2 è sottoclasse di Diabete mellito - Equivalenza (
EquivalentClasses) — definizioni formali tramite restrizioni - Disgiunzione (
DisjointClasses) — Uomo e Donna disgiunte - Restrizioni di proprietà — “una Polmonite è un’infezione che coinvolge il polmone” espresso come
Pneumonia ⊑ Infection ⊓ ∃involves.Lung
Un reasoner è un motore che, data un’ontologia, calcola:
- Classificazione tassonomica — chi è sottoclasse di chi, riconoscendo relazioni implicite
- Consistency checking — verifica che l’ontologia non contenga contraddizioni
- Instance classification — data un’istanza, determinare le classi a cui appartiene
- Query answering — rispondere a interrogazioni in SPARQL o DL-queries
I reasoner disponibili per Protégé al 2013:
- HermiT — Università di Oxford (Ian Horrocks gruppo), supporto completo OWL 2 DL
- Pellet — Complexible (ex Clark & Parsia), OWL 2 DL, licenza AGPL
- FaCT++ — University of Manchester, storico, C++
- ELK — Oxford + Ulm, specializzato per il profilo OWL 2 EL (sottoinsieme tractable), estremamente veloce, usato per SNOMED CT (che è in EL++)
La scelta del reasoner è un trade-off tra espressività (OWL 2 DL pieno) e performance (OWL 2 EL tractable): in biomedicina, dove le ontologie sono grandi ma le restrizioni espressive limitate, ELK è spesso la scelta di efficienza.
OBO Foundry
L’ecosistema delle ontologie biomediche è coordinato dall’Open Biological and Biomedical Ontologies Foundry — OBO Foundry — fondato nel 2007 da un consorzio di sviluppatori di ontologie biomediche (Barry Smith, University at Buffalo; Suzanna Lewis, Berkeley; Michael Ashburner, Cambridge; Michael Bada, Colorado). OBO Foundry stabilisce principi di buona costruzione di ontologie:
- Open — licenza libera, documentazione accessibile
- Commoncarriers format (OBO format o OWL)
- Uniquely identified — IRI canonici
- Versioned
- Minimum maintenance garantita
- Plurality of users
- Well-documented
- Defined scope senza sovrapposizioni
Le ontologie conformanti OBO Foundry sono un catalogo curato di riferimento, attualmente con circa 130 ontologie. Alcune delle più rilevanti:
- Gene Ontology (GO) — Gene Ontology Consortium, una delle prime e più usate, descrive processi biologici, funzioni molecolari, componenti cellulari
- ChEBI (Chemical Entities of Biological Interest) — EBI, entità chimiche rilevanti in biologia
- Foundational Model of Anatomy (FMA) — Università di Washington (Cornelius Rosse), anatomia umana dettagliata
- Human Phenotype Ontology (HPO) — Charité Berlin (Peter Robinson), fenotipi umani con associazioni a malattie
- Disease Ontology (DO) — Washington University, malattie umane
- Uberon — anatomia comparata cross-specie
- ChEBI, Protein Ontology (PRO), Ontology for Biomedical Investigations (OBI), e molte altre
SNOMED CT — terminologia medica dominante — è distribuita come OWL 2 EL e navigabile con reasoner ELK. Protégé consente di caricare e esplorare SNOMED CT, pur senza le funzionalità di authoring formale (SNOMED CT è editato con strumenti dedicati dai suoi curatori internazionali).
BioPortal
Il National Center for Biomedical Ontology (NCBO) — consorzio NIH con sede a Stanford — gestisce BioPortal (bioportal.bioontology.org), repository web di ontologie biomediche. BioPortal al 2013 ospita oltre 500 ontologie caricate, con strumenti di ricerca concept-based, visualizzazione, API REST per accesso programmatico, servizi di mapping tra ontologie.
BioPortal è fondamentale come infrastruttura di condivisione: un ricercatore non deve scaricare e installare un reasoner per esplorare un’ontologia; la consulta via browser o via API. Offre inoltre servizi di annotazione automatica — dato un testo, restituisce i concetti delle ontologie registrate rintracciabili — complementare a MetaMap per alcuni scenari.
Applicazioni cliniche
Le ontologie biomediche trovano applicazione clinica in diversi scenari:
Phenotype matching
Un paziente con una combinazione di sintomi viene confrontato — tramite la Human Phenotype Ontology — con profili di malattie genetiche rare. Strumenti come Phenomizer (sviluppato a Charité) abbinano fenotipi a diagnosi candidate, utile nella diagnosi di malattie rare dove il clinico non può conoscere tutte le ~7.000 condizioni note.
Decision support su guidelines
Le linee guida cliniche — codificate in GLIF, PROforma, o in knowledge artifact OpenCDS — si appoggiano a ontologie per definire concetti con precisione (“insufficienza renale cronica grado 4”, “inibitore dell’ACE”).
Literature-based discovery
Navigando relazioni tra entità in ontologie e articoli indicizzati con ontologie, è possibile identificare connessioni latenti (gene → proteina → malattia → farmaco).
Drug repurposing
Integrazione tra ontologie farmacologiche (ChEBI, DrugBank) e ontologie fenotipiche/malattie può suggerire riutilizzi di farmaci esistenti per patologie nuove.
Data integration cross-sorgente
Ontologie fungono da schema di integrazione per dataset provenienti da laboratori, cartelle, registri diversi. Base tecnica dei progetti linked open data biomedici.
Semantic search
Ricerca concettuale invece che di stringa — un utente cerca “malattie infiammatorie” e il sistema espande la query con sottoclassi note (artrite reumatoide, lupus, colite ulcerosa, …) grazie all’ontologia.
Comunità italiana
In Italia, al 2013, l’uso di Protégé e di ontologie biomediche è consolidato in gruppi di ricerca di informatica biomedica (Università di Pavia, Torino, Roma La Sapienza, Politecnico di Milano, Università di Bari), in progetti di farmacogenomica e di malattie rare. La partecipazione italiana a OBO Foundry è presente (OBI ha contributi italiani, alcune ontologie specialistiche sono state prodotte in Italia).
L’uso operativo in cartelle cliniche italiane è marginale; le ontologie biomediche restano strumento di ricerca piuttosto che di pratica clinica corrente. L’emergere del tema linked data sanitari — che riceverà maggiore attenzione nei prossimi anni con l’evoluzione dei FSE regionali e con l’ingresso di FHIR — aprirà nuovi spazi di applicazione.
Prospettive
Le direzioni evolutive osservabili nei prossimi anni includono:
- Protégé 5.x previsto nei prossimi anni, con ulteriori miglioramenti a WebProtégé e integrazione con tool di collaborazione moderni
- Reasoner specializzati per ontologie di scala — SNOMED CT, NCIt (NCI Thesaurus) richiedono ottimizzazioni che ELK e derivati continueranno a migliorare
- Integrazione FHIR + ontologie — FHIR ha
CodeSystem,ValueSet,ConceptMapche si collegano naturalmente con ontologie; la traduzione bidirezionale è un’area di lavoro - Knowledge Graphs clinici — ecosistemi integrati di ontologie + istanze + reasoner + API, appoggiati a triple store come Virtuoso, Apache Jena TDB, Stardog
- Embedding e deep learning — l’emergere di tecniche neurali per rappresentare conoscenza (embedding di grafi, knowledge graph embedding) inizierà nei prossimi anni ad affiancare la rappresentazione logica pura
Le ontologie biomediche continueranno ad essere una infrastruttura silenziosa dell’informatica medica — presente in molti strumenti senza essere visibile all’utente finale, fondamentale per la qualità semantica di ciò che l’utente vede.
Riferimenti: Protégé 4.3, Stanford University (protege.stanford.edu). Mark A. Musen, Stanford Center for Biomedical Informatics Research. OWL 2 W3C Recommendation (2009). Reasoner HermiT, Pellet, FaCT++, ELK. OBO Foundry (obofoundry.org), fondato 2007. BioPortal (bioportal.bioontology.org), NCBO.