AIHealth
Piattaforma clinica on-premise con LLM locali, RAG su dati FHIR/DICOM, supporto alla diagnosi, follow-up remoto. Architettura progettata per il percorso MDR.
Scopri AIHealth →
Digital Health
Sviluppo di software medicale conforme agli standard normativi CE e MDR. Sistemi di supporto alle decisioni cliniche, integrazione AI nei flussi di lavoro clinici.
Scopri →Perché le terminologie pesano
Gli standard di scambio — HL7 v2, CDA R2, FHIR — definiscono la struttura dei messaggi e dei documenti. Non dicono però con quali parole nominare una diagnosi, un esame di laboratorio, un principio attivo. La parte semantica è affidata alle terminologie cliniche controllate: vocabolari strutturati in cui a un significato corrisponde un codice stabile, con una gerarchia o un grafo di relazioni, e una governance che cura stabilità e manutenzione.
Senza terminologie condivise un codice in un messaggio CDA vale localmente ma non è comparabile tra sistemi, regioni o Paesi. Con terminologie condivise diventa possibile aggregare, interrogare e analizzare dati clinici prodotti in contesti eterogenei — il presupposto tecnico del secondary use dei dati sanitari, della ricerca multicentrica, della programmazione epidemiologica.
Le tre famiglie oggi dominanti — con aree di competenza distinte — sono SNOMED CT, LOINC e la famiglia ICD.
SNOMED CT
SNOMED CT (Systematized Nomenclature of Medicine — Clinical Terms) è la terminologia clinica più estesa esistente. Nasce dalla fusione, nel 2002, di SNOMED (College of American Pathologists) con Clinical Terms Version 3 dell’NHS britannico. Dal 2007 è di proprietà dell’International Health Terminology Standards Development Organisation, oggi SNOMED International, ente non-profit con sede nel Regno Unito e membri nazionali in oltre trenta Paesi.
Il contenuto della International Edition supera i 350.000 concetti attivi: diagnosi, procedure, osservazioni, agenti infettivi, strutture anatomiche, farmaci generici, reperti. Ogni concetto ha un identificativo SCTID, una descrizione preferita (Fully Specified Name) e descrizioni sinonime multilingue. Le relazioni principali sono IS-A (sottoclasse), che forma una tassonomia poli-gerarchica, e un insieme di relazioni di dominio — finding site, associated morphology, causative agent, has active ingredient.
Due elementi rendono SNOMED CT particolarmente espressivo:
- Le descrizioni post-coordinate — la possibilità di comporre un concetto a partire da altri: fracture of shaft of tibia + due to fall codifica una diagnosi composta che non esiste necessariamente come concetto pre-coordinato
- I Reference Set (refset) — sottoinsiemi ufficiali o nazionali (per esempio il refset per la cardiologia, per le diagnosi ICU), che circoscrivono i concetti ammessi in un contesto specifico
L’interrogazione formale usa ECL (Expression Constraint Language): espressioni come <<64572001 (tutte le sottoclassi di “disease”) permettono ricerche semantiche su una cartella codificata.
L’adozione di SNOMED CT richiede l’appartenenza a SNOMED International da parte dello Stato o di enti autorizzati, con quote proporzionate al PIL. L’Italia non è al momento membro di SNOMED International; l’uso in progetti italiani avviene attraverso licenze di ricerca, trial o in contesti specifici autorizzati. Questo ritardo — visibile soprattutto a confronto con il Regno Unito, la Scandinavia, la Germania e l’Olanda — è un nodo ricorrente nel dibattito sull’evoluzione del FSE italiano.
LOINC
LOINC (Logical Observation Identifiers Names and Codes) è la terminologia di riferimento per osservazioni di laboratorio, osservazioni cliniche, sezioni documentali e documenti. È sviluppata dal Regenstrief Institute di Indianapolis dal 1994 e distribuita gratuitamente con licenza LOINC, che ne consente l’uso in qualsiasi prodotto commerciale o open source.
Ogni codice LOINC — per esempio 1558-6 Fasting plasma glucose [Mass/volume] in Serum or Plasma — è il risultato di un modello a sei assi:
- Component — che cosa viene misurato (glucosio)
- Property — proprietà fisica (massa per volume, concentrazione molare, …)
- Time — intervallo temporale (punto, intervallo)
- System — materiale biologico o contesto (siero, plasma, urina, …)
- Scale — scala di misura (quantitativa, ordinale, nominale)
- Method — metodo (opzionale)
L’universo LOINC si è esteso ben oltre il laboratorio: al 2017 conta oltre 90.000 concetti, inclusi codici per documenti e sezioni — utilizzati estensivamente in CDA R2 per identificare il tipo di documento (code nell’header) e il tipo di sezione. Il codice 34133-9 identifica per esempio un Summarization of Episode Note; 11502-2 un Laboratory report.
In Italia LOINC è adottato dai profili CDA R2 di HL7 Italia per la codifica di osservazioni di laboratorio e sezioni documentali. A partire dal 2012 è stata pubblicata una traduzione italiana ufficiale di LOINC, gestita da un consorzio italiano, che consente di localizzare descrizioni e mantenere gli stessi codici numerici della International Edition.
ICD
La International Classification of Diseases è la classificazione gestita dall’Organizzazione Mondiale della Sanità. Le versioni rilevanti:
- ICD-9 (1975) — usata globalmente fino agli anni ‘90. Negli Stati Uniti l’adattamento clinico ICD-9-CM è rimasto in uso fino al 2015
- ICD-10 (1990, revisioni successive) — versione WHO corrente per la codifica delle cause di morte nelle statistiche mortalità, adottata come standard per la reportistica WHO
- ICD-10-CM — adattamento clinico statunitense, adottato per la morbosità dal 1° ottobre 2015 in sostituzione di ICD-9-CM
- ICD-11 — la revisione in fase di finalizzazione; WHO sta completando il ballot per l’adozione dell’edizione completa nel maggio 2018
In Italia la situazione è peculiare: per la codifica della Scheda di Dimissione Ospedaliera (SDO) e per buona parte delle statistiche sanitarie il codice in uso è ancora ICD-9-CM, nella versione italiana ufficiale pubblicata dal Ministero della Salute (l’edizione 2007 è la principale in produzione). Per la codifica delle cause di morte l’ISTAT utilizza ICD-10. La transizione delle SDO a ICD-10 è stata a lungo annunciata ma non è stata ancora completata a livello nazionale. Il passaggio definitivo è legato anche all’evoluzione verso ICD-11, che cambierà nuovamente il quadro.
Altre terminologie rilevanti
Attorno alla triade SNOMED CT / LOINC / ICD gravitano vocabolari specializzati che rispondono a casi d’uso specifici:
- ATC (Anatomical Therapeutic Chemical) — codifica i farmaci per principio attivo e classe terapeutica, gestita dal WHO Collaborating Centre for Drug Statistics Methodology di Oslo. In Italia è la terminologia di riferimento per la codifica dei farmaci nei flussi sanitari
- AIC — codice identificativo del medicinale in commercio, assegnato da AIFA; non è un codice semantico ma un codice di prodotto
- UCUM (Unified Code for Units of Measure) — codifica standard per le unità di misura nelle osservazioni (LOINC usa UCUM)
- RxNorm — terminologia di riferimento per i farmaci negli USA, gestita dalla National Library of Medicine
- MedDRA — Medical Dictionary for Regulatory Activities, per la codifica di reazioni avverse nei trial clinici e nella farmacovigilanza
- ICD-O — International Classification of Diseases for Oncology, codifica sede e morfologia dei tumori
- TNM — sistema di stadiazione dei tumori, mantenuto dall’Union for International Cancer Control
- HGNC — nomenclatura dei geni umani
- ICPC-2 — International Classification of Primary Care, per la medicina di famiglia
Terminologie e standard di scambio
Le terminologie si innestano nei modelli di scambio attraverso i concetti di:
- CodeSystem — il vocabolario in quanto tale (SNOMED CT, LOINC, ICD-10-CM), identificato tramite OID o URI canonico
- ValueSet — un sottoinsieme selezionato di codici di uno o più CodeSystem, adatto a uno specifico contesto d’uso (per esempio diagnosi alla dimissione, agenti infettivi)
- ConceptMap — mappatura formale tra codici di CodeSystem diversi (ICD-9-CM → ICD-10, LOINC → SNOMED CT observation)
In FHIR questi tre concetti sono prime-class come Resource (CodeSystem, ValueSet, ConceptMap); in CDA R2 sono espressi come riferimenti a OID con terminologie codificate nelle <code> e <value>; in contesti osservazionali come OMOP CDM i CodeSystem sono armonizzati nelle Standardized Vocabularies, oggetto di un approfondimento a parte.
Strumenti
Al 2017 l’ecosistema strumentale intorno alle terminologie è variegato:
- Snow Owl (B2i Healthcare, Ungheria) — terminology server open source con supporto SNOMED CT, LOINC, ICD, ValueSet e ConceptMap
- Ontoserver (CSIRO, Australia) — terminology server FHIR, utilizzato in HealthTerminologies australiano
- BioPortal (NCBO, Stanford) — portale web di ontologie biomediche, con strumenti di mapping e navigazione
- OHDSI Athena — browser delle Standardized Vocabularies OMOP, che integra SNOMED CT, LOINC, RxNorm, ICD, ATC, HCPCS, CPT e altre terminologie in una vista unificata
- HAPI FHIR Terminology — modulo del server Java HAPI FHIR per l’esposizione di CodeSystem, ValueSet, ConceptMap via FHIR REST API
Il nodo irrisolto per l’Italia resta l’adesione formale a SNOMED International, senza la quale l’adozione di SNOMED CT nei sistemi nazionali resta parziale e legata a progetti specifici. La crescita del bisogno di semantica — spinta dall’AI clinica, dalla ricerca osservazionale e dai programmi europei di secondary use — renderà il tema sempre più centrale.
Riferimenti: SNOMED International — SNOMED CT International Release. Regenstrief Institute — LOINC. WHO — International Classification of Diseases (ICD-9, ICD-10, ICD-11). WHO Collaborating Centre for Drug Statistics Methodology — ATC. AIFA — banca dati farmaci. Snow Owl, Ontoserver, BioPortal, OHDSI Athena.