Un OLAP ingegnerizzato per scale web
ClickHouse è stato sviluppato internamente da Yandex (motore di ricerca russo) dal 2009 per alimentare Yandex.Metrica, piattaforma analytics web di scala simile a Google Analytics. Rilasciato come open source a giugno 2016 sotto licenza Apache 2.0. Nel settembre 2021 viene fondata ClickHouse Inc. (spin-off con leadership ex-Yandex e VC investments) con sede negli USA.
Caratteristiche tecniche
- Columnar storage — dati organizzati per colonna invece che per riga, ideale per query analitiche che toccano pochi campi su tante righe
- MergeTree engine — background compaction di segmenti ordinati, come LSM-tree adattato a OLAP
- Compression — LZ4, ZSTD, Delta, Gorilla — riduce storage 5-10x rispetto a dati raw
- SIMD vectorization — elaborazione in batch con istruzioni CPU moderne
- Materialized views con aggregazioni incrementali
- Distributed — cluster shardati + replicati con ZooKeeper/ClickHouse Keeper
- SQL standard — supporta una gran parte di ANSI SQL con estensioni analitiche
Performance
Benchmarks pubblici mostrano ClickHouse gestire query su miliardi di righe in pochi secondi su cluster di dimensioni medie. Compete direttamente con Apache Druid, Apache Pinot, Amazon Redshift, Google BigQuery, Snowflake su scenari analitici.
Uso
- Web analytics (scala Yandex, Cloudflare, Uber)
- Observability — log aggregation, APM (Hyperscaler backend)
- Ad-tech — real-time bidding analytics
- Finanziaria — time series di prezzi
- IoT — ingest e query di sensor data
- Ecommerce — behavioral analytics
Nel contesto italiano
Adoption italiana crescente in:
- Ad-tech — piattaforme pubblicitarie italiane
- Gaming studios
- Telco — analisi CDR/NetFlow
- SaaS analytics italiani
Riferimenti: ClickHouse open source (giugno 2016), Yandex. ClickHouse Inc. (settembre 2021). Licenza Apache 2.0. MergeTree engine. Columnar storage. Yandex.Metrica come primo user. Concorrenti: Druid, Pinot, Redshift, BigQuery, Snowflake.
