ClickHouse: database analytico columnar open source

ClickHouse open source 2016 (Yandex), ClickHouse Inc. 2021: OLAP columnar database con query analitiche su miliardi di righe in secondi, SQL standard, MergeTree engine. Uno degli OLAP più veloci disponibili.

Open SourceR&D ClickHouseOLAPAnalyticsColumnarYandexDatabaseOpen Source

Un OLAP ingegnerizzato per scale web

ClickHouse è stato sviluppato internamente da Yandex (motore di ricerca russo) dal 2009 per alimentare Yandex.Metrica, piattaforma analytics web di scala simile a Google Analytics. Rilasciato come open source a giugno 2016 sotto licenza Apache 2.0. Nel settembre 2021 viene fondata ClickHouse Inc. (spin-off con leadership ex-Yandex e VC investments) con sede negli USA.

Caratteristiche tecniche

  • Columnar storage — dati organizzati per colonna invece che per riga, ideale per query analitiche che toccano pochi campi su tante righe
  • MergeTree engine — background compaction di segmenti ordinati, come LSM-tree adattato a OLAP
  • Compression — LZ4, ZSTD, Delta, Gorilla — riduce storage 5-10x rispetto a dati raw
  • SIMD vectorization — elaborazione in batch con istruzioni CPU moderne
  • Materialized views con aggregazioni incrementali
  • Distributed — cluster shardati + replicati con ZooKeeper/ClickHouse Keeper
  • SQL standard — supporta una gran parte di ANSI SQL con estensioni analitiche

Performance

Benchmarks pubblici mostrano ClickHouse gestire query su miliardi di righe in pochi secondi su cluster di dimensioni medie. Compete direttamente con Apache Druid, Apache Pinot, Amazon Redshift, Google BigQuery, Snowflake su scenari analitici.

Uso

  • Web analytics (scala Yandex, Cloudflare, Uber)
  • Observability — log aggregation, APM (Hyperscaler backend)
  • Ad-tech — real-time bidding analytics
  • Finanziaria — time series di prezzi
  • IoT — ingest e query di sensor data
  • Ecommerce — behavioral analytics

Nel contesto italiano

Adoption italiana crescente in:

  • Ad-tech — piattaforme pubblicitarie italiane
  • Gaming studios
  • Telco — analisi CDR/NetFlow
  • SaaS analytics italiani

Riferimenti: ClickHouse open source (giugno 2016), Yandex. ClickHouse Inc. (settembre 2021). Licenza Apache 2.0. MergeTree engine. Columnar storage. Yandex.Metrica come primo user. Concorrenti: Druid, Pinot, Redshift, BigQuery, Snowflake.

Vuoi supporto? Sei sotto attacco? Stato dei servizi
Vuoi supporto? Sei sotto attacco? Stato dei servizi