VERTICA

RAZENDSNELLE ANALYTICS

about

Het bewaren, beheren en vooral performant bevragen van data wordt vaak vrij snel omslachtig. 
Het volume groeit niet alleen, ook de modellering (ook niet-gestructureerde data moet gemodelleerd worden) wordt complexer, net als de bevragingen.

Relationele databases waren de voorbije decennia de hoeksteen van elke informatie architectuur. Waar ze erg goed zijn in het omgaan met CRUD operaties (Create, Read, Update, Delete, het verwerken van individuele acties), zijn ze door hun architectuur (die gericht is op verwerkingen over volledige rijen) minder geschikt voor analytische workloads, waar de nadruk vooral ligt op het verwerken van grote hoeveelheden data. 

Vertica is een razendsnelle (10 tot 50 maal sneller dan 'legacy' systemen) gedistribueerde analytische database die van de grond af ontwikkeld is voor analytics:

  • column based: bij bevragingen worden enkel de relevante kolommen gelezen in plaats van volledige rijen, zoals bij traditionele databases. Bij analyses over grote hoeveelheden data maakt dat een groot verschil.
  • distributed: data wordt bewaard op een cluster van machines, zodat ook de workload over meerder machines gespreid kan worden
  • door integratie met platformen zoals Kafka, Spark en andere platformen en de mogelijkheid om rechtstreeks uit data lakes te lezen is Vertica veel meer dan een database
  • machine learning: in standaard data science omgevingen wordt data uit het data warehouse geëxporteerd, of naast het data warehouse opgebouwd om er modellen op te bouwen, te trainen en uit te rollen. In Vertica kan dit via SQL-functies rechtstreeks in de database, wat een aanzienlijke besparing in tijd en resources oplevert.

Vertica wordt gebruikt in analytics projecten van verschillende groottes, bij middelgrote bedrijven tot de grootste en meeste data-intensieve bedrijven ter wereld (onder andere Facebook, Uber en AirBnB).