Skip to content

DB modeling

nosql Data modeling Techniques

nosql

  • on sait que l'on requete toujours d'une certaine façon, donc on fait les joins au design time (et pas au query time)

Denormalization

  • parce qu'on fait bcp de read
  • on duplique la data
  • on élimine es joins

Aggregate = soft schema = document (exemple: un Product qui a plusieurs schema json possible)

Materialized view: contient le résultat précalculé d'une query. Nécessite un processus de refresh.

OLAP = dead.

MPP Data Warehouse: Massively Parallel Processing Data Warehouse. Google BigQuery, Amazon Redshift, Microsoft Azure Data Warehouse.

ELT vs ETL:

  • Extraxt Transform Load: récupère des données, les reformate et les réinsère dans une autre bdd/datawarehouse pour analyse
  • ELT: La transformation s'effectue au sein de la BDD cible. Le process est plus simple et rapide (vitesse d'ingestion) que ETL, notamment si beaucoup de sources de données. Ex: Hadoop.

Data modeling

Data modeling is the process of using business logic to transform raw data, in order to produce 'modelled' data that is simpler for querying Holistics.io

Data model: abstraction basée sur le DB model qui facilite le recueil d'information (ex: materialised view)