Qu'est-ce que l'entrepôt de données Azure SQL ?

L'entrepôt de données Azure SQL (SQL DW) est un entrepôt de données analytiques MPP d'une capacité de plusieurs pétaoctets reposant sur SQL server et s'exécutant dans le cadre de la plateforme de calcul cloud, Microsoft Azure. Comme d'autres solutions MPP dans le cloud, SQL DW sépare le stockage du calcul, en facturant chacun séparément. Contrairement à de nombreuses autres solutions d'entrepôt de données analytiques, SQL DW fait abstraction des machines physiques et représente la puissance de calcul sous la forme d'unités d'entrepôts de données (DWU) ce qui permet aux utilisateurs de mettre à l'échelle les ressources de calcul à leur gré, facilement et tout en souplesse.

L'entrepôt de données Azure SQL fait partie intégrante de la plateforme cloud de calcul, Microsoft Azure. Opter pour cette base de données est ainsi une évidence pour les entreprises qui sont déjà engagées dans la pile de technologies Microsoft.

Opter pour l'entrepôt de données Azure SQL

Plateforme cloud de calcul Azure de Microsoft

L'écosystème Azure de Microsoft est immense et il offre un éventail complet de solutions avec une multitude d'outils que vous pouvez facilement ajouter à tout moment afin de tirer encore plus profit de votre pile de technologies. Plutôt que d'utiliser une seule base de données avec divers prestataires de services tiers, vous avez la possibilité d'investir complètement dans la plateforme de Microsoft.

Facilité d'utilisation

Azure SQL DW extrait les ressources de calcul de l'utilisateur au lieu de les représenter sous la forme d'unités d'entrepôt de données, qu'un utilisateur peut très facilement adapter pour fournir plus ou moins de ressources à son entrepôt de données.

Flexibilité

Les utilisateurs finaux bénéficient de diverses options afin d'augmenter les performances de leur entrepôt de données Azure SQL. Ils peuvent soit mettre à niveau leurs machines virtuelles individuelles soit ajouter davantage de ressources de calcul sous la forme de machines supplémentaires qui peuvent être configurées pour une mise à l'échelle automatique.

Pour quels cas d'utilisation l'entrepôt de données Azure SQL est-il idéal ?

Entreprises utilisant SQL Server/une base de données SQL

L'entrepôt de données Azure SQL est pourvu de la même technologie que SQL Server et que la base de données SQL, ce qui facilite le chargement de données du SQL Server vers l'entrepôt de données SQL.

Les entreprises qui stockent leurs données à la fois dans le stockage Blob Azure et Hadoop et les entreprises qui stockent leurs données à la fois dans le stockage Blob Azure et HDFS (système de fichier distribué Hadoop) se rendront compte qu'Azure est un outil formidable. En effet, sa fonction Polybase permet aux utilisateurs de combiner les données relationnelles stockées dans Azure aux données non relationnelles de Hadoop.

Considérations de prix

Pour Azure SQL DW, le calcul et le stockage sont facturés séparément. Contrairement à AWS, le client ignore totalement quel matériel se cache derrière Azure DW. Pour le calcul, la quantité d'unités d'entrepôt de données sert à mesurer la puissance. Pour le stockage, le client sera facturé au même taux que pour le stockage Azure Premium.

Sur le site de Microsoft, se trouve un calculateur de tarification vous permettant d'estimer à la fois la tarification pour le calcul (pour l'entrepôt de données SQL) et la tarification pour le stockage (pour le stockage Azure dans le cloud).

Architecture de l'entrepôt de données Azure SQL

L'entrepôt de données Azure SQL possède une architecture similaire à d'autres bases de données MPP gérées. En effet, il dissocie le stockage du calcul. L'entrepôt de données Azure SQL se trouve juste au-dessus du stockage Azure Blob et extrait de manière dynamique les ressources de calcul pour rechercher les données qui y résident.

L'entrepôt de données Azure SQL est fondamentalement réparti en deux types de nœuds : un nœud de contrôle et plusieurs nœuds de calcul.

Les nœuds de contrôle servent à créer un plan d'exécution de requête et à décomposer cette requête en phases parallèles devant être exécutées par chaque nœud de calcul. En plus d'optimiser et de distribuer les requêtes, le nœud de contrôle a également pour fonction de stocker les métadonnées des requêtes.

Les nombreux nœuds de calcul contiennent chacun une instance de base de données SQL et servent à traiter les données stockées localement sur leurs disques individuels. Une fois que les résultats partiels sont traités pour un nœud de calcul individuel, les nœuds de calcul retournent ensuite ces résultats au nœud de contrôle afin de les agréger.

L'entrepôt de données Azure SQL interroge les données stockées sur le stockage Azure Blob qui est un immense référentiel de stockage non structuré appartenant à Microsoft. Il existe fondamentalement deux manières d'interroger les données sur le stockage Azure :

Types de données

L'entrepôt de données Azure SQL peut fonctionner avec des données relationnelles et non-relationnelles par le biais de Polybase, une couche de stockage destinée aux données à la fois relationnelles et HDFS (système de fichier distribué Hadoop).

Étendue de la ligne (quantité)

L'entrepôt de données Azure SQL combiné au stockage Azure Blob peut traiter des pétaoctets de données. Il est compatible avec Azure Data Lake et peut donc interroger des exaoctets de données.

Gestion et mise en œuvre de l'entrepôt de données Azure SQL

Mettre en œuvre l'entrepôt de données Azure SQL

Il est très facile de tester l'entrepôt de données Azure SQL pour faire une analyse comparative rapide. Avant de commencer, vous devez avoir à la fois un compte Azure  et un Azure SQL Server.

Dans la documentation de Microsoft, vous trouverez un guide vous expliquant parfaitement étape par étape la prise en main de l'entrepôt de données Azure SQL.

Processus pour nouvelles données

Microsoft propose plusieurs options pour intégrer des données dans Azure DW. Polybase d'Azure permet de charger rapidement des données évolutives de calcul. Des options plus traditionnelles telles que l'utilitaire de copie en bloc de Microsoft (Bulk Copy Process - BCP) et le chargement en bloc SQL peuvent être exploitées et sont évolutives uniquement sur les threads et non sur les unités d'entrepôt de données (unités de calcul d'Azure). Pour conclure, si vous avez déjà investi dans une pile de technologies Microsoft plus complète, il est possible d'utiliser SSIS (SQL Server Integration Services) comme une partie du flux d'alimentation ETL dans l'entrepôt de données Azure.

Maintenance

L'entrepôt de données Azure SQL est une solution basée sur le cloud. Cela permet aux utilisateurs de bénéficier d'une maintenance réduite comme pour des solutions de services gérés similaires. Cependant, Azure est vraiment unique : Azure offre aux utilisateurs toute la personnalisation nécessaire.

Unités d'entrepôt de données (DWU)

La puissance de calcul dans l'entrepôt de données Azure SQL est extraite sous forme d'unités d'entrepôt de données (DWU). Les utilisateurs peuvent de manière dynamique ajouter de la puissance de calcul à leur instance en augmentant le nombre de DWU de différentes manières.

Les DWU permettent aux utilisateurs de mettre à l'échelle très rapidement et facilement les ressources au sein de l'entrepôt de données.

Mettre à l'échelle l'entrepôt de données SQL en toute souplesse

L'une des forces d'Azure SQL réside dans sa flexibilité à mettre à l'échelle la base de données. Microsoft permet une mise à l'échelle à la fois verticale et horizontale de l'entrepôt de données.

Les utilisateurs peuvent faire évoluer de manière verticale l'entrepôt de données Azure SQL en changeant de niveau de service ou en plaçant la base de données dans un pool élastique.

Les utilisateurs peuvent mettre à l'échelle de manière horizontale l'entrepôt de données Azure SQL en ajoutant davantage d'unités d'entrepôts de données. La plateforme Azure fournit également une quantité astronomique de ressources afin de personnaliser une mise à l'échelle automatique de l'entrepôt de données.

Prenez goût à l'analytique

Business intelligence, analyse de big data ou vue client à 360° :
quels que soient vos besoins, Looker peut vous aider. Parlez à nos experts en données.

Demander une démo