Partager via


Stratégie de partitionnement des données

La stratégie de partitionnement définit si et comment les étendues (partitions de données) dans votre cluster sont créées. Vous ne pouvez interroger les données dans une étendue qu’une fois qu’elles sont créées.

Notes

  • Pour une faible latence entre l’ingestion et la requête, envisagez de configurer l’ingestion de streaming.
  • La stratégie s’applique à toutes les opérations qui créent de nouvelles étendues, telles que les commandes pour l’ingestion de données et les opérations de fusion d’étendue

La stratégie de partitionnement des données contient les propriétés suivantes :

  • ShardEngineMaxRowCount :

    • Nombre maximal de lignes pour une étendue créée par une opération d’ingestion ou de reconstruction.
    • La valeur par défaut est 1 048 576.
    • N’est pas en vigueur pour lesopérations de fusion.
      • Si vous devez limiter le nombre de lignes dans les extensions créées par les opérations de fusion, ajustez la RowCountUpperBoundForMerge propriété dans la stratégie de fusion des étendues de l’entité.
  • ShardEngineMaxExtentSizeInMb :

    • Taille maximale autorisée des données compressées (en mégaoctets) pour une étendue créée par une opération de fusion ou de reconstruction.
    • La valeur par défaut est 8 192 (8 Go).
  • ShardEngineMaxOriginalsizeInMb :

    • Taille maximale autorisée des données d’origine (en mégaoctets) pour une étendue créée par une opération de reconstruction.
    • En effet uniquement pour les opérations de reconstruction.
    • La valeur par défaut est 3 072 (3 Go).

Avertissement

Consultez l’équipe du support technique avant de modifier une stratégie de partitionnement des données.

Lorsqu’une base de données est créée, elle contient la stratégie de partitionnement des données par défaut. Cette stratégie est héritée par toutes les tables créées dans la base de données (sauf si la stratégie est explicitement remplacée au niveau de la table).

Utilisez les commandes de gestion des stratégies de partitionnement pour gérer les stratégies de partitionnement des données pour les bases de données et les tables.