Aanbevelingen van Azure Advisor voor toegewezen SQL-pool in Azure Synapse Analytics

Artikel
06/01/2023

In dit artikel worden de aanbevelingen voor toegewezen SQL-pools beschreven die beschikbaar zijn in Azure Advisor.

Toegewezen SQL-pool biedt aanbevelingen om ervoor te zorgen dat uw datawarehouse-workload consistent is geoptimaliseerd voor prestaties. Aanbevelingen zijn nauw geïntegreerd met Azure Advisor om u te voorzien van best practices rechtstreeks binnen de Azure Portal. Een toegewezen SQL-pool verzamelt telemetrie en geeft dagelijks aanbevelingen voor uw actieve workload weer. De ondersteunde aanbevelingsscenario's worden hieronder beschreven, samen met het toepassen van aanbevolen acties.

U kunt uw aanbevelingen vandaag nog bekijken .

Ongelijkheid in gegevens

Scheeftrekken van gegevens kunnen leiden tot extra gegevensverplaatsing of resourceknelpunten bij het uitvoeren van uw workload. De volgende documentatie beschrijft show om scheeftrekken van gegevens te identificeren en te voorkomen dat dit gebeurt door een optimale distributiesleutel te selecteren.

Scheeftrekken identificeren en verwijderen

Geen of verouderde statistieken

Suboptimale statistieken kunnen de prestaties van query's ernstig beïnvloeden, omdat het SQL-queryoptimalisatieprogramma suboptimale queryplannen kan genereren. In de volgende documentatie worden de aanbevolen procedures beschreven voor het maken en bijwerken van statistieken:

Tabelstatistieken maken en bijwerken

Voer het volgende T-SQL-script uit om de lijst met tabellen te zien die door deze aanbevelingen worden beïnvloed. Advisor voert continu hetzelfde T-SQL-script uit om deze aanbevelingen te genereren.

Tabellen repliceren

Voor aanbevelingen voor gerepliceerde tabellen detecteert Advisor tabelkandidaten op basis van de volgende fysieke kenmerken:

Grootte van gerepliceerde tabel
Aantal kolommen
Tabeldistributietype
Aantal partities

Advisor maakt continu gebruik van heuristieken op basis van workloads, zoals de frequentie van tabeltoegang, rijen die gemiddeld worden geretourneerd en drempelwaarden rond de grootte en activiteit van het datawarehouse om ervoor te zorgen dat aanbevelingen van hoge kwaliteit worden gegenereerd.

In de volgende sectie worden de heuristieken op basis van workloads beschreven die u kunt vinden in de Azure Portal voor elke aanbeveling voor elke gerepliceerde tabel:

Gemiddelde scan: het gemiddelde percentage rijen dat is geretourneerd uit de tabel voor elke tabeltoegang gedurende de afgelopen zeven dagen
Vaak gelezen, geen update - geeft aan dat de tabel niet is bijgewerkt in de afgelopen zeven dagen terwijl de toegangsactiviteit wordt weergegeven
Verhouding lezen/bijwerken: de verhouding tussen hoe vaak de tabel is geopend ten opzichte van wanneer deze in de afgelopen zeven dagen wordt bijgewerkt
Activiteit: meet het gebruik op basis van toegangsactiviteit. Met deze activiteit wordt de toegangsactiviteit voor tabellen vergeleken met de gemiddelde toegangsactiviteit voor tabellen in het datawarehouse in de afgelopen zeven dagen.

Momenteel worden in Advisor maximaal vier gerepliceerde tabelkandidaten tegelijk weergegeven met geclusterde columnstore-indexen die prioriteit geven aan de hoogste activiteit.

Belangrijk

De aanbeveling voor de gerepliceerde tabel is niet dwaas bewijs en houdt geen rekening met bewerkingen voor gegevensverplaatsing. We werken eraan om dit toe te voegen als een heuristiek, maar in de tussentijd moet u uw workload altijd valideren nadat u de aanbeveling hebt toegepast. Ga naar de volgende documentatie voor meer informatie over gerepliceerde tabellen.

Adaptief (Gen2) cachegebruik

Wanneer u een grote werkset hebt, kunt u een laag percentage cachetreffers en een hoog cachegebruik ervaren. Voor dit scenario moet u omhoog schalen om de cachecapaciteit te vergroten en uw workload opnieuw uit te voeren. Raadpleeg de volgende documentatie voor meer informatie.

Tempdb-conflict

Queryprestaties kunnen afnemen wanneer er sprake is van een hoog tempdb-conflict. Tempdb-conflicten kunnen optreden via door de gebruiker gedefinieerde tijdelijke tabellen of wanneer er een grote hoeveelheid gegevensverplaatsing is. Voor dit scenario kunt u schalen voor meer tempdb-toewijzing en resourceklassen en workloadbeheer configureren om meer geheugen aan uw query's te bieden.

Onjuiste configuratie van gegevens laden

U moet altijd gegevens laden vanuit een opslagaccount in dezelfde regio als uw toegewezen SQL-pool om de latentie te minimaliseren. Gebruik de INSTRUCTIE COPY voor gegevensopname met hoge doorvoer en splits uw gefaseerde bestanden in uw opslagaccount om de doorvoer te maximaliseren. Als u de COPY-instructie niet kunt gebruiken, kunt u de SqlBulkCopy-API of bcp met een grote batchgrootte gebruiken voor een betere doorvoer. Zie Best practices voor het laden van gegevens voor aanvullende richtlijnen voor het laden van gegevens.