Veelgestelde vragen over Azure Synapse Analytics

In deze handleiding vindt u de veelgestelde vragen over Azure Synapse Analytics.

Algemeen

Hoe kan ik RBAC-rollen gebruiken om mijn werkruimte te beveiligen?

Azure Synapse introduceert een aantal rollen en scopes om deze toe te wijzen aan , zodat uw werkruimte eenvoudiger kan worden gebeveiligen.

Synapse RBAC-rollen:

  • Synapse-beheerder
  • Synapse SQL-beheerder
  • Synapse Spark-beheerder
  • Synapse-inzender (preview-versie)
  • Synapse-artefactuitgever (preview-versie)
  • Synapse-artefactgebruiker (preview-versie)
  • Synapse-compute-operator (preview-versie)
  • Synapse-referentiegebruiker (preview-versie)

Als u uw Synapse-werkruimte wilt beveiligen, wijst u de RBAC-rollen toe aan deze RBAC-bereiken:

  • Workspaces
  • Spark-pools
  • Integration Runtimes
  • Gekoppelde services
  • Referenties

Daarnaast beschikt u met toegewezen SQL-pools over alle beveiligingsfuncties die u kent en waardeert.

Hoe kan ik u toegewezen SQL, serverloze SQL en serverloze Spark-pools beheren?

Als uitgangspunt werkt Azure Synapse met de ingebouwde kostenanalyse en kostenwaarschuwingen die beschikbaar zijn op het niveau van het Azure-abonnement.

  • Toegewezen SQL-pools: u hebt rechtstreeks inzicht in de kosten en controle over de kosten, omdat u de grootte van toegewezen SQL-pools maakt en specificeert. U kunt verder zelf bepalen welke gebruikers toegewezen SQL-pools kunnen maken of schalen met Azure RBAC-rollen.

  • Serverloze SQL-pools: u hebt controle-en kostenbeheerinstellingen waarmee u op een dagelijks, wekelijks en maandelijks niveau uitgaven kunt limiteren. Zie Kostenbeheer voor serverloze SQL-pool voor meer informatie.

  • Serverloze Spark-pools: u kunt bepalen wie Spark-pools kan maken met Synapse RBAC-rollen.

Ondersteunt Synapse-werkruimte maporganisatie van objecten en granulariteit op ga?

Synapse-werkruimten ondersteunen door de gebruiker gedefinieerde mappen.

Kan ik meer dan één werkruimte Power BI aan één werkruimte Azure Synapse koppelen?

Op dit moment kunt u slechts één werkruimte Power BI koppelen aan een Azure Synapse werkruimte.

Synapse Link voor Apache Spark is ga. Synapse Link voor een serverloze SQL-pool bevindt zich in openbare preview.

Ondersteunt Azure Synapse werkruimte CI/CD?

Ja. Alle pijplijnartefacten, notebooks, SQL-scripts en Spark-taakdefinities bevinden zich in Git. Alle pooldefinities worden opgeslagen in Git als Azure Resource Manager (ARM)-sjablonen. Toegewezen SQL-poolobjecten (schema's, tabellen, weergaven, enzovoort) worden beheerd met databaseprojecten met CI/CD-ondersteuning.

Pipelines

Hoe kan ik ik weten welke referenties worden gebruikt om een pijplijn uit te voeren?

Elke activiteit in een Synapse-pijplijn wordt uitgevoerd met behulp van de referenties die zijn opgegeven in de gekoppelde service.

Worden SSIS-IR's ondersteund in Synapse Integrate?

Momenteel niet.

Hoe kan ik bestaande pijplijnen migreren van Azure Data Factory naar een Azure Synapse werkruimte?

Op dit moment moet u uw Azure Data Factory-pijplijnen en gerelateerde artefacten handmatig opnieuw maken door de JSON uit de oorspronkelijke pijplijn te exporteren en deze te importeren in uw Synapse-werkruimte.

Apache Spark

Wat is het verschil tussen Apache Spark synapse en Apache Spark?

Apache Spark voor Synapse is Apache Spark met extra ondersteuning voor integraties met andere services (AAD, AzureML, enzovoort) en aanvullende bibliotheken (mssparktunes,Mingmingbird) en vooraf afgestemde prestatieconfiguraties.

Elke workload die momenteel wordt uitgevoerd op Apache Spark, wordt zonder wijziging uitgevoerd op Apache Spark voor Azure Synapse.

Welke versies van Spark zijn beschikbaar?

Azure Synapse Apache Spark biedt volledige ondersteuning voor Spark 2.4. Raadpleeg Ondersteuning voor Apache Spark-versies voor een volledige lijst met kernonderdelen en de versie die momenteel wordt ondersteund.

Is er een equivalent van DButils in Azure Synapse Spark?

Ja, Azure Synapse Apache Spark biedt de bibliotheek mssparkutils. Zie Inleiding tot Microsoft Spark-hulpprogramma's voor volledige documentatie over het hulpprogramma.

Hoe kan ik sessieparameters instellen in Apache Spark?

Als u sessieparameters wilt instellen, gebruikt u %%configure magic available. De sessie moet opnieuw worden gestart om de parameters toe te passen.

Hoe kan ik parameters op clusterniveau instellen in een serverloze Spark-pool?

Als u parameters op clusterniveau wilt instellen, kunt u een spark.conf-bestand opgeven voor de Spark-pool. In deze pool worden vervolgens de parameters uit het configuratiebestand gebruikt.

Kan ik een Spark-cluster voor meerdere gebruikers uitvoeren in Azure Synapse Analytics?

Azure Synapse biedt speciaal gebouwde engines voor specifieke gebruiksgevallen. Apache Spark voor Synapse is ontworpen als taakservice en niet als clustermodel. Er zijn twee scenario's waarin mensen om een clustermodel met meerdere gebruikers vragen.

Scenario 1: veel gebruikers die toegang hebben tot een cluster om gegevens te verwerken voor BI-doeleinden.

De eenvoudigste manier om deze taak uit te voeren, is om de gegevens in Spark te zetten en vervolgens te profiteren van de verwerkingsmogelijkheden van Synapse SQL zodat ze Power BI kunnen verbinden met die gegevenssets.

Scenario 2: meerdere ontwikkelaars op één cluster om geld te besparen.

Voor dit scenario moet u elke ontwikkelaar een serverloze Spark-pool bieden die is ingesteld op het gebruik van een klein aantal Spark-resources. Aangezien serverloze Spark-Pools niets kosten totdat ze actief worden gebruikt, worden de kosten geminimaliseerd wanneer er meerdere ontwikkelaars zijn. De pools delen metagegevens (Spark-tabellen) zodat ze eenvoudig met elkaar kunnen samenwerken.

Hoe kan ik bibliotheken opnemen, beheren en installeren?

U kunt externe pakketten installeren via een requirements.txt-bestand tijdens het maken van de Spark-pool, vanuit de Synapse-werkruimte of vanuit de Azure Portal. Zie Bibliotheken beheren voor Apache Spark in Azure Synapse Analytics.

Toegewezen SQL-pools

Wat zijn de functionele verschillen tussen toegewezen SQL en serverloze pools?

U vindt een volledige lijst met verschillen in T-SQL functieverschillen in Synapse SQL.

Nu Azure Synapse is, hoe verplaats ik mijn toegewezen SQL pools die voorheen zelfstandig waren naar Azure Synapse?

Er is geen 'verplaatsen' of 'migratie'. U kunt ervoor kiezen om nieuwe werkruimtefuncties in te schakelen voor uw bestaande pools. Als u dit doet, zijn er geen wijzigingen die fouten veroorzaken en kunt u nieuwe functies gebruiken, zoals Synapse Studio, Spark en serverloze SQL-pools.

Wat is nu de standaardimplementatie van toegewezen SQL groepen?

Standaard worden alle nieuwe SQL-groepen geïmplementeerd in een werkruimte; Als dat nodig is, kunt u echter nog steeds een toegewezen SQL groep (voorheen SQL DW) maken in een zelfstandige vormfactor.

Netwerkbeveiliging

Hoe kan ik beveiligde toegang tot mijn Azure Synapse werkruimte?

Met of zonder een beheerd virtueel netwerkkunt u vanuit openbare netwerken verbinding maken met uw werkruimte. Zie Connectiviteitsgegevens voor Instellingen. Toegang vanuit openbare netwerken kan worden beheerd door de functie voor openbare netwerktoegang of de firewall van de werkruimte in te stellen. U kunt ook verbinding maken met uw werkruimte met behulp van een beheerd privé-eindpunt en Private Link. Synapse-werkruimten Azure Synapse Analytics beheerde Virtual Network niet de mogelijkheid om verbinding te maken via beheerde privé-eindpunten.