Azure Synapse Analytics vanliga frågor och svar

I den här guiden hittar du de vanligaste frågorna om Azure Synapse Analytics.

Allmänt

Hur kan jag använda RBAC-roller för att skydda min arbetsyta?

Azure Synapse introducerar ett antal roller och omfång för att tilldela dem för som gör det enklare att skydda din arbetsyta.

Synapse RBAC-roller:

  • Synapse-administratör
  • Synapse SQL Administratör
  • Synapse Spark-administratör
  • Synapse-deltagare (förhandsversion)
  • Synapse Artifact Publisher (förhandsversion)
  • Synapse Artifact-användare (förhandsversion)
  • Synapse Compute Operator (förhandsversion)
  • Synapse-autentiseringsanvändare (förhandsversion)

För att skydda synapse-arbetsytan tilldelar du RBAC-roller till dessa RBAC-omfång:

  • Arbetsytor
  • Spark-pooler
  • Integreringskörningar
  • Länkade tjänster
  • Autentiseringsuppgifter

Med dedikerade SQL har du dessutom samma säkerhetsfunktioner som du känner till och gillar.

Hur gör jag för att du dedikerade SQL, serverlösa SQL och serverlösa Spark-pooler?

Som utgångspunkt kan du Azure Synapse med den inbyggda kostnadsanalysen och kostnadsaviseringarna som är tillgängliga på Azure-prenumerationsnivå.

  • Dedikerade SQL-pooler – du har direkt insyn i kostnaden och kontrollen över kostnaden, eftersom du skapar och anger storlekarna för dedikerade SQL pooler. Du kan ytterligare styra vilka användare som kan skapa eller skala dedikerade SQL med Azure RBAC-roller.

  • Serverlösa SQL pooler – du har övervaknings- och kostnadshanteringskontroller som gör att du kan minska utgifterna på en daglig, veckovis och månatlig nivå. Mer information finns i Kostnadshantering för SQL serverlös serverpool.

  • Serverlösa Spark-pooler – du kan begränsa vem som kan skapa Spark-pooler med Synapse RBAC-roller.

Kommer Synapse-arbetsytan att stödja mapporganisation av objekt och kornighet vid GA?

Synapse-arbetsytor stöder användardefinierade mappar.

Kan jag länka fler än en Power BI arbetsyta till en enda Azure Synapse arbetsyta?

För närvarande kan du bara länka en enskild Power BI arbetsyta till en Azure Synapse arbetsyta.

Synapse Link för Apache Spark är GA. Synapse Link för serverlös SQL är i offentlig förhandsversion.

Stöder Azure Synapse CI/CD för arbetsytan?

Ja! Alla Pipeline-artefakter, notebook-SQL-skript och Spark-jobbdefinitioner kommer att finnas i Git. Alla pooldefinitioner kommer att lagras i Git Azure Resource Manager ARM-mallar. Dedikerade SQL -poolobjekt (scheman, tabeller, vyer osv.) hanteras med databasprojekt med CI/CD-stöd.

Pipelines

Hur gör jag för att att jag vet vilka autentiseringsuppgifter som används för att köra en pipeline?

Varje aktivitet i en Synapse-pipeline körs med de autentiseringsuppgifter som anges i den länkade tjänsten.

Stöds SSIS IR i Synapse Integrate?

Inte just nu.

Hur gör jag för att migrera befintliga pipelines från Azure Data Factory till en Azure Synapse arbetsyta?

Just nu måste du manuellt återskapa dina Azure Data Factory-pipelines och relaterade artefakter genom att exportera JSON från den ursprungliga pipelinen och importera den till Synapse-arbetsytan.

Apache Spark

Vad är skillnaden mellan Apache Spark synapse och Apache Spark?

Apache Spark för Synapse Apache Spark med ytterligare stöd för integreringar med andra tjänster (AAD, AzureML osv.) och ytterligare bibliotek (mssparktuils,Mingbird) och förkonfigurerade prestandakonfigurationer.

Alla arbetsbelastningar som körs på Apache Spark körs på Apache Spark för Azure Synapse utan ändringar.

Vilka versioner av Spark är tillgängliga?

Azure Synapse Apache Spark har fullständigt stöd för Spark 2.4. En fullständig lista över huvudkomponenter och den version som stöds för närvarande finns i Apache Spark versionsstöd.

Finns det en motsvarighet till DButils i Azure Synapse Spark?

Ja, Azure Synapse Apache Spark innehåller mssparkutils-biblioteket. Fullständig dokumentation om verktyget finns i Introduktion till Microsoft Spark-verktyg.

Hur gör jag för att ange sessionsparametrar i Apache Spark?

Om du vill ange sessionsparametrar använder du %%configure magic available. En sessionsstart krävs för att parametrarna ska börja gälla.

Hur gör jag för att ange parametrar på klusternivå i en serverlös Spark-pool?

Om du vill ange parametrar på klusternivå kan du ange en spark.conf-fil för Spark-poolen. Den här poolen respekterar sedan parametrarna som är förbi i konfigurationsfilen.

Kan jag köra ett Spark-kluster för flera användare i Azure Synapse Analytics?

Azure Synapse tillhandahåller specialbyggda motorer för specifika användningsfall. Apache Spark för Synapse är utformat som en jobbtjänst och inte en klustermodell. Det finns två scenarier där man frågar efter en klustermodell med flera användare.

Scenario #1: Många användare som har åtkomst till ett kluster för att betjäna data i BI-syften.

Det enklaste sättet att utföra den här uppgiften är att lagar data med Spark och sedan dra nytta av funktionerna i Synapse SQL att de kan ansluta Power BI till dessa datauppsättningar.

Scenario #2: Att ha flera utvecklare i ett enda kluster för att spara pengar.

För att uppfylla det här scenariot bör du ge varje utvecklare en serverlös Spark-pool som är inställd på att använda ett litet antal Spark-resurser. Eftersom serverlösa Spark-pooler inte kostar något, förrän de används aktivt minimerar kostnaden när det finns flera utvecklare. Poolerna delar metadata (Spark-tabeller) så att de enkelt kan fungera med varandra.

Hur gör jag för att inkludera, hantera och installera bibliotek?

Du kan installera externa paket via en requirements.txt när du skapar Spark-poolen, från Synapse-arbetsytan eller från Azure Portal. Se Hantera bibliotek för Apache Spark i Azure Synapse Analytics.

Dedikerade SQL pooler

Vilka är de funktionella skillnaderna mellan dedikerade SQL och serverlösa pooler?

Du hittar en fullständig lista över skillnader i T-SQL funktionsskillnader i Synapse SQL.

Nu när Azure Synapse är GA, hur flyttar jag mina dedikerade SQL-pooler som tidigare var fristående till Azure Synapse?

Det finns ingen "flytt" eller "migrering". Du kan välja att aktivera nya arbetsytefunktioner i dina befintliga pooler. Om du gör det finns det inga större ändringar. I stället kommer du att kunna använda nya funktioner som Synapse Studio, Spark och serverlösa SQL pooler.

Vad är standarddistributionen av dedikerade SQL pooler nu?

Som standard distribueras alla nya dedikerade SQL-pooler till en arbetsyta. Men om du behöver kan du fortfarande skapa en dedikerad SQL (tidigare SQL DW) i en fristående formfaktor.

Nätverkssäkerhet

Hur gör jag för att säker åtkomst till min Azure Synapse arbetsyta?

Med eller utan ett hanterat virtuelltnätverk kan du ansluta till din arbetsyta från offentliga nätverk. Mer information finns i Connectivity Inställningar. Åtkomst från offentliga nätverk kan styras genom att aktivera funktionen för offentlig nätverksåtkomst eller arbetsytans brandvägg. Du kan också ansluta till din arbetsyta med hjälp av en hanterad privat slutpunkt och Private Link. Synapse-arbetsytor utan Azure Synapse Analytics Managed Virtual Network kan inte ansluta via hanterade privata slutpunkter.