Uitvoer van Azure Stream Analytics

Een Azure Stream Analytics-taak bestaat uit een invoer, query en een uitvoer. Er zijn verschillende uitvoertypen waarop u getransformeerde gegevens kunt verzenden. In dit artikel worden de ondersteunde Stream Analytics vermeld. Wanneer u uw query Stream Analytics, verwijst u naar de naam van de uitvoer met behulp van de INTO-component. U kunt één uitvoer per taak of meerdere uitvoer per streaming-taak gebruiken (indien nodig) door meerdere INTO-component toe te voegen aan de query.

Als u uitvoer van een taak wilt maken, Stream Analytics bewerken en testen, kunt u de Azure Portal , Azure PowerShell, .NET API, REST APIen Visual Studio.

Sommige typen uitvoer bieden ondersteuning voor partitioneringen de batchgrootten voor uitvoer variëren om de doorvoer te optimaliseren. De volgende tabel bevat functies die worden ondersteund voor elk uitvoertype:

Uitvoertype Partitionering Beveiliging
Azure Data Lake Storage Gen 1 Yes Azure Active Directory-gebruiker
, beheerde identiteit
Azure Database Explorer Yes Beheerde identiteit
Azure Database for PostgreSQL Yes Gebruikersnaam en wachtwoord auth
Azure SQL Database Ja, optioneel. SQL gebruikers auth,
Beheerde identiteit
Azure Synapse Analytics Yes SQL gebruikers auth,
Beheerde identiteit (preview)
Blob Storage en Azure Data Lake Gen 2 Yes Toegangssleutel,
Beheerde identiteit
Azure Event Hubs Ja, moet de kolom partitiesleutel instellen in de uitvoerconfiguratie. Toegangssleutel,
Beheerde identiteit
Power BI No Azure Active Directory gebruiker,
Beheerde identiteit
Azure Table storage Yes Accountsleutel
Azure Service Bus wachtrijen Yes Toegangssleutel
Azure Service Bus onderwerpen Yes Toegangssleutel
Azure Cosmos DB Yes Toegangssleutel
Azure Functions Yes Toegangssleutel

Partitionering

Stream Analytics ondersteunt partities voor alle uitvoer, met uitzondering van Power BI. Zie het artikel voor het specifieke uitvoertype waarin u geïnteresseerd bent voor meer informatie over partitiesleutels en het aantal uitvoerschrijvers. Alle uitvoerartikelen zijn gekoppeld in de vorige sectie.

Voor een geavanceerdere afstemming van de partities kan het aantal uitvoerschrijvers bovendien worden beheerd met behulp van een component (zie INTO ) in uw query, wat nuttig kan zijn bij het bereiken van een gewenste INTO <partition count> taaktopologie. Als uw uitvoeradapter niet is gepartitiefd, veroorzaakt een gebrek aan gegevens in één invoerpartitie een vertraging tot de tijd van de late aankomst. In dergelijke gevallen wordt de uitvoer samengevoegd met één schrijver, wat kan leiden tot knelpunten in uw pijplijn. Zie voor meer informatie over het beleid voor late aankomst Azure Stream Analytics overwegingen voor gebeurtenisorders.

Batchgrootte van uitvoer

Alle uitvoer biedt ondersteuning voor batching, maar slechts een aantal biedt expliciet ondersteuning voor batchgrootte. Azure Stream Analytics maakt gebruik van batches met variabele grootte om gebeurtenissen te verwerken en naar uitvoer te schrijven. Normaal gesproken Stream Analytics engine niet één bericht tegelijk schrijven en gebruikt batches voor efficiëntie. Wanneer de snelheid van zowel de binnenkomende als uitgaande gebeurtenissen hoog is, gebruikt Stream Analytics grotere batches. Wanneer de egressfrequentie laag is, worden kleinere batches gebruikt om de latentie laag te houden.

Eigenschappen van het Parquet-uitvoerbatchvenster

Wanneer u Azure Resource Manager sjabloonimplementatie of de REST API, zijn de twee eigenschappen van het batchvenster:

  1. timeWindow

    De maximale wachttijd per batch. De waarde moet een tekenreeks van Periode zijn. Bijvoorbeeld '00:02:00' voor twee minuten. Na deze tijd wordt de batch naar de uitvoer geschreven, zelfs als niet aan de minimumvereisten voor rijen wordt voldaan. De standaardwaarde is 1 minuut en het toegestane maximum is 2 uur. Als de blob-uitvoer een padpatroonfrequentie heeft, mag de wachttijd niet hoger zijn dan het tijdsbereik van de partitie.

  2. sizeWindow

    Het minimum aantal rijen per batch. Voor Parquet maakt elke batch een nieuw bestand. De huidige standaardwaarde is 2000 rijen en het toegestane maximum is 10.000 rijen.

Deze eigenschappen van batchvensters worden alleen ondersteund door API-versie 2017-04-01-preview. Hieronder vindt u een voorbeeld van de JSON-nettolading voor een REST API-aanroep:

"type": "stream",
      "serialization": {
        "type": "Parquet",
        "properties": {}
      },
      "timeWindow": "00:02:00",
      "sizeWindow": "2000",
      "datasource": {
        "type": "Microsoft.Storage/Blob",
        "properties": {
          "storageAccounts" : [
          {
            "accountName": "{accountName}",
            "accountKey": "{accountKey}",
          }
          ],

Volgende stappen