Uitvoer van Azure Stream Analytics
Een Azure Stream Analytics-taak bestaat uit een invoer, query en een uitvoer. Er zijn verschillende uitvoertypen waarop u getransformeerde gegevens kunt verzenden. In dit artikel worden de ondersteunde Stream Analytics vermeld. Wanneer u uw query Stream Analytics, verwijst u naar de naam van de uitvoer met behulp van de INTO-component. U kunt één uitvoer per taak of meerdere uitvoer per streaming-taak gebruiken (indien nodig) door meerdere INTO-component toe te voegen aan de query.
Als u uitvoer van een taak wilt maken, Stream Analytics bewerken en testen, kunt u de Azure Portal , Azure PowerShell, .NET API, REST APIen Visual Studio.
Sommige typen uitvoer bieden ondersteuning voor partitioneringen de batchgrootten voor uitvoer variëren om de doorvoer te optimaliseren. De volgende tabel bevat functies die worden ondersteund voor elk uitvoertype:
| Uitvoertype | Partitionering | Beveiliging |
|---|---|---|
| Azure Data Lake Storage Gen 1 | Yes | Azure Active Directory-gebruiker , beheerde identiteit |
| Azure Database Explorer | Yes | Beheerde identiteit |
| Azure Database for PostgreSQL | Yes | Gebruikersnaam en wachtwoord auth |
| Azure SQL Database | Ja, optioneel. | SQL gebruikers auth, Beheerde identiteit |
| Azure Synapse Analytics | Yes | SQL gebruikers auth, Beheerde identiteit (preview) |
| Blob Storage en Azure Data Lake Gen 2 | Yes | Toegangssleutel, Beheerde identiteit |
| Azure Event Hubs | Ja, moet de kolom partitiesleutel instellen in de uitvoerconfiguratie. | Toegangssleutel, Beheerde identiteit |
| Power BI | No | Azure Active Directory gebruiker, Beheerde identiteit |
| Azure Table storage | Yes | Accountsleutel |
| Azure Service Bus wachtrijen | Yes | Toegangssleutel |
| Azure Service Bus onderwerpen | Yes | Toegangssleutel |
| Azure Cosmos DB | Yes | Toegangssleutel |
| Azure Functions | Yes | Toegangssleutel |
Partitionering
Stream Analytics ondersteunt partities voor alle uitvoer, met uitzondering van Power BI. Zie het artikel voor het specifieke uitvoertype waarin u geïnteresseerd bent voor meer informatie over partitiesleutels en het aantal uitvoerschrijvers. Alle uitvoerartikelen zijn gekoppeld in de vorige sectie.
Voor een geavanceerdere afstemming van de partities kan het aantal uitvoerschrijvers bovendien worden beheerd met behulp van een component (zie INTO ) in uw query, wat nuttig kan zijn bij het bereiken van een gewenste INTO <partition count> taaktopologie. Als uw uitvoeradapter niet is gepartitiefd, veroorzaakt een gebrek aan gegevens in één invoerpartitie een vertraging tot de tijd van de late aankomst. In dergelijke gevallen wordt de uitvoer samengevoegd met één schrijver, wat kan leiden tot knelpunten in uw pijplijn. Zie voor meer informatie over het beleid voor late aankomst Azure Stream Analytics overwegingen voor gebeurtenisorders.
Batchgrootte van uitvoer
Alle uitvoer biedt ondersteuning voor batching, maar slechts een aantal biedt expliciet ondersteuning voor batchgrootte. Azure Stream Analytics maakt gebruik van batches met variabele grootte om gebeurtenissen te verwerken en naar uitvoer te schrijven. Normaal gesproken Stream Analytics engine niet één bericht tegelijk schrijven en gebruikt batches voor efficiëntie. Wanneer de snelheid van zowel de binnenkomende als uitgaande gebeurtenissen hoog is, gebruikt Stream Analytics grotere batches. Wanneer de egressfrequentie laag is, worden kleinere batches gebruikt om de latentie laag te houden.
Eigenschappen van het Parquet-uitvoerbatchvenster
Wanneer u Azure Resource Manager sjabloonimplementatie of de REST API, zijn de twee eigenschappen van het batchvenster:
timeWindow
De maximale wachttijd per batch. De waarde moet een tekenreeks van Periode zijn. Bijvoorbeeld '00:02:00' voor twee minuten. Na deze tijd wordt de batch naar de uitvoer geschreven, zelfs als niet aan de minimumvereisten voor rijen wordt voldaan. De standaardwaarde is 1 minuut en het toegestane maximum is 2 uur. Als de blob-uitvoer een padpatroonfrequentie heeft, mag de wachttijd niet hoger zijn dan het tijdsbereik van de partitie.
sizeWindow
Het minimum aantal rijen per batch. Voor Parquet maakt elke batch een nieuw bestand. De huidige standaardwaarde is 2000 rijen en het toegestane maximum is 10.000 rijen.
Deze eigenschappen van batchvensters worden alleen ondersteund door API-versie 2017-04-01-preview. Hieronder vindt u een voorbeeld van de JSON-nettolading voor een REST API-aanroep:
"type": "stream",
"serialization": {
"type": "Parquet",
"properties": {}
},
"timeWindow": "00:02:00",
"sizeWindow": "2000",
"datasource": {
"type": "Microsoft.Storage/Blob",
"properties": {
"storageAccounts" : [
{
"accountName": "{accountName}",
"accountKey": "{accountKey}",
}
],