Individuare i file audio per la trascrizione batch

La trascrizione batch viene usata per trascrivere una grande quantità di audio nell'archiviazione. La trascrizione batch può accedere ai file audio dall'interno o dall'esterno di Azure.

Quando i file audio di origine vengono archiviati all'esterno di Azure, è possibile accedervi tramite un URI pubblico, ad esempio "https://crbn.us/hello.wav"). I file devono essere accessibili direttamente; Gli URI che richiedono l'autenticazione o che richiamano script interattivi prima di poter accedere al file non sono supportati.

È possibile accedere ai file audio archiviati nell'archiviazione BLOB di Azure tramite uno dei due metodi seguenti:

È possibile specificare uno o più file audio durante la creazione di una trascrizione. È consigliabile fornire più file per richiesta o puntare a un contenitore di archiviazione BLOB di Azure con i file audio da trascrivere. Il servizio di trascrizione batch può gestire un numero elevato di trascrizioni inviate. Il servizio trascrive i file simultaneamente, il che riduce il tempo di risoluzione.

Formati audio e codec supportati

L'API di trascrizione batch supporta molti formati e codec diversi, ad esempio:

  • WAV
  • MP3
  • OPUS/OGG
  • FLAC
  • WMA
  • AAC
  • ALAW nel contenitore WAV
  • MULAW nel contenitore WAV
  • AMR
  • Webm
  • M4A
  • SP edizione Enterprise X

Nota

Il servizio di trascrizione batch integra GStreamer e può accettare più formati e codec senza restituire errori, mentre è consigliabile usare formati senza perdita come WAV (codifica PCM) e FLAC per garantire una migliore qualità di trascrizione.

Archiviazione BLOB di Azure caricamento

Quando i file audio si trovano in un account Archiviazione BLOB di Azure, è possibile richiedere la trascrizione di singoli file audio o di un intero contenitore Archiviazione BLOB di Azure. È anche possibile scrivere risultati di trascrizione in un contenitore BLOB.

Nota

Per i limiti di BLOB e contenitori, vedere Quote e limiti di trascrizione batch.

Seguire questa procedura per creare un account di archiviazione e caricare i file wav dalla directory locale in un nuovo contenitore.

  1. Passare al portale di Azure e accedere all'account Azure.
  2. Creare una risorsa account Archiviazione nel portale di Azure. Usare la stessa sottoscrizione e il gruppo di risorse della risorsa Voce.
  3. Selezionare l'account Archiviazione.
  4. Nel gruppo Archiviazione dati nel riquadro sinistro selezionare Contenitori.
  5. Selezionare + Contenitore.
  6. Immettere un nome per il nuovo contenitore e selezionare Crea.
  7. Selezionare il nuovo contenitore.
  8. Selezionare Carica.
  9. Scegliere i file da caricare e selezionare Carica.

Meccanismo di sicurezza dei servizi di Azure attendibili

Questa sezione illustra come configurare e limitare l'accesso ai file audio di origine della trascrizione batch in un account Archiviazione di Azure usando il meccanismo di sicurezza dei servizi di Azure attendibili.

Nota

Con il meccanismo di sicurezza dei servizi di Azure attendibili, è necessario usare l'archiviazione BLOB di Azure per archiviare i file audio. L'utilizzo di File di Azure non è supportato.

Se si eseguono tutte le azioni in questa sezione, l'account Archiviazione viene configurato come segue:

  • L'accesso a tutto il traffico di rete esterno non è consentito.
  • L'accesso all'account di Archiviazione usando Archiviazione chiave dell'account non è consentito.
  • L'accesso all'archiviazione BLOB dell'account Archiviazione tramite firme di accesso condiviso (SAS) non è consentito.
  • L'accesso alla risorsa voce selezionata è consentito usando l'identità gestita assegnata dal sistema di risorse.

Di conseguenza, l'account Archiviazione diventa completamente "bloccato" e non può essere usato in alcun scenario a parte la trascrizione di file audio già presenti al momento dell'applicazione della nuova configurazione. È consigliabile considerare questa configurazione come modello per quanto riguarda la sicurezza dei dati audio e personalizzarla in base alle esigenze.

Ad esempio, è possibile consentire il traffico da indirizzi IP pubblici selezionati e reti virtuali di Azure. È anche possibile configurare l'accesso all'account Archiviazione usando endpoint privati (vedere anche questa esercitazione), riabilitare l'accesso usando Archiviazione chiave dell'account, consentire l'accesso ad altri servizi attendibili di Azure e così via.

Nota

L'uso di endpoint privati per Il riconoscimento vocale non è necessario per proteggere l'account di archiviazione. È possibile usare un endpoint privato per le richieste api di trascrizione batch, mentre si accede separatamente ai file audio di origine da un account di archiviazione sicuro o viceversa.

Seguendo la procedura seguente, si limita notevolmente l'accesso all'account di archiviazione. Assegnare quindi le autorizzazioni minime necessarie per l'identità gestita delle risorse voce per accedere all'account Archiviazione.

Abilitare l'identità gestita assegnata dal sistema per la risorsa Voce

Seguire questa procedura per abilitare l'identità gestita assegnata dal sistema per la risorsa Voce usata per la trascrizione batch.

  1. Passare al portale di Azure e accedere all'account Azure.

  2. Selezionare la risorsa Voce.

  3. Nel gruppo Gestione risorse nel riquadro sinistro selezionare Identità.

  4. Nella scheda Assegnata dal sistema selezionare per lo stato.

    Importante

    L'identità gestita assegnata dall'utente non soddisfa i requisiti per lo scenario dell'account di archiviazione della trascrizione batch. Assicurarsi di abilitare l'identità gestita assegnata dal sistema.

  5. Seleziona Salva

Ora l'identità gestita per la risorsa Voce può essere concessa all'account di archiviazione.

Limitare l'accesso all'account di archiviazione

Seguire questa procedura per limitare l'accesso all'account di archiviazione.

Importante

Caricare file audio in un contenitore BLOB prima di bloccare l'accesso all'account di archiviazione.

  1. Passare al portale di Azure e accedere all'account Azure.
  2. Selezionare l'account Archiviazione.
  3. Nel gruppo Impostazioni nel riquadro sinistro selezionare Configurazione.
  4. Selezionare Disabilitato per Consenti l'accesso pubblico al BLOB.
  5. Selezionare Disabilitato per Consenti l'accesso alla chiave dell'account di archiviazione
  6. Seleziona Salva.

Per altre informazioni, vedere Impedire l'accesso in lettura pubblico anonimo a contenitori e BLOB e Impedire l'autorizzazione con chiave condivisa per un account Archiviazione di Azure.

Configurare Archiviazione di Azure firewall

Avere accesso limitato all'account Archiviazione, è necessario concedere l'accesso a identità gestite specifiche. Seguire questa procedura per aggiungere l'accesso per la risorsa Voce.

  1. Passare al portale di Azure e accedere all'account Azure.

  2. Selezionare l'account Archiviazione.

  3. Nel gruppo Sicurezza e rete nel riquadro sinistro selezionare Rete.

  4. Nella scheda Firewall e reti virtuali selezionare Abilitato nelle reti virtuali e negli indirizzi IP selezionati.

  5. Deselezionare tutte le caselle di controllo.

  6. Assicurarsi che sia selezionato Il routing di rete Microsoft.

  7. Nella sezione Istanze di risorse selezionare Microsoft.CognitiveServices/accounts come tipo di risorsa e selezionare la risorsa Voce come nome dell'istanza.

  8. Seleziona Salva.

    Nota

    La propagazione delle modifiche di rete potrebbe richiedere fino a 5 minuti.

Anche se ora l'accesso alla rete è consentito, la risorsa Voce non può ancora accedere ai dati nell'account Archiviazione. È necessario assegnare un ruolo di accesso specifico per l'identità gestita delle risorse voce.

Assegnare il ruolo di accesso alle risorse

Seguire questa procedura per assegnare il ruolo lettore di dati BLOB Archiviazione all'identità gestita della risorsa Voce.

Importante

Per eseguire l'operazione nei passaggi successivi, è necessario assegnare il ruolo Proprietario dell'account Archiviazione o un ambito superiore , ad esempio Sottoscrizione. Ciò è dovuto al fatto che solo il ruolo Proprietario può assegnare ruoli ad altri utenti. Vedere i dettagli qui.

  1. Passare al portale di Azure e accedere all'account Azure.

  2. Selezionare l'account Archiviazione.

  3. Selezionare Controllo di accesso menu (IAM) nel riquadro sinistro.

  4. Selezionare Aggiungi assegnazione di ruolo nel riquadro Concedi accesso a questa risorsa .

  5. Selezionare Archiviazione lettore di dati BLOB in Ruolo e quindi selezionare Avanti.

  6. Selezionare Identità gestita in Membri>Assegnare l'accesso.

  7. Assegnare l'identità gestita della risorsa Voce e quindi selezionare Rivedi e assegna.

    Screenshot of the managed role assignment review.

  8. Dopo aver confermato le impostazioni, selezionare Rivedi e assegna

Ora l'identità gestita della risorsa Voce ha accesso all'account Archiviazione e può accedere ai file audio per la trascrizione batch.

Con l'identità gestita assegnata dal sistema, si usa un URL dell'account Archiviazione normale (senza firma di accesso condiviso o altre aggiunte) quando si crea una richiesta di trascrizione batch. Ad esempio:

{
    "contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>"
}

In caso contrario, è possibile specificare singoli file nel contenitore. Ad esempio:

{
    "contentUrls": [
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>",
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>"
    ]
}

URL di firma di accesso condiviso per la trascrizione batch

Una firma di accesso condiviso è un URI che concede l'accesso limitato a un contenitore di Archiviazione di Azure. Usarlo quando si vuole concedere l'accesso ai file di trascrizione batch per un intervallo di tempo specifico senza condividere la chiave dell'account di archiviazione.

Suggerimento

Se il contenitore con file di origine della trascrizione batch deve essere accessibile solo dalla risorsa Voce, usare invece il meccanismo di sicurezza dei servizi di Azure attendibili.

Seguire questa procedura per generare un URL di firma di accesso condiviso che è possibile usare per le trascrizioni batch.

  1. Completare i passaggi in Archiviazione BLOB di Azure caricamento per creare un account Archiviazione e caricare file audio in un nuovo contenitore.

  2. Selezionare il nuovo contenitore.

  3. Nel gruppo Impostazioni nel riquadro sinistro selezionare Token di accesso condiviso.

  4. Selezionare + Contenitore.

  5. Selezionare Lettura ed Elenco per Autorizzazioni.

    Screenshot of the container SAS URI permissions.

  6. Immettere le ore di inizio e di scadenza per l'URI di firma di accesso condiviso o lasciare le impostazioni predefinite.

  7. Selezionare Genera URL e token SAS.

L'URL di firma di accesso condiviso viene usato quando si crea una richiesta di trascrizione batch. Ad esempio:

{
    "contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>?SAS_TOKEN"
}

In caso contrario, è possibile specificare singoli file nel contenitore. È necessario generare e usare un URL di firma di accesso condiviso diverso con autorizzazioni di lettura (r) per ogni file. Ad esempio:

{
    "contentUrls": [
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>?SAS_TOKEN_1",
        "https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>?SAS_TOKEN_2"
    ]
}

Passaggi successivi