Hangfájlok megkeresése kötegelt átíráshoz
A batch-átírás nagy mennyiségű hang átírására szolgál a tárolóban. A Batch-átirat az Azure-on belülről vagy kívülről is elérheti a hangfájlokat.
Ha a forrásfájlokat az Azure-on kívül tárolják, azok nyilvános URI-n (például "https://crbn.us/hello.wav")" keresztül érhetők el. A fájloknak közvetlenül hozzáférhetőnek kell lenniük; Azok az URI-k, amelyek hitelesítést igényelnek, vagy amelyek interaktív szkripteket hívnak meg a fájl elérése előtt, nem támogatottak.
Az Azure Blob Storage-ban tárolt hangfájlok két módszer egyikével érhetők el:
Átirat létrehozásakor megadhat egy vagy több hangfájlt. Javasoljuk, hogy kérésenként több fájlt adjon meg, vagy mutasson egy Azure Blob Storage-tárolóra az átírandó hangfájlokkal. A kötegelt átírási szolgáltatás számos elküldött átiratot képes kezelni. A szolgáltatás egyszerre írja át a fájlokat, ami csökkenti az átfutási időt.
Támogatott hangformátumok és kodekek
A kötegelt átírási API számos különböző formátumot és kodeket támogat, például:
- WAV
- MP3
- OPUS/OGG
- FLAC
- WMA
- AAC
- ALAW a WAV-tárolóban
- MULAW a WAV-tárolóban
- AMR
- Webm
- M4A
- SP Enterprise kiadás X
Feljegyzés
A Batch átírási szolgáltatás integrálja a GStreamert, és több formátumot és kodeket is elfogadhat hibák visszaadása nélkül, míg javasoljuk, hogy használjon veszteségmentes formátumokat, például WAV -t (PCM-kódolást) és FLAC-t a legjobb átírási minőség biztosítása érdekében.
Azure Blob Storage feltöltése
Ha a hangfájlok egy Azure Blob Storage-fiókban találhatók, kérheti az egyes hangfájlok vagy egy teljes Azure Blob Storage-tároló átírását. Átírási eredményeket blobtárolóba is írhat.
Feljegyzés
A blob- és tárolókorlátokat a kötegelt átírási kvóták és korlátok című témakörben talál.
Ezeket a lépéseket követve hozzon létre egy tárfiókot, és töltsön fel wav fájlokat a helyi könyvtárból egy új tárolóba.
- Nyissa meg az Azure Portalt, és jelentkezzen be Azure-fiókjába.
- Hozzon létre egy Storage-fiókerőforrást az Azure Portalon. Használja ugyanazt az előfizetést és erőforráscsoportot, mint a Speech-erőforrás.
- Válassza ki a Tárfiókot.
- A bal oldali panel Adattároló csoportjában válassza a Tárolók lehetőséget.
- Válassza a + Tároló lehetőséget.
- Adja meg az új tároló nevét, és válassza a Létrehozás lehetőséget.
- Válassza ki az új tárolót.
- Válassza a Feltöltés lehetőséget.
- Válassza ki a feltölteni kívánt fájlokat, és válassza a Feltöltés lehetőséget.
Megbízható Azure-szolgáltatások biztonsági mechanizmusa
Ez a szakasz bemutatja, hogyan állíthatja be és korlátozhatja a kötegelt átírási forrás hangfájljaihoz való hozzáférést egy Azure Storage-fiókban a megbízható Azure-szolgáltatások biztonsági mechanizmusával.
Feljegyzés
A megbízható Azure-szolgáltatások biztonsági mechanizmusával az Azure Blob Storage használatával kell tárolnia a hangfájlokat. Az Azure Files használata nem támogatott.
Ha ebben a szakaszban minden műveletet végrehajt, a Tárfiók a következőképpen van konfigurálva:
- Az összes külső hálózati forgalomhoz való hozzáférés tilos.
- A Storage-fiókhoz való hozzáférés a Storage-fiókkulcs használatával tilos.
- A Tárfiók blobtárolójához való hozzáférés közös hozzáférésű jogosultságkódokkal (SAS) tilos.
- A kijelölt Speech-erőforráshoz való hozzáférés az erőforrásrendszer által hozzárendelt felügyelt identitással engedélyezett.
A Storage-fiók tehát gyakorlatilag teljesen "zárolva" lesz, és az új konfiguráció alkalmazásakor már meglévő hangfájlok átírásán kívül semmilyen forgatókönyvben nem használható. Ezt a konfigurációt érdemes modellként tekinteni a hangadatok biztonsága szempontjából, és az igényeinek megfelelően testre szabni.
Engedélyezheti például a kiválasztott nyilvános IP-címekről és Azure-beli virtuális hálózatokról érkező forgalmat. A Storage-fiókhoz való hozzáférést privát végpontok használatával is beállíthatja (lásd ezt az oktatóanyagot), újra engedélyezheti a hozzáférést a Storage-fiókkulcs használatával, engedélyezheti a hozzáférést más Megbízható Azure-szolgáltatásokhoz stb.
Feljegyzés
A tárfiók védelméhez nem szükséges privát végpontokat használni a Speechhez . A kötegelt átírási API-kérésekhez privát végpontot használhat, miközben külön-külön érheti el a forrás hangfájlokat egy biztonságos tárfiókból, vagy fordítva.
Az alábbi lépések végrehajtásával szigorúan korlátozhatja a tárfiókhoz való hozzáférést. Ezután hozzárendeli a Speech-erőforrás által felügyelt identitás minimálisan szükséges engedélyeit a Tárfiók eléréséhez.
Rendszer által hozzárendelt felügyelt identitás engedélyezése a Speech-erőforráshoz
Az alábbi lépéseket követve engedélyezheti a rendszer által hozzárendelt felügyelt identitást a kötegelt átíráshoz használt Speech-erőforráshoz.
Nyissa meg az Azure Portalt, és jelentkezzen be Azure-fiókjába.
Válassza ki a Speech erőforrást.
A bal oldali panel Erőforrás-kezelés csoportjában válassza az Identitás lehetőséget.
A rendszer által hozzárendelt lapon válassza a Be elemet az állapothoz.
Fontos
A felhasználó által hozzárendelt felügyelt identitás nem felel meg a kötegelt átírási tárfiók forgatókönyvére vonatkozó követelményeknek. Mindenképpen engedélyezze a rendszer által hozzárendelt felügyelt identitást.
Válassza a Mentés lehetőséget
Mostantól a Speech-erőforrás felügyelt identitása hozzáférést kaphat a tárfiókhoz.
A tárfiókhoz való hozzáférés korlátozása
A tárfiókhoz való hozzáférés korlátozásához kövesse az alábbi lépéseket.
Fontos
A tárfiók-hozzáférés zárolása előtt töltsön fel hangfájlokat egy Blob-tárolóba.
- Nyissa meg az Azure Portalt, és jelentkezzen be Azure-fiókjába.
- Válassza ki a Tárfiókot.
- A bal oldali panel Gépház csoportjában válassza a Konfiguráció lehetőséget.
- A Blob nyilvános hozzáférésének engedélyezése beállításnál válassza a Letiltva lehetőséget.
- A tárfiókkulcs-hozzáférés engedélyezése letiltva lehetőséget választva
- Válassza a Mentés lehetőséget.
További információ: A tárolókhoz és blobokhoz való névtelen nyilvános olvasási hozzáférés megakadályozása, valamint az Azure Storage-fiók megosztott kulcsának engedélyezése.
Azure Storage-tűzfal konfigurálása
Ha korlátozott hozzáféréssel rendelkezik a Tárfiókhoz, hozzáférést kell adnia bizonyos felügyelt identitásokhoz. A Speech-erőforráshoz való hozzáférés hozzáadásához kövesse az alábbi lépéseket.
Nyissa meg az Azure Portalt, és jelentkezzen be Azure-fiókjába.
Válassza ki a Tárfiókot.
A bal oldali panel Biztonság + hálózatkezelés csoportjában válassza a Hálózatkezelés lehetőséget.
A Tűzfalak és virtuális hálózatok lapon válassza az Engedélyezve lehetőséget a kiválasztott virtuális hálózatok és IP-címek közül.
Törölje az összes jelölőnégyzet kijelölését.
Győződjön meg arról, hogy a Microsoft hálózati útválasztása be van jelölve.
Az Erőforráspéldányok szakaszban válassza ki a Microsoft.CognitiveServices/accounts erőforrástípust, és válassza ki a Speech-erőforrást a példány neveként.
Válassza a Mentés parancsot.
Feljegyzés
A hálózati módosítások propagálása akár 5 percet is igénybe vehet.
Bár mostanra engedélyezett a hálózati hozzáférés, a Speech-erőforrás még nem fér hozzá a Storage-fiók adataihoz. Egy adott hozzáférési szerepkört kell hozzárendelnie a Speech-erőforrás által felügyelt identitáshoz.
Erőforrás-hozzáférési szerepkör hozzárendelése
Az alábbi lépéseket követve rendelje hozzá a Storage Blob Data Reader szerepkört a Speech-erőforrás felügyelt identitásához.
Fontos
A következő lépések végrehajtásához hozzá kell rendelnie a Tárfiók tulajdonosi szerepkörét vagy a nagyobb hatókört (például előfizetést). Ennek az az oka, hogy csak a Tulajdonos szerepkör tud szerepköröket hozzárendelni másokhoz. A részleteket itt találja.
Nyissa meg az Azure Portalt, és jelentkezzen be Azure-fiókjába.
Válassza ki a Tárfiókot.
A bal oldali panelen válassza a Hozzáférés-vezérlés (IAM) menüt.
Válassza a Szerepkör-hozzárendelés hozzáadása lehetőséget az erőforráscsempéhez való hozzáférés biztosítása területen.
Válassza a Storage Blob Data Reader lehetőséget a Szerepkör csoportban, majd válassza a Tovább lehetőséget.
Válassza a Felügyelt identitás lehetőséget a Tagok>hozzáférés hozzárendelése csoportban.
Rendelje hozzá a Speech-erőforrás felügyelt identitását, majd válassza a Véleményezés + hozzárendelés lehetőséget.
A beállítások megerősítése után válassza a Véleményezés + hozzárendelés lehetőséget
A Speech-erőforrás által felügyelt identitás most már hozzáfér a Storage-fiókhoz, és hozzáférhet a kötegelt átírás hangfájljaihoz.
A rendszer által hozzárendelt felügyelt identitással egyszerű tárfiók URL-címét használja (sas és egyéb kiegészítés nélkül), amikor kötegelt átírási kérelmet hoz létre. Példa:
{
"contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>"
}
Máskülönben egyedi fájlokat is megadhat a tárolóban. Példa:
{
"contentUrls": [
"https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>",
"https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>"
]
}
SAS URL-cím kötegelt átíráshoz
A közös hozzáférésű jogosultságkód (SAS) egy URI, amely korlátozott hozzáférést biztosít egy Azure Storage-tárolóhoz. Akkor használja, ha hozzáférést szeretne adni a kötegelt átírási fájlokhoz egy adott időtartományhoz a tárfiókkulcs megosztása nélkül.
Tipp.
Ha a kötegelt átírási forrásfájlokat tartalmazó tárolót csak a Speech-erőforrás érheti el, használja inkább a megbízható Azure-szolgáltatások biztonsági mechanizmusát .
Kövesse az alábbi lépéseket a kötegelt átírásokhoz használható SAS URL-cím létrehozásához.
Az Azure Blob Storage feltöltésének lépéseit elvégezve hozzon létre egy Tárfiókot, és töltsön fel hangfájlokat egy új tárolóba.
Válassza ki az új tárolót.
A bal oldali panel Gépház csoportjában válassza a Megosztott hozzáférési jogkivonatok lehetőséget.
Válassza a + Tároló lehetőséget.
Válassza az Olvasás és az Engedélyek listája lehetőséget.
Adja meg az SAS URI kezdő és lejárati idejét, vagy hagyja meg az alapértelmezett értékeket.
Válassza az SAS-jogkivonat és AZ URL-cím létrehozása lehetőséget.
Az SAS URL-címet akkor használja, amikor kötegelt átírási kérelmet hoz létre. Példa:
{
"contentContainerUrl": "https://<storage_account_name>.blob.core.windows.net/<container_name>?SAS_TOKEN"
}
Máskülönben egyedi fájlokat is megadhat a tárolóban. Minden fájlhoz más SAS URL-címet kell létrehoznia és használnia olvasási (r) engedélyekkel. Példa:
{
"contentUrls": [
"https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_1>?SAS_TOKEN_1",
"https://<storage_account_name>.blob.core.windows.net/<container_name>/<file_name_2>?SAS_TOKEN_2"
]
}