Introduktion
Med AI-talfunktioner kan vi hantera hem- och autosystem med röstinstruktioner, få svar från datorer för talade frågor, generera bildtext från ljud och mycket mer.
För att möjliggöra den här typen av interaktion måste AI-systemet stödja två funktioner:
- Taligenkänning – möjligheten att identifiera och tolka talade indata
- Talsyntes – förmågan att generera talade utdata
Azure AI Speech tillhandahåller tal till text och text till tal-funktioner genom taligenkänning och syntes. Du kan använda fördefinierade och anpassade Speech Service-modeller för en mängd olika uppgifter, från transkribering av ljud till text med hög noggrannhet, till att identifiera talare i konversationer, skapa anpassade röster med mera. Härnäst får du lära dig hur AI-talfunktioner fungerar.