Configurar o armazenamento de dados da CLI de Fala

Artigo
01/23/2024

A CLI de Fala pode depender das definições nos arquivos de configuração, que podem ser referenciados usando um símbolo @. A CLI de Fala salva uma nova configuração em um novo subdiretório ./spx/data criado no diretório de trabalho atual para a CLI de Fala. A CLI de Fala primeiro procura um valor de configuração no diretório de trabalho atual, depois no armazenamento de dados em e em ./spx/dataoutros armazenamentos de dados, incluindo um armazenamento de dados final somente leitura no spx binário.

No início rápido da CLI de fala, você usou o armazenamento de dados para salvar seus @key valores e @region e, portanto, não era necessário especificá-los com cada spx comando. Tenha em mente que você pode usar arquivos de configuração para armazenar as próprias definições de configuração ou até mesmo usá-las para passar URLs ou outro conteúdo dinâmico gerado em runtime.

Para obter mais detalhes sobre arquivos do armazenamento de dados, incluindo o uso de arquivos de configuração padrão (@spx.default, @default.config e @*.default.config para configurações padrão específicas de comando), digite este comando:

spx help advanced setup

nodefaults

O exemplo a seguir limpa o arquivo de configuração @my.defaults, adiciona pares chave-valor para chave e região no arquivo e usa a configuração em uma chamada para spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Configuração dinâmica

Você também pode gravar o conteúdo dinâmico em um arquivo de configuração usando a opção --output.

Por exemplo, o comando a seguir cria um modelo de fala personalizada e armazena a URL do novo modelo em um arquivo de configuração. O próximo comando aguarda até que o modelo na URL esteja pronto para ser usado antes de retornar.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

O exemplo a seguir grava duas URLs no arquivo de configuração @my.datasets.txt. Nesse cenário, --output pode incluir uma palavra-chave adicionar opcional para criar um arquivo de configuração ou acrescentar à existente.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

Adicionar configuração do SPX

Para legibilidade, flexibilidade e conveniência, você pode usar uma configuração predefinida com opções de saída selecionadas.

Por exemplo, você pode ter os seguintes requisitos de legendagem:

Fazer o reconhecimento do arquivo de entrada caption.this.mp4.
Emitir legendas WebVTT e SRT para os arquivos caption.vtt e caption.srt, respectivamente.
Emitir o offset, duration, resultid e text de cada evento de reconhecimento para o arquivo each.result.tsv.

Você pode criar uma configuração predefinida chamada @caption.defaults conforme é mostrado aqui:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

As configurações são salvas no diretório atual em um arquivo chamado caption.defaults. Este é o conteúdo do arquivo:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Depois, para gerar legendas, você pode executar este comando que importa as configurações da configuração predefinida @caption.defaults:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

O uso da configuração predefinida, como já mostrado, é semelhante à execução do seguinte comando:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Próximas etapas

Operações em lote com a CLI de Fala

Configurar o armazenamento de dados da CLI de Fala

nodefaults

Configuração dinâmica

Adicionar configuração do SPX

Próximas etapas

Recursos adicionais