Kontroll av taligenkänning

Slutförd

Liksom talsyntes har taligenkänning utvecklats mycket sedan det först uppfanns. Det kan vara ett användbart verktyg för skapandet av en tillgänglig upplevelse, även om det fortfarande inte är perfekt.

I kommande lektioner lär du dig följande:

  • Att den allmänna Windows-taligenkänningen är inriktad på diktering. Den fungerar men är långsam när du vill ange beräkningar.
  • Att en specifik instans av ett röstigenkänningssystem kan tolka inmatning som låter naturlig.
  • Att röstkontroll är roligt och användbart.
  • Att sammanhang är rent nödvändiga för taligenkänning. Ord som "hjul" och "jul" har samma uttal, och det är bara sammanhanget som skiljer dem åt.
  • Att vissa behörigheter behövs innan röstigenkänning kan aktiveras.

Taligenkänning

Se till att ha ett headset med både mikrofon och högtalare anslutna till utvecklingsdatorn. Det är svårt att testa taligenkänning utan tal som ska kännas igen.

Standardverktyget för taligenkänning i Windows

Vi provar att se hur taligenkänningsverktyget i Windows fungerar med vår kalkylator utan att göra fler ändringar i koden.

  1. I Windows-sökfältet skriver du "taligenkänning". Välj Starta taligenkänning i det fönster som visas. Du bör se den lilla bilden som visas när taligenkänningssystemet är på eller av. Välj mikrofonikonen så att texten Lyssnar visas.

Windows is listening.

  1. Kör kalkylatorn, kontrollera att den är i fokus och prova att tala in en beräkning. Lägg märke till att siffror måste anges en i taget. 741 kan inte talas in som "sjuhundrafyrtioett", utan måste sägas som "sju", paus, "fyra", paus, "ett". Säg "times two" (gånger två) och sedan "equals" (är lika med) för att beräkna resultatet.

  2. Försök att tala ett decimaltal: "3,14". Lägg märke till att du måste tala in siffrorna långsamt och att "point" (komma) korrekt visar decimaltecknet.

  3. Igenkänningssystemet känner till de AutomationProperties.Name-poster som du angav tidigare. Du kan säga "Sine" (sinus) för att utlösa knappen Sin, "to the power of" (upphöjt till) för att utlösa knappen ^ och så vidare.

  4. Prova att spara siffror till kalkylatorns minne (observera att detta bara är tillgängligt när displayen endast innehåller ett tal). Prova att aktivera och inaktivera växlarna genom att tala in rubriktexten.

  5. Du anger konstanter genom att först säga "Show constants" (Visa konstanter). Välj sedan valfri konstant och lägg till den i beräkningen genom att säga "double-click" (dubbelklicka) före ord som tydligt identifierar konstanten. Prova till exempel "double-click feet to meters" (dubbelklicka fot till meter) så bör konstantvärdet (0,3048) läggas till i beräkningen. Ibland måste du säga saker flera gånger för att de ska kännas igen!

Kommentar

Om taligenkänningen inte är säker på vilken knapp du avsåg men det finns en nära matchning med två eller fler markerar den dessa knappar med ett associerat tal och ger dig alternativet att säga ett av de två talen följt av "OK".

När du experimenterar med den standardmässiga taligenkänningen ser du vilka fördelar och nackdelar den har. För vissa appar kan detta vara allt som krävs eller önskas. Men för en kalkylator säger du kanske en hel mening utan pauser, till exempel "vad är fyrahundrafemtiofyra delat med arccosinus av noll komma sex sex". Det här matchar förstås inte enskilda knappar, och därför kan vi inte förvänta oss att standardsystemet för igenkänning i Windows klarar av det. Om vi vill förbättra den här upplevelsen måste vi göra något mer avancerat.