Rövid útmutató: Buildelés, közzététel és fordítás egyéni modellekkel
A Translator egy felhőalapú neurális gépi fordítási szolgáltatás, amely a REST API Azure AI-szolgáltatáscsaládjának része, amely bármilyen operációs rendszerrel használható. A Translator számos Microsoft-terméket és -szolgáltatást működtet világszerte, amelyeket több ezer vállalkozás használ a nyelvfordítás és más nyelvi műveletek elvégzéséhez. Ebből a rövid útmutatóból megtudhatja, hogyan hozhat létre egyéni megoldásokat alkalmazásaihoz az összes támogatott nyelven.
Előfeltételek
A Custom Translator portál használatához a következő erőforrásokra van szüksége:
Egy Microsoft-fiók.
Azure-előfizetés – Ingyenes létrehozás
Miután rendelkezik Azure-előfizetéssel, hozzon létre egy Translator-erőforrást a Azure Portal a kulcs és a végpont lekéréséhez. Az üzembe helyezés után válassza az Erőforrás megnyitása lehetőséget.
Az alkalmazás a Translator szolgáltatáshoz való csatlakoztatásához szüksége lesz az erőforrás kulcsára és végpontjára. Illessze be a kulcsot és a végpontot a kódba a rövid útmutató későbbi részében. Ezeket az értékeket a Azure Portal Kulcsok és végpont lapon találja:
További információ :Translator-erőforrás létrehozása.
Custom Translator portál
A fenti előfeltételek teljesülése után jelentkezzen be a Custom Translator portálra munkaterületek létrehozásához, projektek létrehozásához, fájlok feltöltéséhez, modellek betanítása és az egyéni megoldás közzétételéhez.
Az Azure AI technikai blogjában áttekintheti a fordítást és az egyéni fordítást, megismerhet néhány tippet, és watch egy első lépéseket ismertető videót.
Folyamat összefoglalása
Hozzon létre egy munkaterületet. A munkaterület az egyéni fordítási rendszer írására és létrehozására szolgáló munkaterület. A munkaterületek több projektet, modellt és dokumentumot is tartalmazhatnak. A Custom Translatorben végzett összes munka egy adott munkaterületen belül történik.
Hozzon létre egy projektet. A projektek modellek, dokumentumok és tesztek burkolói. Minden projekt tartalmazza az összes olyan dokumentumot, amely a megfelelő nyelvi párral van feltöltve a munkaterületre. Ha például egy angol–spanyol és egy spanyol–angol projekt is van, akkor mindkét projekt ugyanazokat a dokumentumokat tartalmazza.
Párhuzamos dokumentumok feltöltése. A párhuzamos dokumentumok olyan dokumentumpárok, amelyekben az egyik (cél) a másik fordítása (forrás). A pár egyik dokumentuma a forrásnyelven lévő mondatokat, a másik pedig a célnyelvre lefordított mondatokat tartalmazza. Nem számít, hogy melyik nyelv "forrásként" van megjelölve, és melyik nyelv "célként" van megjelölve – a párhuzamos dokumentumokkal bármelyik irányba betanítást végezheti a fordítási rendszer.
A modell betanítása. A modell az a rendszer, amely fordítást biztosít egy adott nyelvpárhoz. A sikeres betanítás eredménye egy modell. Modell betanításakor három egymást kölcsönösen kizáró dokumentumtípus szükséges: betanítás, finomhangolás és tesztelés. Ha csak betanítási adatok állnak rendelkezésre egy betanítás várólistára helyezésekor, a Custom Translator automatikusan összeállítja a hangolási és tesztelési adatokat. A betanítási dokumentumokban lévő mondatok véletlenszerű részhalmazát használja, és kizárja ezeket a mondatokat magából a betanítási adatokból. A modell betanítása minimális követelménye a 10 000 párhuzamos mondat.
Tesztelje (emberi értékelés) a modellt. A tesztelési készlet a BLEU-pontszám kiszámítására szolgál. Ez a pontszám a fordítási rendszer minőségét jelzi.
Tegye közzé (helyezze üzembe) a betanított modellt. Az egyéni modell elérhetővé válik futásidejű fordítási kérésekhez.
Szöveg fordítása. A felhőalapú, biztonságos, nagy teljesítményű, nagy mértékben skálázható Microsoft Translator Text API V3 használatával végezhet fordítási kéréseket.
Munkaterület létrehozása
Miután bejelentkezett a Custom Translatorbe, a rendszer engedélyt kér a profil olvasásához a Microsoft Identitásplatform a felhasználói hozzáférési jogkivonat és a frissítési jogkivonat igényléséhez. Mindkét jogkivonatra szükség van a hitelesítéshez, és győződjön meg arról, hogy nincs kijelentkezve az élő munkamenet során vagy a modellek betanítása során.
Válassza az Igen lehetőséget.Válassza a Saját munkaterületek lehetőséget.
Válassza az Új munkaterület létrehozása lehetőséget.
Írja be a Contoso MT-modelleket a Munkaterület neve mezőbe, és válassza a Tovább lehetőséget.
Válassza a "Globális" lehetőséget az Erőforrás régiójának kiválasztása elemhez a legördülő listából.
Másolja/illessze be a Translator Services-kulcsot.
Kattintson a Tovább gombra.
Válassza a Kész lehetőséget.
Megjegyzés
A régiónak meg kell egyeznie az erőforrás létrehozása során kiválasztott régióval. Használhatja a KEY 1-et vagy a KEY 2-t.
Projekt létrehozása
A munkaterület sikeres létrehozása után a projekt a Projektek lapra kerül.
Angolról németre projekt létrehozásával betaníthat egy olyan egyéni modellt, amely csak egy betanítási dokumentumtípussal rendelkezik.
Válassza a Create project (Projekt létrehozása) lehetőséget.
A Projekt neve mezőbe írja be a következőt: angol–német.
Válassza az Angol (en)lehetőséget forrásnyelvként a legördülő listából.
Válassza a német (de) nyelvet célnyelvként a legördülő listából.
A legördülő listából válassza az Általánostartomány lehetőséget.
Válassza a Create project (Projekt létrehozása) lehetőséget.
Dokumentumok feltöltése
Egyéni modell létrehozásához fel kell töltenie a betanítási, finomhangolási, tesztelési és szótár-dokumentumtípusok egészét vagy kombinációját.
Ebben a rövid útmutatóban betanítási dokumentumokat fog feltölteni testreszabásra.
Megjegyzés
Ehhez a rövid útmutatóhoz használhatja a betanítási, kifejezés- és mondatszótárak mintaadatkészletét, az ügyfél-mintául szolgáló angol–német adatkészleteket. Éles környezetben azonban jobb, ha feltölti a saját betanítási adatkészletét.
Válassza az angol-német projekt nevét.
A bal oldali navigációs menüben válassza a Dokumentumok kezelése lehetőséget.
Válassza a Dokumentumkészlet hozzáadása lehetőséget.
Jelölje be a Betanítási csoport jelölőnégyzetet, és válassza a Tovább gombot.
Hagyja bejelölve a párhuzamos dokumentumokat , és írja be a sample-english-german kifejezést.
A Forrás (angol – EN) fájl alatt válassza a Fájlok tallózása , majd asample-English-German-Training-en.txtlehetőséget.
A Célfájl (német – EN) területen válassza a Fájlok tallózása , majd asample-English-German-Training-de.txtlehetőséget.
Válassza a Feltöltés lehetőséget
Megjegyzés
Feltöltheti a kifejezés- és mondatszótár-mintaadatkészletet. Ezt a lépést még el kell végeznie.
A modell betanítása
Most már készen áll az angol-német modell betanítása.
A bal oldali navigációs menüben válassza a Modell betanítása lehetőséget.
Írja be az en-de kifejezést mintaadatokkal a Modell neve mezőbe.
Ellenőrizze a Teljes betanítást .
A Dokumentumok kiválasztása területen ellenőrizze a minta-angol-német nyelvet, és tekintse át a mondatok kiválasztott számával kapcsolatos képzési költségeket.
Válassza a Betanítása most lehetőséget.
A megerősítéshez válassza a Betanítása lehetőséget.
Megjegyzés
Az értesítések a modell betanítását jelenítik meg, például az adatállapot elküldését . A betanítási modell néhány órát vesz igénybe, a kijelölt mondatok számától függ.
A sikeres modellbetanítás után válassza a modell részleteit a bal oldali navigációs menüben.
Válassza ki a modell nevét en-de mintaadatokkal. Tekintse át a betanítás dátumát/idejét, a teljes betanítási időt, a betanításhoz, a hangoláshoz, a teszteléshez és a szótárhoz használt mondatok számát. Ellenőrizze, hogy a rendszer létrehozta-e a teszt- és hangolási készleteket. A használatával
Category ID
végezhet fordítási kéréseket.Értékelje ki a modell BLEU-pontszámát . A tesztkészlet BLEU-pontszáma az egyéni modell pontszáma, az Alapterv BLEU pedig a testreszabáshoz használt, előre betanított alapmodell. A magasabb BLEU-pontszám magasabb fordítási minőséget jelent az egyéni modell használatával.
Megjegyzés
Ha megosztott ügyfél-mintaadatkészletekkel tanít be, a BLEU-pontszám eltér a képétől.
Modell tesztelése
Miután a betanítás sikeresen befejeződött, vizsgálja meg a tesztkészlet lefordított mondatait.
- A bal oldali navigációs menüben válassza a Modell tesztelése lehetőséget.
- Válassza az "en-de mintaadatokkal" lehetőséget
- Az új modell (egyéni modell) és az alapkonfigurációs modell (a testreszabáshoz használt alapkonfiguráció) emberi kiértékelése referencia alapján ( célfordítás a tesztkészletből)
A modell közzététele
Ha közzéteszi a modelljét, használhatja a Translator API-val. Egy projekt egy vagy több sikeresen betanított modellel rendelkezhet. Projektenként csak egy modellt tehet közzé, azonban egy modellt igény szerint egy vagy több régióban is közzétehet. További információ: Translator díjszabása.
A bal oldali navigációs menüben válassza a Modell közzététele lehetőséget.
Válassza az en-de lehetőséget mintaadatokkal , majd válassza a Közzététel lehetőséget.
Ellenőrizze a kívánt régió(ka)t.
Válassza a Közzététel lehetőséget. Az állapotnak át kell váltania az Üzembe helyezésről az Üzembe helyezésre.
Szöveg lefordítása
A fejlesztőknek a fordítási kérelmeket a
Category ID
Microsoft Translator Text API V3 használatával kell használniuk. A Translator Text API-val kapcsolatos további információk az API Referencia weblapján találhatók.Az üzleti felhasználók letölthetik és telepíthetik a Windowshoz készült ingyenes DocumentTranslator alkalmazást.