Rövid útmutató: Buildelés, közzététel és fordítás egyéni modellekkel

A Translator egy felhőalapú neurális gépi fordítási szolgáltatás, amely a REST API Azure AI-szolgáltatáscsaládjának része, amely bármilyen operációs rendszerrel használható. A Translator számos Microsoft-terméket és -szolgáltatást működtet világszerte, amelyeket több ezer vállalkozás használ a nyelvfordítás és más nyelvi műveletek elvégzéséhez. Ebből a rövid útmutatóból megtudhatja, hogyan hozhat létre egyéni megoldásokat alkalmazásaihoz az összes támogatott nyelven.

Előfeltételek

A Custom Translator portál használatához a következő erőforrásokra van szüksége:

  • Egy Microsoft-fiók.

  • Azure-előfizetés – Ingyenes létrehozás

  • Miután rendelkezik Azure-előfizetéssel, hozzon létre egy Translator-erőforrást a Azure Portal a kulcs és a végpont lekéréséhez. Az üzembe helyezés után válassza az Erőforrás megnyitása lehetőséget.

    • Az alkalmazás a Translator szolgáltatáshoz való csatlakoztatásához szüksége lesz az erőforrás kulcsára és végpontjára. Illessze be a kulcsot és a végpontot a kódba a rövid útmutató későbbi részében. Ezeket az értékeket a Azure Portal Kulcsok és végpont lapon találja:

      Képernyőkép: Azure Portal kulcsok és végpontok oldala.

További információ :Translator-erőforrás létrehozása.

Custom Translator portál

A fenti előfeltételek teljesülése után jelentkezzen be a Custom Translator portálra munkaterületek létrehozásához, projektek létrehozásához, fájlok feltöltéséhez, modellek betanítása és az egyéni megoldás közzétételéhez.

Az Azure AI technikai blogjában áttekintheti a fordítást és az egyéni fordítást, megismerhet néhány tippet, és watch egy első lépéseket ismertető videót.

Folyamat összefoglalása

  1. Hozzon létre egy munkaterületet. A munkaterület az egyéni fordítási rendszer írására és létrehozására szolgáló munkaterület. A munkaterületek több projektet, modellt és dokumentumot is tartalmazhatnak. A Custom Translatorben végzett összes munka egy adott munkaterületen belül történik.

  2. Hozzon létre egy projektet. A projektek modellek, dokumentumok és tesztek burkolói. Minden projekt tartalmazza az összes olyan dokumentumot, amely a megfelelő nyelvi párral van feltöltve a munkaterületre. Ha például egy angol–spanyol és egy spanyol–angol projekt is van, akkor mindkét projekt ugyanazokat a dokumentumokat tartalmazza.

  3. Párhuzamos dokumentumok feltöltése. A párhuzamos dokumentumok olyan dokumentumpárok, amelyekben az egyik (cél) a másik fordítása (forrás). A pár egyik dokumentuma a forrásnyelven lévő mondatokat, a másik pedig a célnyelvre lefordított mondatokat tartalmazza. Nem számít, hogy melyik nyelv "forrásként" van megjelölve, és melyik nyelv "célként" van megjelölve – a párhuzamos dokumentumokkal bármelyik irányba betanítást végezheti a fordítási rendszer.

  4. A modell betanítása. A modell az a rendszer, amely fordítást biztosít egy adott nyelvpárhoz. A sikeres betanítás eredménye egy modell. Modell betanításakor három egymást kölcsönösen kizáró dokumentumtípus szükséges: betanítás, finomhangolás és tesztelés. Ha csak betanítási adatok állnak rendelkezésre egy betanítás várólistára helyezésekor, a Custom Translator automatikusan összeállítja a hangolási és tesztelési adatokat. A betanítási dokumentumokban lévő mondatok véletlenszerű részhalmazát használja, és kizárja ezeket a mondatokat magából a betanítási adatokból. A modell betanítása minimális követelménye a 10 000 párhuzamos mondat.

  5. Tesztelje (emberi értékelés) a modellt. A tesztelési készlet a BLEU-pontszám kiszámítására szolgál. Ez a pontszám a fordítási rendszer minőségét jelzi.

  6. Tegye közzé (helyezze üzembe) a betanított modellt. Az egyéni modell elérhetővé válik futásidejű fordítási kérésekhez.

  7. Szöveg fordítása. A felhőalapú, biztonságos, nagy teljesítményű, nagy mértékben skálázható Microsoft Translator Text API V3 használatával végezhet fordítási kéréseket.

Munkaterület létrehozása

  1. Miután bejelentkezett a Custom Translatorbe, a rendszer engedélyt kér a profil olvasásához a Microsoft Identitásplatform a felhasználói hozzáférési jogkivonat és a frissítési jogkivonat igényléséhez. Mindkét jogkivonatra szükség van a hitelesítéshez, és győződjön meg arról, hogy nincs kijelentkezve az élő munkamenet során vagy a modellek betanítása során.
    Válassza az Igen lehetőséget.

    Munkaterület létrehozását bemutató képernyőkép.

  2. Válassza a Saját munkaterületek lehetőséget.

  3. Válassza az Új munkaterület létrehozása lehetőséget.

  4. Írja be a Contoso MT-modelleket a Munkaterület neve mezőbe, és válassza a Tovább lehetőséget.

  5. Válassza a "Globális" lehetőséget az Erőforrás régiójának kiválasztása elemhez a legördülő listából.

  6. Másolja/illessze be a Translator Services-kulcsot.

  7. Kattintson a Tovább gombra.

  8. Válassza a Kész lehetőséget.

    Megjegyzés

    A régiónak meg kell egyeznie az erőforrás létrehozása során kiválasztott régióval. Használhatja a KEY 1-et vagy a KEY 2-t.

    Az erőforráskulcsot bemutató képernyőkép.

    A munkaterület létrehozását bemutató képernyőkép.

Projekt létrehozása

A munkaterület sikeres létrehozása után a projekt a Projektek lapra kerül.

Angolról németre projekt létrehozásával betaníthat egy olyan egyéni modellt, amely csak egy betanítási dokumentumtípussal rendelkezik.

  1. Válassza a Create project (Projekt létrehozása) lehetőséget.

  2. A Projekt neve mezőbe írja be a következőt: angol–német.

  3. Válassza az Angol (en)lehetőséget forrásnyelvként a legördülő listából.

  4. Válassza a német (de) nyelvet célnyelvként a legördülő listából.

  5. A legördülő listából válassza az Általánostartomány lehetőséget.

  6. Válassza a Create project (Projekt létrehozása) lehetőséget.

    A projekt létrehozását bemutató képernyőkép.

Dokumentumok feltöltése

Egyéni modell létrehozásához fel kell töltenie a betanítási, finomhangolási, tesztelési és szótár-dokumentumtípusok egészét vagy kombinációját.

Ebben a rövid útmutatóban betanítási dokumentumokat fog feltölteni testreszabásra.

Megjegyzés

Ehhez a rövid útmutatóhoz használhatja a betanítási, kifejezés- és mondatszótárak mintaadatkészletét, az ügyfél-mintául szolgáló angol–német adatkészleteket. Éles környezetben azonban jobb, ha feltölti a saját betanítási adatkészletét.

  1. Válassza az angol-német projekt nevét.

  2. A bal oldali navigációs menüben válassza a Dokumentumok kezelése lehetőséget.

  3. Válassza a Dokumentumkészlet hozzáadása lehetőséget.

  4. Jelölje be a Betanítási csoport jelölőnégyzetet, és válassza a Tovább gombot.

  5. Hagyja bejelölve a párhuzamos dokumentumokat , és írja be a sample-english-german kifejezést.

  6. A Forrás (angol – EN) fájl alatt válassza a Fájlok tallózása , majd asample-English-German-Training-en.txtlehetőséget.

  7. A Célfájl (német – EN) területen válassza a Fájlok tallózása , majd asample-English-German-Training-de.txtlehetőséget.

  8. Válassza a Feltöltés lehetőséget

    Megjegyzés

    Feltöltheti a kifejezés- és mondatszótár-mintaadatkészletet. Ezt a lépést még el kell végeznie.

    A dokumentumok feltöltését bemutató képernyőkép.

A modell betanítása

Most már készen áll az angol-német modell betanítása.

  1. A bal oldali navigációs menüben válassza a Modell betanítása lehetőséget.

  2. Írja be az en-de kifejezést mintaadatokkal a Modell neve mezőbe.

  3. Ellenőrizze a Teljes betanítást .

  4. A Dokumentumok kiválasztása területen ellenőrizze a minta-angol-német nyelvet, és tekintse át a mondatok kiválasztott számával kapcsolatos képzési költségeket.

  5. Válassza a Betanítása most lehetőséget.

  6. A megerősítéshez válassza a Betanítása lehetőséget.

    Megjegyzés

    Az értesítések a modell betanítását jelenítik meg, például az adatállapot elküldését . A betanítási modell néhány órát vesz igénybe, a kijelölt mondatok számától függ.

    Modell létrehozásának módját bemutató képernyőkép.

  7. A sikeres modellbetanítás után válassza a modell részleteit a bal oldali navigációs menüben.

  8. Válassza ki a modell nevét en-de mintaadatokkal. Tekintse át a betanítás dátumát/idejét, a teljes betanítási időt, a betanításhoz, a hangoláshoz, a teszteléshez és a szótárhoz használt mondatok számát. Ellenőrizze, hogy a rendszer létrehozta-e a teszt- és hangolási készleteket. A használatával Category ID végezhet fordítási kéréseket.

  9. Értékelje ki a modell BLEU-pontszámát . A tesztkészlet BLEU-pontszáma az egyéni modell pontszáma, az Alapterv BLEU pedig a testreszabáshoz használt, előre betanított alapmodell. A magasabb BLEU-pontszám magasabb fordítási minőséget jelent az egyéni modell használatával.

    Megjegyzés

    Ha megosztott ügyfél-mintaadatkészletekkel tanít be, a BLEU-pontszám eltér a képétől.

    Képernyőkép a modell részleteiről.

Modell tesztelése

Miután a betanítás sikeresen befejeződött, vizsgálja meg a tesztkészlet lefordított mondatait.

  1. A bal oldali navigációs menüben válassza a Modell tesztelése lehetőséget.
  2. Válassza az "en-de mintaadatokkal" lehetőséget
  3. Az új modell (egyéni modell) és az alapkonfigurációs modell (a testreszabáshoz használt alapkonfiguráció) emberi kiértékelése referencia alapján ( célfordítás a tesztkészletből)

A modell közzététele

Ha közzéteszi a modelljét, használhatja a Translator API-val. Egy projekt egy vagy több sikeresen betanított modellel rendelkezhet. Projektenként csak egy modellt tehet közzé, azonban egy modellt igény szerint egy vagy több régióban is közzétehet. További információ: Translator díjszabása.

  1. A bal oldali navigációs menüben válassza a Modell közzététele lehetőséget.

  2. Válassza az en-de lehetőséget mintaadatokkal , majd válassza a Közzététel lehetőséget.

  3. Ellenőrizze a kívánt régió(ka)t.

  4. Válassza a Közzététel lehetőséget. Az állapotnak át kell váltania az Üzembe helyezésről az Üzembe helyezésre.

    A betanított modell üzembe helyezését bemutató képernyőkép.

Szöveg lefordítása

  1. A fejlesztőknek a fordítási kérelmeket a Category ID Microsoft Translator Text API V3 használatával kell használniuk. A Translator Text API-val kapcsolatos további információk az API Referencia weblapján találhatók.

  2. Az üzleti felhasználók letölthetik és telepíthetik a Windowshoz készült ingyenes DocumentTranslator alkalmazást.

Következő lépések