Udostępnij za pośrednictwem


Obsługa języka na potrzeby niestandardowej analizy tekstu na potrzeby kondycji

Skorzystaj z tego artykułu, aby dowiedzieć się więcej o językach obsługiwanych obecnie przez Niestandardowa analiza tekstu dla zdrowia.

Opcja obsługi wielu języków

Za pomocą Niestandardowa analiza tekstu dla zdrowia można wytrenować model w jednym języku i użyć go do wyodrębniania jednostek z dokumentów innych języków. Ta funkcja pozwala zaoszczędzić problemy z tworzeniem oddzielnych projektów dla każdego języka i zamiast tego łączenie zestawów danych w jednym projekcie, co ułatwia skalowanie projektów do wielu języków. Możesz wytrenować projekt w całości przy użyciu dokumentów w języku angielskim i wykonywać zapytania w języku francuskim, niemieckim, włoskim i innych. Możesz włączyć opcję wielojęzyczną w ramach procesu tworzenia projektu lub nowszego za pomocą ustawień projektu.

Nie oczekuje się dodania tej samej liczby dokumentów dla każdego języka. Większość projektu należy utworzyć w jednym języku i dodać tylko kilka dokumentów w językach, które obserwujesz, nie działają prawidłowo. Jeśli utworzysz projekt, który jest głównie w języku angielskim i rozpoczniesz testowanie go w języku francuskim, niemieckim i hiszpańskim, możesz zauważyć, że język niemiecki nie działa, a także pozostałe dwa języki. W takim przypadku rozważ dodanie 5% oryginalnych dokumentów angielskich w języku niemieckim, wytrenuj nowy model i ponownie przetestuj go w języku niemieckim. Na stronie etykietowania danych w programie Language Studio możesz wybrać język dodawanego dokumentu. Powinny zostać wyświetlone lepsze wyniki dla niemieckich zapytań. Tym bardziej oznaczone dokumenty, tym bardziej prawdopodobne, że wyniki będą lepsze. Podczas dodawania danych w innym języku nie należy oczekiwać, że będzie ona negatywnie wpływać na inne języki.

Język hebrajski nie jest obsługiwany w projektach wielojęzycznych. Jeśli podstawowym językiem projektu jest hebrajski, nie będzie można dodawać danych szkoleniowych w innych językach ani wykonywać zapytań względem modelu w innych językach. Podobnie, jeśli język podstawowy projektu nie jest hebrajski, nie będzie można dodać danych szkoleniowych w języku hebrajskim lub wykonać zapytania względem modelu w języku hebrajskim.

Obsługa języków

Niestandardowe analiza tekstu kondycji obsługują .txt pliki w następujących językach:

Język Kod języka
Angielski en
Francuski fr
Niemiecki de
Hiszpański es
Włoski it
Portugalski (Portugalia) pt-pt
Hebrajski he

Następne kroki