Używanie rejestrowania selektywnego za pomocą akcji skryptu w usłudze Azure HDInsight

Artykuł
10/26/2023

Dzienniki usługi Azure Monitor to usługa Azure Monitor, która monitoruje środowiska chmurowe i lokalne. Monitorowanie pomaga zachować ich dostępność i wydajność.

Dzienniki usługi Azure Monitor zbierają dane generowane przez zasoby w chmurze, zasoby w środowiskach lokalnych i inne narzędzia do monitorowania. Używa ona danych do zapewniania analizy w wielu źródłach. Aby uzyskać analizę, włącz funkcję rejestrowania selektywnego przy użyciu akcji skryptu dla usługi HDInsight w witrynie Azure Portal.

Informacje o selektywnym rejestrowaniu

Selektywne rejestrowanie jest częścią ogólnego systemu monitorowania na platformie Azure. Po połączeniu klastra z obszarem roboczym usługi Log Analytics i włączeniu rejestrowania selektywnego można zobaczyć dzienniki i metryki, takie jak dzienniki zabezpieczeń usługi HDInsight, usługa Yarn Resource Manager i metryki systemowe. Możesz monitorować obciążenia i zobaczyć, jak wpływają one na stabilność klastra.

Selektywne rejestrowanie umożliwia włączenie lub wyłączenie wszystkich tabel lub włączenie wybranych tabel w obszarze roboczym usługi Log Analytics. Można dostosować typ źródła dla każdej tabeli.

Uwaga

Jeśli usługa Log Analytics zostanie ponownie zainstalowana w klastrze, należy ponownie wyłączyć wszystkie tabele i typy dzienników. Ponowna instalacja resetuje wszystkie pliki konfiguracji do ich pierwotnego stanu.

Zagadnienia dotyczące akcji skryptu

System monitorowania używa demona serwera metadanych (agenta monitorowania) i Fluentd do zbierania dzienników przy użyciu ujednoliconej warstwy rejestrowania.
Selektywne rejestrowanie używa akcji skryptu do wyłączania lub włączania tabel i ich typów dzienników. Ponieważ selektywne rejestrowanie nie otwiera żadnych nowych portów ani nie zmienia żadnych istniejących ustawień zabezpieczeń, nie ma żadnych zmian zabezpieczeń.
Akcja skryptu jest uruchamiana równolegle we wszystkich określonych węzłach i zmienia pliki konfiguracji dotyczące wyłączania lub włączania tabel i ich typów dzienników.

Wymagania wstępne

Obszar roboczy usługi Log Analytics. Ten obszar roboczy można traktować jako unikatowe środowisko dzienników usługi Azure Monitor z własnym repozytorium danych, źródłami danych i rozwiązaniami. Aby uzyskać instrukcje, zobacz Tworzenie obszaru roboczego usługi Log Analytics.
Klaster usługi Azure HDInsight. Obecnie można użyć funkcji rejestrowania selektywnego z następującymi typami klastrów usługi HDInsight:
- Hadoop
- HBase
- Zapytanie interakcyjne
- platforma Spark

Aby uzyskać instrukcje dotyczące tworzenia klastra usługi HDInsight, zobacz Wprowadzenie do usługi Azure HDInsight.

Włączanie lub wyłączanie dzienników przy użyciu akcji skryptu dla wielu tabel i typów dzienników

Przejdź do pozycji Akcje skryptu w klastrze i wybierz pozycję Prześlij nowy , aby rozpocząć proces tworzenia akcji skryptu.

Zostanie wyświetlone okienko akcji Prześlij skrypt.
Dla typu skryptu wybierz pozycję Niestandardowe.
Nadaj skryptowi nazwę. Na przykład: Wyłącz dwie tabele i dwa źródła.
Identyfikator URI skryptu powłoki Bash musi być linkiem do selectiveLoggingScript.sh.
Wybierz wszystkie typy węzłów, które mają zastosowanie do klastra. Dostępne opcje to węzeł główny, węzeł procesu roboczego i węzeł ZooKeeper.
Zdefiniuj parametry. Przykład:
- Iskra: spark HDInsightSparkLogs:SparkExecutorLog --disable
- Zapytanie interakcyjne: interactivehive HDInsightSparkLogs:SparkExecutorLog --enable
- Hadoop: hadoop HDInsightSparkLogs:SparkExecutorLog --disable
- Hbase: hbase HDInsightSparkLogs: HDInsightHBaseLogs --enable
Aby uzyskać więcej informacji, zobacz sekcję Składnia parametrów.
Wybierz pozycję Utwórz.
Po kilku minutach obok historii akcji skryptu pojawi się zielony znacznik wyboru. Oznacza to, że skrypt został pomyślnie uruchomiony.

Zmiany zostaną wyświetlone w obszarze roboczym usługi Log Analytics.

Rozwiązywanie problemów

W obszarze roboczym usługi Log Analytics nie są wyświetlane żadne zmiany

Jeśli przesyłasz akcję skryptu, ale nie ma żadnych zmian w obszarze roboczym usługi Log Analytics:

W obszarze Pulpity nawigacyjne wybierz pozycję Strona główna systemu Ambari, aby sprawdzić informacje debugowania.
Wybierz przycisk Ustawienia.
Wybierz najnowszy skrypt uruchom w górnej części listy operacji w tle.
Sprawdź stan uruchomienia skryptu we wszystkich węzłach osobno.
Sprawdź, czy składnia parametrów z sekcji składni parametrów jest poprawna.
Sprawdź, czy obszar roboczy usługi Log Analytics jest połączony z klastrem i czy monitorowanie usługi Log Analytics jest włączone.
Sprawdź, czy zaznaczono akcję Utrwał ten skrypt, aby ponownie uruchomić po dodaniu nowych węzłów do klastra dla uruchomionej akcji skryptu.
Sprawdź, czy nowy węzeł został ostatnio dodany do klastra.

Uwaga

Aby skrypt działał w najnowszym klastrze, skrypt musi być utrwalany.
Upewnij się, że wybrano wszystkie typy węzłów, które chcesz wykonać dla akcji skryptu.

Akcja skryptu nie powiodła się

Jeśli akcja skryptu wyświetla stan niepowodzenia w historii akcji skryptu:

Sprawdź, czy składnia parametrów z sekcji składni parametrów jest poprawna.
Sprawdź, czy link skryptu jest poprawny. Powinien to być: https://hdiconfigactions.blob.core.windows.net/log-analytics-patch/selectiveLoggingScripts/selectiveLoggingScript.sh.

Nazwy tabel

Klaster Spark

Poniższe nazwy tabel dotyczą różnych typów dzienników (źródeł) w tabelach platformy Spark.

Numer źródłowy	Nazwa tabeli	Typy dzienników	opis
1.	Alerty usługi HDInsightAmbariCluster	Brak typów dzienników	Ta tabela zawiera alerty klastra Ambari z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych). Każdy alert jest rekordem w tej tabeli.
2.	Metryki hdInsightAmbariSystem	Brak typów dzienników	Ta tabela zawiera metryki systemowe zebrane z systemu Ambari. Metryki pochodzą teraz z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych) zamiast tylko dwóch węzłów głównych. Każda metryka jest teraz kolumną, a każda metryka jest zgłaszana raz na rekord.
3.	HDInsightHadoopAnd YarnLogs	Węzeł główny: MRJobSummary, Resource Manager, TimelineServer Worker node: NodeManager	Ta tabela zawiera wszystkie dzienniki wygenerowane na podstawie platform Hadoop i YARN.
4.	Dzienniki zabezpieczeń usługi HDInsight	AmbariAuditLog, AuthLog	Ta tabela zawiera rekordy z dzienników inspekcji i uwierzytelniania systemu Ambari.
5.	Dzienniki usługi HDInsightSpark	Węzeł główny: JupyterLog, LivyLog, SparkThriftDriverLog Worker node: SparkExecutorLog, SparkDriverLog	Ta tabela zawiera wszystkie dzienniki związane z platformą Spark i powiązanymi składnikami: Livy i Jupyter.
6.	HDInsightHadoopAnd YarnMetrics	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hadoop i YARN. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych oraz więcej metryk, które uznaliśmy za ważne. Dodaliśmy metryki Serwer osi czasu, Menedżer węzłów i Serwer historii zadań. Zawiera jedną metryki na rekord.
7.	HDInsightOozieLogs	Oozie	Ta tabela zawiera wszystkie dzienniki wygenerowane na podstawie struktury Oozie.

Klaster zapytań interakcyjnych

Poniższe nazwy tabel dotyczą różnych typów dzienników (źródeł) w tabelach Interactive Query.

Numer źródłowy	Nazwa tabeli	Typy dzienników	opis
1.	HDInsightAmbariClusterAlerts	Brak typów dzienników	Ta tabela zawiera alerty klastra Ambari z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych). Każdy alert jest rekordem w tej tabeli.
2.	Metryki hdInsightAmbariSystem	Brak typów dzienników	Ta tabela zawiera metryki systemowe zebrane z systemu Ambari. Metryki pochodzą teraz z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych) zamiast tylko dwóch węzłów głównych. Każda metryka jest teraz kolumną, a każda metryka jest zgłaszana raz na rekord.
3.	HDInsightHadoopAndYarnLogs	Węzeł główny: MRJobSummary, Resource Manager, TimelineServer Worker node: NodeManager	Ta tabela zawiera wszystkie dzienniki wygenerowane na podstawie platform Hadoop i YARN.
4.	HDInsightHadoopAndYarnMetrics	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hadoop i YARN. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych oraz więcej metryk, które uznaliśmy za ważne. Dodaliśmy metryki Serwer osi czasu, Menedżer węzłów i Serwer historii zadań. Zawiera jedną metryki na rekord.
5.	HDInsightHiveAndLLAPLogs	Węzeł główny: InteractiveHiveHSILog, InteractiveHiveMetastoreLog, ZeppelinLog	Ta tabela zawiera dzienniki wygenerowane na podstawie technologii Hive, LLAP i ich powiązanych składników: WebHCat i Zeppelin.
6.	HDInsightHiveAndLLAPmetrics	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hive i LLAP. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych. Zawiera jedną metryki na rekord.
7.	HDInsightHiveTezAppStats	Brak typów dzienników
8.	Dzienniki zabezpieczeń usługi HDInsight	Węzeł główny: AmbariAuditLog, węzeł AuthLog ZooKeeper, węzeł procesu roboczego: AuthLog	Ta tabela zawiera rekordy z dzienników inspekcji i uwierzytelniania systemu Ambari.

Klaster HBase

Poniższe nazwy tabel dotyczą różnych typów dzienników (źródeł) w tabelach HBase.

Numer źródłowy	Nazwa tabeli	Typy dzienników	opis
1.	HDInsightAmbariClusterAlerts	Brak innych typów dzienników	Ta tabela zawiera alerty klastra Ambari z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych). Każdy alert jest rekordem w tej tabeli.
2.	Metryki hdInsightAmbariSystem	Brak innych typów dzienników	Ta tabela zawiera metryki systemowe zebrane z systemu Ambari. Metryki pochodzą teraz z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych) zamiast tylko dwóch węzłów głównych. Każda metryka jest teraz kolumną, a każda metryka jest zgłaszana raz na rekord.
3.	HDInsightHadoopAndYarnLogs	Węzeł główny: MRJobSummary, Resource Manager, TimelineServer Worker node: NodeManager	Ta tabela zawiera wszystkie dzienniki wygenerowane na podstawie platform Hadoop i YARN.
4.	Dzienniki zabezpieczeń usługi HDInsight	Węzeł główny: AmbariAuditLog, węzeł procesu roboczego AuthLog: węzeł AuthLog ZooKeeper: AuthLog	Ta tabela zawiera rekordy z dzienników inspekcji i uwierzytelniania systemu Ambari.
5.	Dzienniki bazy danych HDInsightH	Węzeł główny: HDFSGarbageCollectorLog, węzeł roboczy HDFSNameNodeLog: PhoenixServerLog, HBaseRegionServerLog, HBaseRestServerKeeper node: HBaseMasterLog	Ta tabela zawiera dzienniki z bazy danych HBase i powiązanych składników: Phoenix i HDFS.
6.	HDInsightHBaseMetrics	Brak typów dzienników	Ta tabela zawiera metryki JMX z bazy danych HBase. Zawiera wszystkie te same metryki JMX z tabel wymienionych w kolumnie Stary schemat. W przeciwieństwie do starych tabel każdy wiersz zawiera jedną metrykę.
7.	Metryki HDInsightHadoopAndyarn	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hadoop i YARN. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych oraz więcej metryk, które uznaliśmy za ważne. Dodaliśmy metryki Serwer osi czasu, Menedżer węzłów i Serwer historii zadań. Zawiera jedną metryki na rekord.

Klaster Hadoop

Poniższe nazwy tabel dotyczą różnych typów dzienników (źródeł) w tabelach usługi Hadoop.

Numer źródłowy	Nazwa tabeli	Typy dzienników	opis
1.	HDInsightAmbariClusterAlerts	Brak typów dzienników	Ta tabela zawiera alerty klastra Ambari z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych). Każdy alert jest rekordem w tej tabeli.
2.	Metryki hdInsightAmbariSystem	Brak typów dzienników	Ta tabela zawiera metryki systemowe zebrane z systemu Ambari. Metryki pochodzą teraz z każdego węzła w klastrze (z wyjątkiem węzłów brzegowych) zamiast tylko dwóch węzłów głównych. Każda metryka jest teraz kolumną, a każda metryka jest zgłaszana raz na rekord.
3.	HDInsightHadoopAndYarnLogs	Węzeł główny: MRJobSummary, Resource Manager, TimelineServer Worker node: NodeManager	Ta tabela zawiera wszystkie dzienniki wygenerowane na podstawie platform Hadoop i YARN.
4.	HDInsightHadoopAndYarnMetrics	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hadoop i YARN. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych oraz więcej metryk, które uznaliśmy za ważne. Dodaliśmy metryki Serwer osi czasu, Menedżer węzłów i Serwer historii zadań. Zawiera jedną metryki na rekord.
5.	HDInsightHiveAndLLAPLogs	Węzeł główny: HiveMetastoreLog, HiveServer2Log, WebHcatLog	Ta tabela zawiera dzienniki wygenerowane na podstawie technologii Hive, LLAP i ich powiązanych składników: WebHCat i Zeppelin.
6.	Metryki hive i LLAP w usłudze HDInsight	Brak typów dzienników	Ta tabela zawiera metryki JMX z platform Hive i LLAP. Zawiera wszystkie te same metryki JMX co stare tabele dzienników niestandardowych. Zawiera jedną metryki na rekord.
7.	Dzienniki zabezpieczeń usługi HDInsight	Węzeł główny: AmbariAuditLog, węzeł AuthLog ZooKeeper: AuthLog	Ta tabela zawiera rekordy z dzienników inspekcji i uwierzytelniania systemu Ambari.

Składnia parametrów

Parametry definiują typ klastra, nazwy tabel, nazwy źródłowe i akcję.

Screenshot that shows the parameter syntax box.

Parametr zawiera trzy części:

Typ klastra
Tabele i typy dzienników
Akcja ( --disable lub --enable)

Składnia dla wielu tabel

Jeśli masz wiele tabel, są one oddzielone przecinkami. Przykład:

spark HDInsightSecurityLogs, HDInsightAmbariSystemMetrics --disable

hbase HDInsightSecurityLogs, HDInsightAmbariSystemMetrics --enable

Składnia dla wielu typów źródłowych lub typów dzienników

Jeśli masz wiele typów źródłowych lub typów dzienników, są one oddzielone spacją.

Aby wyłączyć źródło, zapisz nazwę tabeli zawierającą typy dzienników, a następnie dwukropek, a następnie nazwę rzeczywistego typu dziennika:

TableName : LogTypeName

Załóżmy na przykład, że spark HDInsightSecurityLogs jest to tabela zawierająca dwa typy dzienników: AmbariAuditLog i AuthLog. Aby wyłączyć oba typy dzienników, prawidłową składnią będzie:

spark HDInsightSecurityLogs: AmbariAuditLog AuthLog --disable

Składnia dla wielu tabel i typów źródłowych

Jeśli musisz wyłączyć dwie tabele i dwa typy źródłowe, użyj następującej składni:

Spark: InteractiveHiveMetastoreLog typ dziennika w HDInsightHiveAndLLAPLogs tabeli
Hbase: InteractiveHiveHSILog typ dziennika w HDInsightHiveAndLLAPLogs tabeli
Hadoop: HDInsightHiveAndLLAPMetrics tabela
Hadoop: HDInsightHiveTezAppStats tabela

Rozdziel tabele przecinkami. Oznacz źródła przy użyciu dwukropka po nazwie tabeli, w której się znajdują.

Prawidłowa składnia parametrów dla tych przypadków to:

interactivehive HDInsightHiveAndLLAPLogs: InteractiveHiveMetastoreLog, HDInsightHiveAndLLAPMetrics, HDInsightHiveTezAppStats, HDInsightHiveAndLLAPLogs: InteractiveHiveHSILog --enable

Share via