Projekt i operacje klastra

Ten artykuł dotyczy konfiguracji klastra i projektu sieci. Dowiedz się, jak sprawdzić skalowalność w przyszłości, automatyzując aprowizowanie infrastruktury. Aprowizowanie to proces konfigurowania chętnej infrastruktury IT. Automatyczne aprowizowanie infrastruktury obsługuje instalację zdalną i konfiguruje środowiska wirtualne. Pomaga również zachować wysoką dostępność, planując ciągłość działalności biznesowej i odzyskiwanie po awarii.

Planowanie, trenowania i weryfikacji

Na początku lista kontrolna i poniższe zasoby kubernetes pomogą Ci zaplanować projekt klastra. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy określono wymagania dotyczące projektowania sieci dla klastra?
  • Czy masz usługi o różnych wymaganiach? Z ilu pul węzłów będziesz korzystać?

Lista kontrolna:

  • Zidentyfikuj zagadnienia dotyczące projektowania sieci. Poznaj zagadnienia dotyczące projektowania sieci klastra, porównaj modele sieciowe i wybierz wtyczkę sieci kubernetes, która odpowiada Twoim potrzebom. W Azure Container Networking Interface sieci (CNI) należy wziąć pod uwagę liczbę adresów IP wymaganą jako wielokrotność maksymalnej liczby zasobników na węzeł (domyślnie 30) i liczbę węzłów. Dodaj jeden węzeł wymagany podczas uaktualniania. Podczas wybierania usług równoważenia obciążenia należy rozważyć użycie kontrolera ruchu wychodzącego, gdy istnieje zbyt wiele usług, aby zmniejszyć liczbę ujawnionych punktów końcowych. Na Azure CNI cidr usługi musi być unikatowa w sieci wirtualnej i we wszystkich połączonych sieciach wirtualnych, aby zapewnić odpowiedni routing.

    Aby dowiedzieć się więcej, zobacz:

  • Utwórz wiele pul węzłów. Aby obsługiwać aplikacje o różnych wymaganiach obliczeniowych lub magazynowych, możesz opcjonalnie skonfigurować klaster z wieloma pulami węzłów. Można na przykład użyć większej liczby pul węzłów, aby zapewnić procesory GPU dla aplikacji intensywnie obciążanych obliczeniami lub uzyskać dostęp do magazynu SSD o wysokiej wydajności. Aby uzyskać więcej informacji, zobacz Create and manage multiple node pools for a cluster in Azure Kubernetes Service.

  • Decydowanie o wymaganiach dotyczących dostępności. Co najmniej dwa zasobniki w Azure Kubernetes Service zapewniają wysoką dostępność aplikacji w przypadku awarii lub ponownego uruchomienia zasobnika. Użyj co najmniej trzech zasobników do obsługi obciążenia podczas awarii zasobników i ponownego uruchamiania. W przypadku konfiguracji klastra do spełnienia umowy dotyczącej poziomu usług na poziomie 99,95% wymagane są co najmniej dwa węzły w zestawie dostępności lub zestawie skalowania maszyn wirtualnych. Użyj co najmniej trzech zasobników, aby zapewnić planowanie zasobników podczas awarii węzłów i ponownych uruchomień.

    Aby zapewnić wyższy poziom dostępności aplikacji, klastry mogą być dystrybuowane między Strefy dostępności. Te strefy są fizycznie oddzielnymi centrami danych w danym regionie. Gdy składniki klastra są rozproszone w wielu strefach, klaster może tolerować awarię w jednej ze stref. Aplikacje i operacje zarządzania pozostają dostępne nawet wtedy, gdy w całym centrum danych wystąpi przeawarii. Aby uzyskać więcej informacji, zobacz Create an Azure Kubernetes Service (AKS) cluster that uses Strefy dostępności.

Przejdź do produkcji i zastosuj najlepsze rozwiązania dotyczące infrastruktury

Podczas przygotowywania aplikacji do produkcji należy zaimplementować minimalny zestaw najlepszych rozwiązań. Na tym etapie użyj tej listy kontrolnej. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy możesz bezbłędnie ponownie wdepchać infrastrukturę klastra?
  • Czy zastosowano limity przydziału zasobów?

Lista kontrolna:

Optymalizowanie i skalowanie

Jak zoptymalizować przepływ pracy i przygotować aplikację i zespół do skalowania, gdy aplikacja będzie w środowisku produkcyjnym? Użyj listy kontrolnej optymalizacji i skalowania, aby się przygotować. Po zakończeniu tej sekcji będziesz w stanie odpowiedzieć na następujące pytania:

  • Czy masz plan zapewnienia ciągłości działania i odzyskiwania po awarii?
  • Czy klaster może być skalowany w celu spełnienia wymagań aplikacji?
  • Czy możesz monitorować kondycję klastra i aplikacji oraz otrzymywać alerty?

Lista kontrolna: