Verbessern der App-Zuverlässigkeit in Azure

Sie können SLAs verwenden, um auszuwerten, wie Ihre Azure-Lösungen Geschäftsanforderungen und die Anforderungen Ihrer Kunden und Benutzer erfüllen. Indem Sie Ihre eigenen SLAs erstellen, können Sie Leistungsziele festlegen, die Ihrer spezifischen Azure-Anwendung entsprechen. Dieser Ansatz wird als Anwendungs-SLA bezeichnet.

Informationen zu den Anforderungen Ihrer App

Zum Erstellen einer effizienten und zuverlässigen Azure-Lösung müssen Sie die Anforderung der Arbeitsauslastung kennen. Sie können dann Azure-Produkte und Dienste auswählen und Ressourcen gemäß dieser Anforderungen bereitstellen. Es ist wichtig die Azure-SLAs zu verstehen, die die Leistungsziele für die Azure-Produkte und -Dienste in Ihrer Lösung definieren. Dieses Wissen hilft Ihnen beim Erstellen erreichbarer Anwendungs-SLAs.

In einem verteilten System kommt es unweigerlich zu Fehlern. Hardware kann ausfallen. Im Netzwerk können vorübergehende Fehler auftreten. In seltenen Fällen kann ein gesamter Dienst oder eine Region ausfallen, aber auch hierfür muss ein Plan vorhanden sein.

Resilienz

Die Resilienz beschreibt die Möglichkeit, nach Ausfällen für ein System eine Wiederherstellung durchzuführen und die Betriebsbereitschaft sicherzustellen. Es geht nicht um das Vermeiden von Ausfällen, sondern um das Reagieren auf Ausfälle, um Ausfallzeiten oder Datenverluste zu vermeiden. Das Ziel der Resilienz besteht darin, die volle Funktionsfähigkeit der Anwendung nach einem Ausfall wiederherzustellen. Die Hochverfügbarkeit und die Notfallwiederherstellung sind zwei wichtige Komponenten der Resilienz.

Beim Entwerfen Ihrer Architektur müssen Sie die Resilienz berücksichtigen. Außerdem sollten Sie eine Fehlermodusanalyse (FMA) durchführen. Das Ziel einer FMA ist die Identifizierung von möglichen Fehlerpunkten und das Definieren der Reaktion der Anwendung auf diese Fehler.

Kosten und Komplexität in Relation zur Hochverfügbarkeit

Die Verfügbarkeit bezieht sich auf die Zeit, in der ein System funktioniert und erreichbar ist. Zum Maximieren der Verfügbarkeit müssen Maßnahmen implementiert werden, die mögliche Dienstausfälle verhindern. Das Entwickeln von vorbeugenden Maßnahmen kann jedoch schwierig und kostspielig sein, und resultiert häufig in komplexen Lösungen.

Je komplexer Ihre Lösung wird, desto mehr Dienste hängen voneinander ab. Aus diesem Grund können Sie mögliche Fehlerpunkte in Ihrer Lösung übersehen, wenn Sie über mehrere unabhängige Dienste verfügen.

Tipp

Beispiel: Eine Arbeitsauslastung, die eine Betriebszeit von 99,99 % erfordert, sollte nicht von einem Dienst mit einer SLA von 99,9 % abhängig sein.

Die meisten Anbieter bevorzugen das Maximieren der Verfügbarkeit ihrer Azure-Lösungen, indem sie die Ausfallzeit minimieren. Durch das Erhöhen der Verfügbarkeit erhöhen Sie jedoch auch die Kosten und Komplexität Ihrer Lösung.

Tipp

Beispiel: Eine SLA, die eine Betriebszeit von 99,999 % definiert, erlaubt nur etwa 5 Minuten Gesamtausfallzeit pro Jahr.

Das Risiko potenzieller Ausfallzeiten ist für mehrere verschiedene SLA-Ebenen kumulativ, d. h., dass komplexe Lösungen zu größeren Herausforderungen bei der Verfügbarkeit führen. Aus diesem Grund bestimmt, wie wichtig die Hochverfügbarkeit für Ihre Anforderungen ist, wie Sie erhöhte Komplexität und Kosten für Ihre Anwendungs-SLA verarbeiten.

Überlegungen zum Definieren von Anwendungs-SLAs

  • Wenn Ihre Anwendungs-SLA die Verfügbarkeitsklasse 4 (99,99 %) als Leistungsziel definiert, ist die Wiederherstellung bei Fehlern durch einen manuellen Eingriff möglicherweise nicht ausreichend, um Ihre SLA zu erfüllen. Stattdessen muss Ihre Azure-Lösung Selbstdiagnosen und Selbstreparaturen durchführen können.
  • Es ist schwierig, schnell genug auf Fehler zu reagieren, um SLA-Leistungsziele ab der Verfügbarkeitsklasse 4 zu erfüllen.
  • Sie sollten genau überlegen, mit welchem Zeitfenster die Leistungsziele Ihrer Anwendungs-SLA verglichen werden. Je kürzer das Zeitfenster, umso geringer fallen die Toleranzen aus. Wenn Sie Ihre Anwendungs-SLA als stündliche oder tägliche Betriebszeit definieren, müssen Sie wissen, dass diese engen Toleranzen möglicherweise zu nicht erreichbaren Leistungszielen führen.