Energia i wydajność

Ukończone

Wiele serwerów jest zwirtualizowanych i skonsolidowanych w postaci mniejszych hostów fizyczne w celu zwiększenia wykorzystania i obniżenia kosztów związanych z energią. To ulepszenie jest przydatne, ale popyt na usługi związane z IT w organizacji nadal rośnie. Liczba internetowych startów z proporcjonalnie większym popytem na sprzęt IT również nadal rośnie.

Wykorzystanie serwera

Aby zobaczyć, dlaczego użycie serwera jest ważne, dowiedz się więcej na temat zużycia energii, gdy serwer jest bezczynny (procesory nie wykonują żadnych operacji, ale dyski twarde obracają się, a pamięć RAM i urządzenia we/wy nadal zużywają energię) w porównaniu z maksymalnym obciążeniem serwera (gdy wszystkie procesory są wykorzystywane w 100%).

Użyj następującej formuły do oszacowania zużycia energii $ P $ przy określonym wykorzystaniu (n%):

$$ P_{n} = \left( P_{max} - P_{idle} \right) \times \frac{n}{100} + P_{idle} $$

W wyniku pomiarów empirycznych to przybliżenie jest dokładne w zakresie plus lub minus 5% wartości wykorzystania.

Jeśli organizacja chce obniżyć ogólne miesięczne koszty operacyjne, musi to zrobić zarówno w stojaku, jak i poza stojakiem. Aby zminimalizować tę drugą wartość, należy najpierw zrozumieć efektywność zużycia energii (PUE).

Efektywność zużycia energii

Jak już wiesz, centrum danych zużywa znaczną ilość energii, od kilowatów do kilku megawatów. Koszt energii jest istotnym elementem kosztów operacyjnych centrum danych i w związku z tym przyczynia się do całkowitego kosztu posiadania (TCO). Ponieważ firmy oferują więcej usług opartych na Internecie, które są obsługiwane z poziomu centrum danych, koszt energii stał się ważnym elementem kosztu usług oferowanych w Internecie. Ponadto emisje związane z centrum danych są zawsze ważną kwestią. Te czynniki gospodarcze i środowiskowe zwiększyły zainteresowanie mierzeniem i zwiększaniem efektywności energetycznej centrów danych.

Energia pobierana przez centrum danych jest udostępniana między urządzeniami IT i urządzeniami do obsługi, takimi jak wyposażenie do dystrybucji energii i chłodzenia. Efektywność energetyczna centrum danych można określić jako stosunek energii dostarczonej do urządzenia IT do całkowitej energii dostarczonej do centrum danych. Jasne i znormalizowane metryki efektywności są konieczne, aby ułatwić centrom danych zrozumienie efektywności energetycznej, zidentyfikowanie obszarów do poprawy i przeprowadzania porównań w czasie.

Konsorcjum Green Grid stworzyło miarę PUE i jej odwrotność: efektywność infrastruktury centrum danych (DCIE). Efektywność PUE to po prostu całkowita energia wprowadzana do centrum danych podzielona przez energię zużywaną przez sprzęt IT. PUE mierzy, jak efektywnie energia jest dostarczana do sprzętu IT w centrum danych.

$$ PUE = \frac{total\ data\ center\ power}{total\ IT\ equipment\ power} $$

Jeśli współczynnik PUE centrum danych to 3,0, funkcje centrum danych (na przykład dystrybucja energii i chłodzenie) wykorzystują 2 jednostki energii na każdą jednostkę dostarczoną do sprzętu IT. Im niższa wartość PUE, tym wydajniej pracują obiekty centrum danych. Idealna wartość PUE to 1,0, co wskazywałoby na wydajność 100%. Taka wydajność oznacza, że cała energia pobrana przez centrum danych zostały dostarczona do sprzętu IT.

W 2007 r. ośrodek Lawrence Berkeley National Labs (LBNL) przeprowadzić analizę zasilania 25 centrów danych (zobacz rysunek 20). Najlepsza wartość PUE wynosząca 1,14 oznaczała, że około 87% energii siedziby docierała do sprzętu IT. W najgorszym przypadku (PUE 3,0) tylko 33% energii dotarło do sprzętu IT.

PUE of 25 datacenters studied by Lawrence Berkeley National Labs, 2007.

Rysunek 20. PuE z 25 centrów danych badanych przez LBNL (Lawrence Berkeley National Labs, 2007)

Wartość PUE pozwala firmom identyfikować obszary do udoskonalenia, rozwiązywać problemy występujące w tych obszarach oraz monitorować postępy wartości PUE w czasie.

Współczynnik PUE mierzy po prostu efektywne wykorzystanie mocy. Zrozumienie, które elementy wpływają na wartość współczynnika PUE ma istotne znaczenie w procesie udoskonalania praktyk stosowanych podczas projektowania centrum danych. Wartość PUE nie jest wystarczająca jako jedyna miara, ponieważ nie uwzględnia obciążenia sprzętu IT. Jeśli współczynnik PUE jest niski, ale sprzęt IT nie wykonuje użytecznej pracy, centrum danych traci pieniądze. Niektóre najnowsze rozwiązania obejmują wykorzystanie metryki TCO, która stanowi koszt serwera, czyli łączny koszt energii zużywanej przez ten serwer podczas wykonywania określonego obciążenia w ramach cyklu eksploatacji. Korzystając z tego podejścia, centra danych będą korzystać z optymalizacji specyficznych dla aplikacji, co może prowadzić do efektywniejszego wykorzystania sprzętu centrum danych.

Gałęzie jednostek PDU

W wcześniejszym module przedstawiliśmy wprowadzenie dotyczące jednostki PDU (jednostki dystrybucji zasilania). Wiesz już więcej na temat nieefektywności związanej z wieloma konwersjami. W tej sekcji przedstawiamy zalety korzystania z trzech faz i niektóre typowe pułapki, których należy unikać podczas wybierania rozmiaru i liczby jednostek PDU. Zapoznanie się z tą sekcją jest opcjonalne, ponieważ zawiera ona szczegółowe informacje z dziedziny inżynierii elektrycznej.

Istnieje kilka typów dystrybucji zasilania: poziom stojaka, poziom rzędu i poziom pomieszczenia. Wszystkie z nich mają wejściowe źródło elektryczny i zapewniają co najmniej jeden obwód gałęzi, a każda gałąź jest chroniona przez wyłącznik (urządzenie zabezpieczające, które zostanie uruchomione w przypadku wystąpienia przeciążenia powodującego zatrzymanie przepływu energii elektrycznej). Różnica w przypadku jednostek PDU na poziomie rzędu polega na tym, że obsługują one większe napięcie i wyjściem do mniejszego napięcia przy użyciu transformatora. (Transformatory generują ciepło, dlatego można wewnątrz jednostki PDU na poziomie rzędu również znaleźć wentylatory chłodzące).

Row-level and rack-level PDUs.

Rysunek 22. Jednostki PDU na poziomie wiersza i stojaka

Zasilanie trójfazowe (często oznaczane grecką literą Fi [3Φ]) jest związane ze sposobem generowania i przesyłana prądu zmiennego. Każda faza to fala sinusoidalna, a fale są oddalone od siebie o 120 stopni. Zasilanie trójfazowe nie jest przeważnie używane w domach domu, ale jest ono powszechne w budynkach przemysłowych. Należy je również stosować w każdym nowoczesnym centrum danych. Ważne jest, aby wszystkie fazy były ładowane jak najbardziej równomiernie. Nie należy podłączać wszystkich serwerów do jednej gałęzi przed przejściem do następnej — w zamian należy zrobić to etapowo. Całkowita moc, którą może obsłużyć obwód trójfazowy, jest większa niż w przypadku pojedynczej fazy (1Φ) dla każdego przewodu miedzianego (ta sama grubość lub miernik).

Faza Pobór mocy Niezbędne przewody Liczba watów i przewód
$ W = V \times I $ Faza, zero, uziemienie 1,0x
$ W = 3 \times \frac{V_{line} \times I_{line}}{\sqrt{3}} $ Faza 1, faza 2, faza 3, zero, uziemienie 1,8x

Na przykład, gdy $V$ = 120 woltów i $I$ = 15 amperów, moc jednofazowa = 1800 W na trzy przewody. Gdy $V$ = 208 woltów i $I$ = 15 amperów, moc trójfazowa = 5410 W na pięć przewodów. (Pamiętaj, że tylko bieżąca wartość na amper określa wymaganą grubość przewodu miedzianego).

Znajomość maksymalnej mocy każdej gałęzi jest ważna w przypadku wybierania liczby i rozmiaru jednostek PDU zasilających sprzęt IT. Amerykańskie standardy stanowią, że prąd linii nie powinien przekraczać 80% klasyfikacji wyłącznika (lub bezpiecznika).

Etykieta (ampery) 15 20 30 50 70
Obniżony limit 80% 12 16 24 40 56

Serwer rzadko zużywa liczbę watów, przy użyciu której sklasyfikowano jego źródło zasilania. Na przykład jednostka PSU ma etykietę 975 W, ale serwer może zużyć tylko 650 W przy maksymalnej pojemności. Z tego powodu warto przeprowadzić pomiary energii dla każdego nowego modelu serwera przy różnych obciążeniach (bezczynność, 25%, 50%, 75%, 100%) przed wprowadzeniem go do środowiska produkcyjnego.

W przypadku projektowania systemu nadmiarowego często istnieje wiele niezależnych ścieżek od źródła energii do sprzętu IT. Nadmiarowe systemy zasilania (i chłodzenia) można traktować jak dyski twarde w macierzy RAID. Pamiętaj, że dublowana macierz RAID 1 wytrzymuje awarię dysku, ale tracisz również połowę pojemności. Jest to analogiczne do nadmiarowości $2N$ — nie można załadować pojedynczego składnika (na przykład zasilacza awaryjnego UPS, generatora, jednostki PDU) więcej niż 50% oryginalnej pojemności. Macierz RAID 5 również wytrzymuje awarię pojedynczego dysku, ale w celu uzyskania większego wykorzystania poszczególnych dysków, czyli nadmiarowości $N+$1 w przypadku urządzeń zasilających i HVAC. Pozostałe (działające) jednostki muszą obsłużyć obciążenie uszkodzonej jednostki.

Na przykład masz obciążenie 100 kW i chcesz korzystać z nadmiarowych zasilaczy awaryjnych UPS. W systemie $2N $ masz dwa zasilacze awaryjne UPS, z których każdy może korzystać z mocy 100 kW, ale ich normalne obciążenie wynosi 50 kW. Jeśli zamiast tego używasz trzech zasilaczy awaryjnych UPS, każdy z nich może być mniejszy i może obsłużyć 50 kW przy zwykłym obciążeniu wynoszącym 33 kW. W takim przypadku wykorzystanie jest wyższe (66% zamiast 50%), więc zasilacz UPS również będzie działać wydajniej.

Chociaż obudowa blokowa i kilka większych serwerów 4U i 5U mają źródła energii typu $N+$1 zasilaczy, większość serwerów i sprzętu sieciowego projektuje się przy użyciu nadmiarowych źródeł danych $2N$. Z tego powodu w tradycyjnym centrum danych można uruchamiać dwa niezależne źródła energii do każdego stojaka. W ten sposób w przypadku utraty energii z jednego źródła będzie można korzystać z drugiego. Należy jednak zachować ostrożność, ponieważ w przypadku niepowodzenia jednego z dwóch źródeł drugi ma podwojone obciążenie. Nieprawidłowe założenia często prowadzą do przeładowania obwodu gałęzi, co byłoby niezauważalne w normalnych warunkach. Gdy występuje pojedyncza awaria, ma efekt kaskadowy: następuje przeciążenie pozostałych gałęzi i wyzwolenie wyłączników. Ta pojedyncza awaria prowadzi do całkowitej utraty zasilania przez niektóre lub wszystkie serwery w stojaku.


Odwołania

  1. Google. Wydajność: Jak inni mogą to zrobić

Sprawdź swoją wiedzę

1.

Jeśli maksymalny pobór mocy na serwerze wynosi 300, a pobór mocy w stanie bezczynności to 200 W, jaki jest przybliżony pobór mocy przy 5% zużyciu?

2.

W organizacji znajduje się 200 serwerów, z których każdy ma średni stopień wykorzystania procesora CPU wynoszący 10% z wartości Pidle 200 W i Pmax 300 W. W przypadku zwirtualizowania tych serwerów i skonsolidowanych ich w postaci 40 większych serwerów z wartościami Pidle 250 W i Pmax 800 W i średnim wykorzystaniu wynoszącym 50% dla każdego z nich, jak dużo energii (w watach) możesz zaoszczędzić?

3.

Jeśli efektywność zużycia energii w centrum danych to 2,0, a serwer w tym centrum danych wymaga 500 W mocy, jaka jest moc (w watach) z sieci zasilającej, która jest wymagana do dostarczenia 500 W do serwera?

4.

Który z poniższych elementów jest mierzony przy użyciu efektywności zużycia energii (PUE)?

5.

Masz 12 serwerów, z których każdy ma 1 procesor PSU, mierzony w celu maksymalnego użycia 500 W. Masz również trzyfazowe 208-V jednostki PDU z wieloma gałęziami, z których każda ma wyłącznik 20-A. Ile gałęzi PDU będziesz potrzebować do zasilania 12 serwerów?

6.

Jakie jest normalne obciążenie (w kilowatach) każdego zasilacza awaryjnego UPS?

7.

Jakie jest maksymalne obciążenie (w kilowatach), które powinien obsługiwać każdy zasilacz awaryjny UPS?

8.

Czy będzie to wystarczające w normalnych warunkach (obydwa źródła aktywne)?

9.

Czy będzie to wielkość wystarczająca (i zgodna z kodem elektrycznym), jeśli nastąpi awaria źródła zasilania A?