Informacje o magazynie danych bez struktury

Ukończone

Usługa Blob Storage, czyli magazyn obiektów blob, nie jest aż tak pozbawiona struktury, jak można by sądzić po nazwie. Jest ona nazywana magazynem bez struktury, ale oznacza to, że żaden wpis w magazynie nie jest zgodny z żadnym konkretnym modelem. Na przykład jeden wpis może być filmem wideo, drugi — nagraniem dźwiękowym, trzeci — grupą plików tekstowych i tak dalej. Usługa Blob Storage przypomina strukturę plików i folderów używaną na komputerze przenośnym lub stacjonarnym.

Przykładem magazynu strukturalnego może być duża baza danych, gdzie każdy wpis w bazie danych zawiera podobne informacje i każdy wpis jest dostępny za pomocą zestawu podobnych wywołań interfejsu API. Usługa Blob Storage nie jest odpowiednim rozwiązaniem do przechowywania dużych ilości dobrze uporządkowanych danych. W przypadku tego rodzaju danych należy rozważyć zasób usługi Cosmos DB opisany w następnej lekcji.

Jeśli tworzysz konto magazynu za pomocą witryny Azure Portal, usługa Blob Storage jest domyślną opcją. Na poniższej ilustracji zwróć uwagę na użycie metafor „gorąca” i „chłodna” do określenia przeznaczenia magazynu.

Zrzut ekranu przedstawiający stronę Storage konta Azure Portal.

Określanie typu magazynu obiektów blob

Domyślnie magazyn obiektów blob ma zastosowane ustawienie ogólnego przeznaczenia. Dowolne dane kierowane na konto są przechowywane z odpowiednimi ustawieniami dostępu.

Wydajność obiektów blob można zwiększyć, określając dla nich rolę podczas przekazywania danych. Istnieją trzy role: Blokowy obiekt blob, Stronicowy obiekt blob i Uzupełnialny obiekt blob.

Zrzut ekranu przedstawiający Upload obiektu blob Azure Portal.

Zacznijmy od uzupełnialnych obiektów blob, ponieważ najłatwiej je opisać. Uzupełnialny obiekt blob, jak wskazuje jego nazwa, może służyć tylko do dołączania i doskonale nadaje się dla plików dziennika. Plik dziennika nigdy nie jest edytowany, tylko rośnie i rośnie. W chmurze jest mnóstwo miejsca.

Stronicowe obiekty blob są przeznaczone dla danych, które wymagają częstego dostępu do odczytu i zapisu. Stronicowy obiekt blob można traktować jak zdalny dysk twardy. W przypadku wszystkich danych, nad którymi praca jest w toku, stronicowy obiekt blob jest idealnym magazynem w chmurze. Najważniejszymi atutami stronicowych obiektów blob są wysoka wydajność i małe opóźnienia.

Blokowe obiekty blob są nieco bardziej złożone. W przypadku dużej ilości danych dostęp do tych danych może być bardziej wydajny, jeśli są one podzielone na bloki. Każdy blok ma unikatowy identyfikator. Masz dostęp do tego identyfikatora i możesz go użyć do odczytu i zapisu w określonym bloku. Zapis do blokowych obiektów blob może odbywać się równolegle i mogą być one przekazywane w dowolnej kolejności. Zasadniczo blokowe obiekty blob są przeznaczone do obsługi dużych ilości danych za pośrednictwem sieci. Na Twoim komputerze osobistym tak naprawdę nie ma typu magazynu, który byłby ich odpowiednikiem.

Istnieją górne ograniczenia rozmiarów stron i bloków usługi Blob Storage, ale te limity są wysokie (setki gigabajtów lub nawet terabajty). Limity te zostały zwiększone z upływem czasu. Skorzystaj z linków do dokumentacji podanych w podsumowaniu tego modułu, aby zapoznać się z bieżącymi limitami. Po osiągnięciu limitów konieczne będzie zwiększenie alokacji magazynu. Jednak w przypadku danych telemetrycznych opartych na tekście limity mogą nie być osiągane przez lata, o ile w ogóle to nastąpi.

Używanie interfejsów API do uzyskiwania dostępu do usługi Blob Storage

Dostęp do usługi Blob Storage można uzyskiwać za pośrednictwem wywołań interfejsów API. Deweloperzy mogą pisać aplikacje o dowolnej złożoności, aby odczytywać i zapisywać dane przechowywane w usłudze Blob Storage. Interfejsy API są dostępne za pośrednictwem wywołań REST, programu Azure PowerShell lub interfejsu wiersza polecenia platformy Azure. Biblioteki klienta są dostępne dla języków .NET, Java, Python, Node.js i innych.

Kwestie bezpieczeństwa danych

Usługa Azure Blob Storage jest automatycznie szyfrowana, bez dodatkowych kosztów i bez dodatkowej konfiguracji. Używany system jest nazywany szyfrowaniem usługi Storage (SSE). Ponadto dane można zabezpieczyć podczas przesyłania między aplikacją i platformą Azure przy użyciu szyfrowania po stronie klienta, protokołu HTTPS lub protokołu SMB 3.0.

Uaktualnienie do usługi Data Lake Storage Gen2

Gdy masz ogromną ilość danych, czyli dane big data w terminologii chmury, nadchodzi czas, aby rozważyć uaktualnienie z usługi Azure Blob Storage do usługi Azure Data Lake Storage. Usługa Blob Storage jest łatwo dostępna, bezpieczna i niedroga. Jednak w przypadku danych big data organizowanie danych staje się problemem. Usługa Data Lake udostępnia dodatkowe funkcje, które ułatwiają organizowanie i zabezpieczanie ogromnych ilości danych.

Aby ułatwić organizowanie danych, w usłudze Data Lake dostępna jest koncepcja o nazwie hierarchiczne przestrzenie nazw. Hierarchiczna przestrzeń nazw może być używana do hermetyzowania dużej lub małej kolekcji obiektów danych i plików. Zasadniczo dodaje ona kolejny poziom odwołania, który służy do zapewnienia bardziej wydajnego dostępu do danych.

Zabezpieczenia w usłudze Azure Data Lake są stosowane na poziomie pliku, folderu lub, w razie potrzeby, większym poziomie szczegółowości. Wszystkie funkcje zabezpieczeń i dostępu interfejsów API usługi Blob Storage mają zastosowanie do usługi Data Lake Storage.

Wreszcie usługi Data Lake Analytics, dostępne za pośrednictwem interfejsów API REST, są zoptymalizowane pod kątem danych big data. Zapytania powinny nadal działać w przyzwoitym czasie, nawet jeśli przeszukują morze danych.

Najlepsze rozwiązania

Usługa Blob Storage to domyślne rozwiązanie dla magazynu IoT w chmurze. Usługa Blob Storage jest niemal zawsze właściwym punktem wyjścia dla dowolnej inwestycji w usługę Azure IoT. Być może nigdy nie trzeba będzie rozważać innych opcji magazynu. Jednak w przypadku danych big data istnieje możliwość uaktualnienia do usługi Data Lake. Uaktualnienie należy przeprowadzić, jeśli wydajność organizowania, zabezpieczeń lub analizy staje się problemem w usłudze Blob Storage.

W następnej lekcji przyjrzyjmy się rozwiązaniu dla magazynu strukturalnego, gdy dane są bardziej podobne do bazy danych niż do kolekcji plików i folderów.

Jesteś w połowie modułu, czas na szybki sprawdzian wiedzy!

Sprawdź swoją wiedzę

1.

Która odpowiedź najlepiej opisuje architekturę lambda?

2.

Domyślnie usługa Blob Storage jest magazynem ogólnego przeznaczenia, ale może być ustawiona na jedną z trzech określonych ról. Jakie to role?