sunucusuz SQL havuzu ile verileri analiz etme

bu öğreticide, sunucusuz SQL havuzuyla verileri çözümlemeyi öğreneceksiniz.

yerleşik sunucusuz SQL havuzu

sunucusuz SQL havuzları kapasiteyi ayırmak zorunda kalmadan SQL kullanmanıza olanak sağlar. sunucusuz SQL havuzun faturalandırılması, sorguyu çalıştırmak için işlenen veri miktarına bağlı olarak, sorguyu çalıştırmak için kullanılan düğümlerin sayısını temel alır.

her çalışma alanı, yerleşik olarak adlandırılan önceden yapılandırılmış bir sunucusuz SQL havuzu ile gelir.

nyc taxı verilerini sunucusuz SQL havuzuyla çözümleyin

  1. SYNAPSE Studio 'da geliştirme merkezine gidin

  2. yeni bir SQL betiği oluşturun.

  3. Aşağıdaki kodu betiğe yapıştırın.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Çalıştır'a tıklayın.

Veri araştırması yalnızca, verilerinizin temel özelliklerini anlayabileceğiniz basitleştirilmiş bir senaryodur. Bu öğreticideveri araştırması ve analizi hakkında daha fazla bilgi edinin.

Veri araştırma veritabanı oluşturma

Dosyaların içeriğine doğrudan veritabanı aracılığıyla gidebilirsiniz master . Bazı basit veri araştırma senaryolarında ayrı bir veritabanı oluşturmanız gerekmez. Ancak, veri araştırmasına devam ederken, bazı yardımcı nesneler oluşturmak isteyebilirsiniz, örneğin:

  • Depolama hesapları için adlandırılmış başvuruları temsil eden dış veri kaynakları.
  • Dış veri kaynağının kimliğini nasıl doğrulayacağınızı belirtmenizi sağlayan veritabanı kapsamlı kimlik bilgileri.
  • Bazı veri kaynaklarına veya veritabanı nesnelerine erişim izinleri olan veritabanı kullanıcıları.
  • Sorgularda kullanabileceğiniz yardımcı program görünümleri, yordamları ve işlevleri.
  1. masterÖzel veritabanı nesneleri için ayrı bir veritabanı oluşturmak üzere veritabanını kullanın. Özel veritabanı nesneleri master veritabanında oluşturulamıyor.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Önemli

    _UTF8UTF-8 metninin sütunlara doğru şekilde dönüştürülebileceğinden emin olmak için sonek içeren bir harmanlama kullanın VARCHAR . Latin1_General_100_BIN2_UTF8 , Parquet dosyalarından ve Cosmos DB kapsayıcılarından verileri okuyan sorgularda en iyi performansı sağlar.

  2. DataExplorationDBKimlik bilgileri ve veri kaynakları gibi yardımcı program nesneleri oluşturabileceğiniz yere geçiş yapın.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Not

    Bir dış veri kaynağı, kimlik bilgisi olmadan oluşturulabilir. Kimlik bilgisi yoksa, çağıranın kimliği dış veri kaynağına erişmek için kullanılacaktır.

  3. İsteğe bağlı olarak, ' Ana ' veritabanını kullanarak ' de bir kullanıcı için dış verilere erişecek bir oturum açma oluşturun DataExplorationDB :

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Ardından, oturum açma için ' de bir veritabanı kullanıcısı oluşturun DataExplorationDB ve ADMINISTER DATABASE BULK OPERATIONS izin verin.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  4. Göreli yolu ve veri kaynağını kullanarak dosyanın içeriğini araştırma:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    

Veri araştırma veritabanı yalnızca yardımcı program nesnelerinizi depoladığınız basit bir yer tutucudur. Synapse SQL havuzu, Azure veri kaynakları üzerinde oluşturulmuş ilişkisel bir katman olan bir mantıksal veri ambarı oluşturmanızı ve bu verileri oluşturmanızı sağlar. Bu öğreticidemantıksal veri ambarı oluşturma hakkında daha fazla bilgi edinin.

Sonraki adımlar