OneLake, OneDrive for Data

OneLake on yksi, yhdistetty looginen Data Lake -tallennustila koko organisaatiolle. OneDriven tavoin OneLake tulee automaattisesti kaikkien Microsoft Fabric -vuokraajien mukana, ja se on suunniteltu käytettäväksi kaikissa analytiikkatiedoissasi yhdessä paikassa. OneLake tuo asiakkaat:

  • Yksi Data Lake -tallennustila koko organisaatiolle
  • Yksi kopio tiedoista käytettäväksi useiden analyysimoottoreiden kanssa

Yksi Data Lake -tallennustila koko organisaatiolle

Ennen OneLakea asiakkaiden oli helpompi luoda useita järviä eri liiketoimintaryhmille sen sijaan, että he olisivat tehneet yhteistyötä yksittäisen järven parissa, vaikka useiden resurssien hallinta lisäisi kuormitusta. OneLake keskittyy näiden haasteiden poistamiseen parantamalla yhteistyötä. Jokaisella asiakasvuokraajalla on täsmälleen yksi OneLake. Kangasta ei voi olla enempää kuin yksi, ja jos sinulla on Fabric, se ei voi koskaan olla nolla. Jokainen Fabric-vuokraaja valmistaa automaattisesti OneLaken ilman lisäresursseja määritettäväksi tai hallittavaksi.

Oletusarvoisesti jaettua omistajuutta yhteistyötä varten

Vuokraajan käsite on SaaS-palvelun ainutlaatuinen etu. Tieto siitä, mistä asiakkaan organisaatio alkaa ja päättyy, tarjoaa luonnollisen hallinnan ja vaatimustenmukaisuuden rajan, joka on vuokraajan järjestelmänvalvojan hallinnassa. Kaikkia OneLakeen tallennettuja tietoja hallitaan oletusarvoisesti. Vaikka kaikki tiedot ovat vuokraajan järjestelmänvalvojan määrittämien rajojen sisällä, on tärkeää, että tästä järjestelmänvalvojasta ei tule keskitettyä portinvartijaa, joka estää muita organisaation osia osallistumasta OneLakeen.

Vuokraajassa voi luoda minkä tahansa määrän työtiloja. Työtilojen avulla organisaation eri osat voivat jakaa omistajuus- ja käyttöoikeuskäytäntöjä. Kukin työtila on osa kapasiteettia, joka on sidottu tiettyyn alueeseen ja laskutetaan erikseen.

Diagram showing the function and structure of OneLake.

Työtilassa voit luoda tietokohteita ja käyttää OneLaken kaikkia tietoja tietokohteiden kautta. Kuten Office tallentaa Word-, Excel- ja PowerPoint-tiedostoja OneDriveen, Fabric tallentaa Lakehouse-tallennustilat, varastot ja muut OneLake-kohteet. Kohteet voivat luoda räätälöityjä kokemuksia kullekin persoonalle, kuten Spark-kehittäjäkokemuksen lakehousessa.

Lisätietoja OneLaken käytön aloittamisesta on kohdassa Lakehousen luominen OneLaken avulla.

Avaa kaikilla tasoilla

OneLake on avoinna kaikilla tasoilla. OneLake on rakennettu Azure Data Lake Tallennus (ADLS) Gen2:n päälle, ja se voi tukea mitä tahansa tiedostotyyppiä, jäsennettyä tai rakenteettomaa. Kaikki Fabric-tietokohteet, kuten tietovarastot ja lakehouset, tallentavat tietonsa automaattisesti OneLake-muotoon Delta Parquet -muodossa. Jos tietoteknikko lataa tiedot Lakehouseen Sparkin avulla ja SQL-kehittäjä sitten lataa T-SQL:n avulla tiedot täysin tapahtumapohjaiseen tietovarastoon, molemmat osallistuvat samaan Data Lake -tallennustilaan. OneLake tallentaa kaikki taulukkomuotoiset tiedot Delta Parquet -muodossa.

OneLake tukee samoja ADLS Gen2 -ohjelmointirajapintoja ja SDK-ohjelmointirajapintoja, jotka ovat yhteensopivia olemassa olevien ADLS Gen2 -sovellusten, kuten Azure Databricksin, kanssa. Voit käsitellä tietoja OneLakessa ikään kuin se olisi yksi suuri ADLS-tallennustili koko organisaatiolle. Jokainen työtila näkyy säilönä kyseisellä tallennustilillä, ja eri tietokohteet näkyvät kansioina kyseisissä säilöissä.

Diagram showing how you can access OneLake data with APIs and SDKs.

Katso lisätietoja ohjelmointirajapinnoista ja päätepisteistä kohdasta OneLake-käyttöoikeus ja ohjelmointirajapinnat. Esimerkkejä Azuren OneLake-integroinnista on artikkeleissa Azure Synapse Analytics, Azure-tallennustilan hallinta, Azure Databricks ja Azure HDInsight .

OneLake-resurssienhallinta Windowsille

OneLake on OneDrive for Data. OneDriven tavoin voit helposti tutkia OneLake-tietoja Windowsista Käyttämällä Windowsin OneLake-resurssienhallintaa . Voit siirtyä kaikissa työtiloissa ja tietokohteissa, ladata, ladata tai muokata tiedostoja helposti samalla tavalla kuin Officessa. OneLake-tiedostonhallinta yksinkertaistaa Data Lake -tallennustilojen käyttöä, jolloin niitä voi käyttää myös ammattitautetuille yrityskäyttäjille.

Lisätietoja on artikkelissa OneLake-resurssienhallinta.

Yksi tietojen kopio

OneLake pyrkii antamaan sinulle mahdollisimman suuren arvon yksittäisestä tietojen kopiosta ilman tietojen siirtämistä tai monistamista. Sinun ei enää tarvitse kopioida tietoja vain käyttääksesi niitä toisen moduulin kanssa tai hajottaaksesi siiloja, jotta voit analysoida tietoja muista lähteistä peräisin olleilla tiedoilla.

Pikanäppäimet yhdistävät tietoja toimialueiden välillä ilman tietojen siirtoa

Pikakuvakkeiden avulla organisaatiosi voi helposti jakaa tietoja käyttäjien ja sovellusten välillä ilman, että tietoja tarvitsee siirtää ja monistaa tarpeettomasti. Kun tiimit toimivat itsenäisesti erillisissä työtiloissa, pikakuvakkeiden avulla voit yhdistää tietoja eri liiketoimintaryhmistä ja toimialueista virtuaaliseen tietotuotteeseen käyttäjän erityistarpeiden mukaan.

Pikakuvake on viittaus muihin tiedostosijainteihin tallennettuihin tietoihin. Nämä tiedostosijainnit voivat olla samassa työtilassa tai eri työtiloissa, OneLakessa tai OneLaken ulkopuolella ADLS:ssä, S3:ssa tai Dataversessa. Kohdesijainteja on tulossa pian lisää. Sijainnista riippumatta pikakuvakkeiden avulla tiedostot ja kansiot näyttävät siltä, että ne on tallennettu paikallisesti.

Diagram showing how shortcuts connect data across workspaces and items.

Lisätietoja pikakuvakkeiden käyttämisestä on artikkelissa OneLake-pikakuvakkeet.

Yksi tietojen kopio useilla analyyttisillä moottoreilla

Vaikka sovelluksissa saattaa olla tallennustilan ja tietojenkäsittelyn erittely, tiedot on usein optimoitu yhdelle moduulille, mikä vaikeuttaa samojen tietojen uudelleenkäyttöä useissa sovelluksissa. Fabric-funktiolla eri analysointimoottorit (T-SQL, Spark, Analysis Services jne.) tallentavat tietoja avoimeen Delta Parquet -muotoon, jotta voit käyttää samoja tietoja useissa moottoreissa.

Sinun ei enää tarvitse kopioida tietoja vain käyttääksesi niitä toisen moduulin kanssa. Pystyt aina valitsemaan parhaan moottorin sille työlle, jota yrität tehdä. Kuvitellaan esimerkiksi, että sinulla on RYHMÄ SQL-insinöörejä, jotka rakentavat täysin tapahtumakohtaisen tietovaraston. He voivat käyttää T-SQL-moduulia ja T-SQL:n tehoa taulukoiden luomiseen, tietojen muuntamiseen ja tietojen lataamiseen taulukoihin. Jos tietotutkija haluaa hyödyntää näitä tietoja, hänen ei enää tarvitse käydä läpi erityistä Spark/SQL-ohjainta. OneLake tallentaa kaikki tiedot Delta Parquet -muodossa. Tietojenkäsittelyasiantuntijat voivat käyttää Spark-moduulin ja sen avoimen lähdekoodin kirjastojen täyttä tehoa suoraan tietojen kautta.

Yrityskäyttäjät voivat luoda Power BI -raportteja suoraan OneLaken päälle käyttämällä Analysis Services -moduulin uutta Direct Lake -tilaa. Semanttisten Power BI -mallien voimana on Analysis Services -moduuli, joka on aina tarjonnut kaksi tietojen käyttötilaa: tuonnin ja suoran kyselyn. Direct Lake -tila tarjoaa käyttäjille kaiken tuonnin nopeuden ilman tietojen kopioimista, mikä yhdistää parhaan tuonnin ja suoran kyselyn. Lisätietoja on kohdassa Direct Lake.

Diagram showing how multiple items and engines use the same copy of data.

Esimerkkikaavio, joka näyttää tietojen lataamisen Sparkin avulla, kyselyn T-SQL:n avulla ja tietojen tarkastelemisen Power BI -raportissa.