Share via


Microsoft Fabric-notebooks gebruiken

Het Microsoft Fabric-notebook is een primair code-item voor het ontwikkelen van Apache Spark-taken en machine learning-experimenten. Het is een interactief weboppervlak dat wordt gebruikt door gegevenswetenschappers en data engineers om code te schrijven die profiteert van rijke visualisaties en Markdown-tekst. Data engineers schrijven code voor gegevensopname, gegevensvoorbereiding en gegevenstransformatie. Gegevenswetenschappers gebruiken ook notebooks om machine learning-oplossingen te bouwen, waaronder het maken van experimenten en modellen, het bijhouden van modellen en implementatie.

Met een Fabric-notebook kunt u het volgende doen:

  • Ga aan de slag met nul instelinspanningen.
  • Verken en verwerkt eenvoudig gegevens met intuïtieve ervaring met weinig code.
  • Gegevens beveiligen met ingebouwde bedrijfsbeveiligingsfuncties.
  • Analyseer gegevens in onbewerkte indelingen (CSV, txt, JSON, enzovoort), verwerkte bestandsindelingen (parquet, Delta Lake, enzovoort), met behulp van krachtige Spark-mogelijkheden.
  • Wees productief met verbeterde ontwerpmogelijkheden en ingebouwde gegevensvisualisatie.

In dit artikel wordt beschreven hoe u notebooks gebruikt in data science- en data engineering-ervaringen.

Notitieblokken maken

U kunt een nieuw notitieblok maken of een bestaand notitieblok importeren.

Een nieuwe notebook maken

Net als bij andere standaardprocessen voor het maken van fabricitems kunt u eenvoudig een nieuw notitieblok maken op basis van de startpagina van Fabric Data-engineer ing, de optie Nieuw werkruimte of de hub maken.

Bestaande notebooks importeren

U kunt een of meer bestaande notitieblokken van uw lokale computer importeren in een Infrastructuurwerkruimte vanuit het Data-engineer of de startpagina van de Datawetenschap. Fabric-notebooks herkennen de standaard Jupyter Notebook .ipynb-bestanden en bronbestanden zoals .py, .scala en .sql en maken nieuwe notebookitems dienovereenkomstig.

Schermopname die laat zien waar u notitieblokopties kunt vinden in het menu Nieuw.

Een notebook exporteren

U kunt uw notitieblok exporteren naar andere standaardindelingen. Synapse-notebook kan worden geëxporteerd naar:

  • Het standaard notebookbestand (.ipynb) dat wordt gebruikt voor Jupyter-notebooks.
  • Een HTML-bestand (.html) dat rechtstreeks vanuit een browser kan worden geopend.
  • Een Python-bestand (.py).
  • Een Latex-bestand (.tex).

Schermopname die laat zien waar u een notitieblok kunt exporteren.

Een notitieblok opslaan

In Fabric wordt een notitieblok standaard automatisch opgeslagen nadat u het hebt geopend en bewerkt; U hoeft zich geen zorgen te maken over het verliezen van codewijzigingen. U kunt een kopie ook gebruiken om een andere kopie in de huidige werkruimte of naar een andere werkruimte te klonen.

Schermopname die laat zien waar een kopie moet worden opgeslagen.

Als u liever handmatig een notitieblok opslaat, kunt u overschakelen naar de optie Handmatig opslaan om een lokale vertakking van uw notitieblokitem te hebben en vervolgens Opslaan of Ctrl+s gebruiken om uw wijzigingen op te slaan.

Schermopname die laat zien waar u handmatig kunt opslaan.

U kunt ook overschakelen naar de modus voor handmatig opslaan door Bewerken -Save options ->Manual te selecteren.> Als u een lokale vertakking van uw notitieblok wilt inschakelen, slaat u deze handmatig op, selecteert u Opslaan of gebruikt u de sneltoets Ctrl+s.

Verbinding maken lakehouses en notitieblokken

Fabric-notebooks ondersteunen nu nauwe interacties met lakehouses; u kunt eenvoudig een nieuw of bestaand lakehouse toevoegen vanuit de Lakehouse Explorer.

U kunt naar verschillende lakehouses navigeren in de Lakehouse-verkenner en één lakehouse instellen als de standaardinstelling door deze vast te maken. Uw standaardwaarde wordt vervolgens gekoppeld aan de runtimewerkmap en u kunt lezen of schrijven naar het standaard lakehouse met behulp van een lokaal pad.

Schermopname die laat zien waar een standaard lakehouse moet worden vastgemaakt.

Notitie

U moet de sessie opnieuw starten nadat u een nieuw lakehouse hebt vastgemaakt of de naam van het standaard lakehouse hebt hernoemd.

Een lakehouse toevoegen of verwijderen

Als u het X-pictogram naast de naam van een lakehouse selecteert, wordt dit verwijderd uit het notitiebloktabblad, maar het lakehouse-item bestaat nog steeds in de werkruimte.

Selecteer Lakehouse toevoegen om meer lakehouses toe te voegen aan het notitieblok door een bestaande toe te voegen of door een nieuw lakehouse te maken.

Een Lakehouse-bestand verkennen

De submap en bestanden onder de sectie Tabellen en bestanden van de Lake-weergave worden weergegeven in een inhoudsgebied tussen de lakehouse-lijst en de inhoud van het notitieblok. Selecteer verschillende mappen in de sectie Tabellen en bestanden om het inhoudsgebied te vernieuwen.

Map- en bestandsbewerkingen

Als u met de rechtermuisknop een bestand (.csv, .parquet, .txt, .jpg, .png, enzovoort) selecteert, kunt u de Spark- of Pandas-API gebruiken om de gegevens te laden. Er wordt een nieuwe codecel gegenereerd en ingevoegd onder de focuscel.

U kunt eenvoudig een pad met een andere indeling kopiëren in het geselecteerde bestand of de geselecteerde map en het bijbehorende pad in uw code gebruiken.

Schermopname van het contextmenu van bestanden in Lakehouse.

Notebook-resources

De notebook-resourceverkenner biedt een Unix-achtig bestandssysteem om u te helpen bij het beheren van uw mappen en bestanden. Het biedt een schrijfbare bestandssysteemruimte waar u kleine bestanden kunt opslaan, zoals codemodules, semantische modellen en afbeeldingen. U kunt ze eenvoudig openen met code in het notebook alsof u met uw lokale bestandssysteem werkt.

GIF-animatie van notebookbronnen.

Deze ingebouwde map is een vooraf gedefinieerde map voor elk notebookexemplaren. De opslag van maximaal 500 MB blijft behouden om de afhankelijkheden van het huidige notebook op te slaan. Dit zijn de belangrijkste mogelijkheden van notebook-resources:

  • U kunt algemene bewerkingen gebruiken, zoals maken/verwijderen, uploaden/downloaden, slepen/neerzetten, naam wijzigen, dupliceren en zoeken in de gebruikersinterface.
  • U kunt relatieve paden gebruiken, zoals builtin/YourData.txt voor snelle verkenning. De mssparkutils.nbResPath methode helpt u bij het opstellen van het volledige pad.
  • U kunt uw gevalideerde gegevens eenvoudig naar een lakehouse verplaatsen via de optie Schrijven naar lakehouse . Fabric bevat ingesloten uitgebreide codefragmenten voor algemene bestandstypen, zodat u snel aan de slag kunt.
  • Deze resources zijn ook beschikbaar voor gebruik in de run case reference notebook via mssparkutils.notebook.run().

Notitie

  • Momenteel ondersteunt Fabric het uploaden van bepaalde bestandstypen via de gebruikersinterface, waaronder, .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg en .xlsx bestanden. U kunt schrijven naar de ingebouwde map met bestandstypen die niet in de lijst staan via code. Fabric-notebooks bieden echter geen ondersteuning voor het genereren van codefragmenten op niet-ondersteunde bestandstypen.
  • Elke bestandsgrootte moet kleiner zijn dan 50 MB en de ingebouwde map biedt in totaal maximaal 100 exemplaren van bestanden/mappen.
  • Wanneer u mssparkutils.notebook.run()deze gebruikt, gebruikt u de mssparkutils.nbResPath opdracht voor toegang tot de doelnotebookresource. Het relatieve pad 'builtin/' verwijst altijd naar de ingebouwde map van het hoofdnotebook.

Samenwerken in een notitieblok

Het Fabric-notebook is een gezamenlijk item dat meerdere gebruikers ondersteunt die hetzelfde notitieblok bewerken.

Wanneer u een notitieblok opent, voert u standaard de modus voor co-bewerking in en wordt elke bewerking van het notitieblok automatisch opgeslagen. Als uw collega's hetzelfde notitieblok tegelijk openen, ziet u hun profiel, voert u uitvoer uit, cursorindicator, selectie-indicator en bewerkingstracering. Met behulp van de samenwerkingsfuncties kunt u eenvoudig pairprogrammering, externe foutopsporing en begeleidingsscenario's uitvoeren.

Schermopname van een codecel met een andere gebruiker bewerken.

Een notebook delen

Het delen van een notitieblok is een handige manier om samen te werken met teamleden. Geautoriseerde werkruimterollen kunnen standaard notebooks weergeven of bewerken/uitvoeren. U kunt een notitieblok delen met de opgegeven machtigingen die zijn verleend.

  1. Selecteer Delen op de werkbalk van het notitieblok.

    Schermopname die laat zien waar u Delen kunt selecteren.

  2. Selecteer de bijbehorende categorie personen die dit notitieblok kunnen bekijken. U kunt machtigingen voor delen, bewerken of uitvoeren voor de geadresseerden kiezen.

    Schermopname die laat zien waar machtigingen moeten worden geselecteerd.

  3. Nadat u Toepassen hebt geselecteerd, kunt u het notitieblok rechtstreeks verzenden of de koppeling naar anderen kopiëren. Ontvangers kunnen het notitieblok vervolgens openen met de bijbehorende weergave die is verleend door hun machtigingsniveau.

    Schermopname die laat zien waar u een koppeling maakt en verzendt.

  4. Als u uw notitieblokmachtigingen verder wilt beheren, selecteert u de lijst>Met werkruimte-items meer opties en selecteert u vervolgens Machtigingen beheren. Vanaf dat scherm kunt u de toegang en machtigingen van het bestaande notitieblok bijwerken.

    Schermopname die laat zien waar machtigingen in de werkruimte moeten worden beheerd.

Opmerking toevoegen aan een codecel

Opmerkingen maken is een andere handige functie voor samenwerkingsscenario's. Momenteel ondersteunt Fabric het toevoegen van opmerkingen op celniveau.

  1. Selecteer de knop Opmerkingen op de notitieblokwerkbalk of celopmerkingsindicator om het opmerkingenvenster te openen.

    Schermopname die laat zien waar u Opmerking kunt selecteren.

  2. Selecteer code in de codecel, selecteer Nieuw in het opmerkingenvenster, voeg opmerkingen toe en selecteer vervolgens Opmerking posten om op te slaan.

    Schermopname die laat zien waar u Nieuw moet selecteren.

  3. Als u deze nodig hebt, zoekt u de opties Opmerking bewerken, Thread oplossen en Thread verwijderen door de optie Meer naast uw opmerking te selecteren.

Anderen taggen in een opmerking

'Taggen' verwijst naar het vermelden en melden van een gebruiker in een opmerkingenthread, waardoor de samenwerking efficiënt wordt verbeterd voor de specifieke gegevens.

  1. Selecteer een codesectie in een cel en een nieuwe discussielijn voor opmerkingen.

  2. Voer de gebruikersnaam in en kies de juiste in de lijst met suggesties als u iemand wilt vermelden voor discussie over een bepaalde sectie.

  3. Deel uw inzichten en post ze.

  4. Er wordt een e-mailmelding geactiveerd en de gebruiker klikt op de koppeling Opmerkingen openen om deze cel snel te vinden.

  5. Bovendien autoriseert en configureert u de machtigingen voor gebruikers bij het taggen van iemand die geen toegang heeft, zodat uw codeassets goed worden beheerd.

GIF-animatie van het taggen van anderen in een opmerking.

Notitie

Voor een opmerkingsitem ontvangt de getagde gebruiker geen e-mailmelding meer als u de opmerking binnen één uur bijwerken. Maar er wordt een e-mailmelding verzonden naar de nieuwe getagde gebruiker.

Schakelen tussen notitieblokmodus

Fabric-notebooks ondersteunen twee modi die u eenvoudig kunt schakelen tussen: bewerkingsmodus en weergavemodus .

Schermopname die laat zien waar schakelen tussen modi.

  • Bewerkingsmodus: U kunt de cellen bewerken en uitvoeren en samenwerken met anderen in het notitieblok.
  • Weergavemodus: u kunt alleen de celinhoud, uitvoer en opmerkingen van het notitieblok weergeven. Alle bewerkingen die wijzigingen in het notitieblok aanbrengen, zijn uitgeschakeld.