Använda anteckningsböcker

En antecknings bok är en samling körbara-celler (kommandon). När du använder en bärbar dator är det främst att utveckla och köra celler.

Alla Notebook-aktiviteter stöds av UI-åtgärder, men du kan också utföra många aktiviteter med kortkommandon. Växla visning av genväg genom att klicka på  ikonen tangent bords ikon eller välja ? > genvägar.

Kortkommandon

Utveckla antecknings böcker

I det här avsnittet beskrivs hur du utvecklar Notebook-celler och navigerar i en bärbar dator.

I det här avsnittet:

Om antecknings böcker

En antecknings bok har ett verktygsfält som låter dig hantera antecknings boken och utföra åtgärder i den bärbara datorn:

Notebook-verktygsfältet

och en eller flera celler (eller kommandon) som du kan köra:

Notebook-celler

Längst till höger i en cell innehåller cell åtgärderna cell åtgärder  tre menyer: Kör, instrument panel och Redigera:

Körnings ikonInstrumentpanelRedigera

och två åtgärder: Dölj Minimera cell och ta bort Ta bort ikon.

Lägg till en cell

Om du vill lägga till en cell, musen över en cell längst upp eller längst ned och klicka på  ikonen Lägg till cell eller öppna cell menyn i anteckningsboken längst till höger, klicka på  cirkumflex och välj Lägg till cell ovanför eller Lägg till cell nedan.

Ta bort en cell

Gå till menyn cell åtgärder Cell åtgärder längst till höger och klicka på Ta bort ikon (Ta bort).

När du tar bort en cell visas som standard dialog rutan ta bort bekräftelse. Om du vill inaktivera framtida bekräftelse dialog rutor markerar du kryss rutan Visa inte detta igen och klickar på Bekräfta. Du kan också växla inställningen för bekräftelse dialog rutan med bekräftelse alternativet Aktivera borttagning av kommando i  konto ikonen > användar inställningar > Notebook-inställningar.

Du kan återställa borttagna celler genom att antingen välja redigera > ångra ta bort celler eller använda kortkommandot ( Z ).

Klipp ut en cell

Gå till cell åtgärder-menyn  cell åtgärder längst till höger, klicka på  cirkumflex och välj Klipp ut cell.

Du kan också använda kortkommandot ( X ).

Om du vill återställa borttagna celler väljer du antingen redigera > ångra klipp ut celler eller använder kortkommandot ( Z ).

Markera flera celler eller alla celler

Du kan välja intilliggande antecknings böcker med Shift + upp eller ned för föregående och nästa cell. Celler med flera markerade celler kan kopieras, klippas ut, tas bort och klistras in.

Om du vill markera alla celler väljer du redigera > markerar alla celler eller använder kommandot kommando läge genväg cmd + A.

Standard språk

Standard språket för varje cell visas i en ( )- länk bredvid namnet på antecknings boken. I följande antecknings bok är standard språket SQL.

Standard språk för Notebook

Ändra standard språk:

  1. Klicka ( ) länk. Dialog rutan Ändra standard språk visas.

    Standard språk för Notebook

  2. Välj det nya språket från List rutan standard språk .

  3. Klicka på Ändra.

  4. För att se till att befintliga kommandon fortsätter att fungera, föregås kommandon för föregående standard språk automatiskt med ett språk Magic-kommando.

Blanda språk

Du kan åsidosätta standard språket genom att ange språkets Magic-kommando %<language> i början av en cell. De magiska kommandona som stöds är: %python , %r , %scala , och %sql .

Anteckning

När du anropar ett language Magic-kommando skickas kommandot till REPL i körnings kontexten för antecknings boken. Variabler som definierats i ett språk (och därför i REPL för språket) är inte tillgängliga i REPL på ett annat språk. REPLs kan bara dela tillstånd via externa resurser, till exempel filer i DBFS eller objekt i objekt lagring.

Antecknings böcker har även stöd för några extra Magic-kommandon:

  • %sh: Gör att du kan köra Shell-kod i din bärbara dator. Om du vill att cellen ska bli felaktig om skal kommandot har en status som inte är noll, lägger du till -e alternativet. Det här kommandot körs bara på den Apache Spark driv rutinen, inte för arbets tagarna. Om du vill köra ett Shell-kommando på alla noder använder du ett init-skript.
  • %fs: Gör att du kan använda dbutils fil Systems kommandon. Se dbutils.
  • %md: Gör att du kan inkludera olika typer av dokumentation, inklusive text, bilder och matematiska formler och formler. Se nästa avsnitt.

Ta med dokumentation

Om du vill lägga till dokumentation i en bärbar dator kan du använda %md kommandot Magic för att identifiera markdown markering. Den inkluderade markdown-koden återges i HTML. Det här markdown-kodfragmentet innehåller till exempel markering för en nivå-ett-rubrik:

%md # Hello This is a Title

Den återges som en HTML-rubrik:

Rubrik för notebook-HTML

Komprimerbara rubriker

Celler som visas efter att celler som innehåller markdown-rubriker kan minimeras i rubrik cellen. Följande bild visar en nivå-till-rubrik som kallas Rubrik 1 med följande två celler som döljs i den.

Komprimerade celler

Om du vill expandera och minimera rubrikerna klickar du på + och - .

Se även dölja och Visa cell innehåll.

Du kan länka till andra antecknings böcker eller mappar i markdown-celler med relativa sökvägar. Ange href attributet för en Anchor-tagg som den relativa sökvägen, som börjar med a $ och sedan följer samma mönster som i UNIX-fil system:

%md
<a href="$./myNotebook">Link to notebook in same folder as current notebook</a>
<a href="$../myFolder">Link to folder in parent folder of current notebook</a>
<a href="$./myFolder2/myNotebook2">Link to nested notebook</a>

Visa bilder

Om du vill visa bilder som lagras i FileStoreanvänder du syntaxen:

%md
![test](files/image.png)

Anta till exempel att du har avbildnings filen för Databricks-logotypen i FileStore:

dbfs ls dbfs:/FileStore/
databricks-logo-mobile.png

När du inkluderar följande kod i en markdown-cell:

Bild i markdown cell

bilden återges i cellen:

Renderad bild

Visa matematiska ekvationer

Antecknings böcker stöder KaTeX för att Visa matematiska formler och formler. Exempel:

%md
\\(c = \\pm\\sqrt{a^2 + b^2} \\)

\\(A{_i}{_j}=B{_i}{_j}\\)

$$c = \\pm\\sqrt{a^2 + b^2}$$

\\[A{_i}{_j}=B{_i}{_j}\\]

återges som:

Renderad ekvation 1

och

%md
\\( f(\beta)= -Y_t^T X_t \beta + \sum log( 1+{e}^{X_t\bullet\beta}) + \frac{1}{2}\delta^t S_t^{-1}\delta\\)

where \\(\delta=(\beta - \mu_{t-1})\\)

återges som:

Renderad ekvation 2

Inkludera HTML

Du kan inkludera HTML i en bärbar dator med hjälp av funktionen displayHTML . Se HTML, D3 och SVG i antecknings böcker för ett exempel på hur du gör detta.

Anteckning

displayHTMLIframe hanteras från domänen databricksusercontent.com och sandbox-sandbox inkluderar allow-same-origin attributet. databricksusercontent.com måste vara tillgänglig från din webbläsare. Om det för närvarande blockeras av ditt företags nätverk, måste den vitlistas av IT.

Kommando kommentarer

Du kan ha diskussioner med samarbets partners med hjälp av kommando kommentarer.

Klicka på knappen kommentarer längst upp till höger i en antecknings bok för att växla kommentarer på sid panelen.

Växla kommentarer för antecknings boken

Så här lägger du till en kommentar till ett kommando:

  1. Markera kommando texten och klicka på kommentar bubblan:

    Öppna kommentarer

  2. Lägg till din kommentar och klicka på kommentar.

    Lägg till kommentar

Om du vill redigera, ta bort eller svara på en kommentar klickar du på kommentaren och väljer en åtgärd.

Redigera kommentar

Ändra cell visning

Det finns tre visnings alternativ för antecknings böcker:

  • Standardvy: resultat visas omedelbart efter kod celler
  • Endast resultat: endast resultat visas
  • Sida vid sida: kod-och resultat celler visas sida vid sida med resultat till höger

Gå till Visa-menyn Visa-menyn för att välja visnings alternativ.

sida-vid-sida-vy

Visa rad-och kommando nummer

Om du vill visa rad nummer eller kommando nummer går du till  menyn Visa meny och väljer Visa rad nummer eller Visa kommando nummer. När de har visats kan du dölja dem igen från samma meny. Du kan också aktivera rad nummer med kortkommando CTRL + L.

Visa rad-eller kommando nummer via Visa-menyn

Rad-och kommando nummer har Aktiver ATS i Notebook

Om du aktiverar rad-eller kommando nummer sparar Databricks dina inställningar och visar dem i alla andra antecknings böcker för webbläsaren.

Kommando numren ovanför cellerna länkar till det aktuella kommandot. Om du klickar på kommando numret för en cell uppdateras URL: en så att den fästs på det kommandot. Om du vill länka till ett särskilt kommando i din antecknings bok högerklickar du på kommando numret och väljer Kopiera länk adress.

Sök och ersätt text

Om du vill söka efter och ersätta text i en bärbar dator väljer du fil > Sök och ersätt.

Sök och ersätt text

Den aktuella matchningen är markerad i orange och alla andra matchningar är markerade i gult.

Matchande text

Du kan ersätta matchningar individuellt genom att klicka på Ersätt.

Du kan växla mellan matchningar genom att klicka på knapparna föregående och Nästa eller trycka på SKIFT + RETUR och RETUR för att gå till föregående respektive efterföljande matchningar.

Stäng verktyget Sök och ersätt genom att klicka på  ikonen Ta bort eller genom att trycka på ESC.

Komplettera automatiskt

Du kan använda Azure Databricks funktioner för automatisk komplettering för att automatiskt slutföra kod segment när du anger dem i celler. Detta minskar det du måste komma ihåg och minimerar den mängd du behöver göra. Azure Databricks stöder två typer av Autoavsluta i din bärbara dator: lokal och server.

Lokal komplettering Slutför ord som finns i antecknings boken. Server kompletteringen är mer kraftfull eftersom den har åtkomst till klustret för definierade typer, klasser och objekt, samt SQL-databas och tabell namn. Om du vill aktivera automatisk komplettering av servern måste du koppla en antecknings bok till ett kluster och köra alla celler som definierar objekt som kan utföras.

Viktigt

Serverns komplettera automatiskt i R-anteckningsboker blockeras under kommando körningen.

Du aktiverar Autoavsluta genom att trycka på TABB när du har angett ett objekt som går att slutföra. När du t. ex. har definierat och kört cellerna som innehåller definitionerna för MyClass och, kan du instance instance slutföra metoderna och en lista med giltiga slut för ande visas när du trycker på TABB.

Aktivera Komplettera automatiskt

Ifyllning av typ och SQL-databas och tabell namn fungerar på samma sätt.

Typ av komplettering — — SQL-komplettering

Formatera SQL

Azure Databricks innehåller verktyg som gör att du kan formatera SQL-kod i Notebook-celler snabbt och enkelt. De här verktygen minskar arbetet för att se till att koden är formaterad och hjälper till med samma kod standarder i dina bärbara datorer.

Du kan utlösa formateringen på följande sätt:

  • Enskilda celler

    • Kortkommando: Tryck på cmd + Shift + F.

    • Kommando snabb meny: Välj format-SQL i list rutan kommando kontext i en SQL-cell. Det här objektet är endast synligt i SQL-anteckningsbokens celler och de med ett %sql språk Magic.

      Formaterar SQL från kommando kontext

  • Flera celler

    Markera flera SQL-celler och välj sedan Redigera > formatera SQL-celler. Om du väljer celler på fler än ett språk formateras endast SQL-celler. Detta inkluderar de som använder %sql .

    Formatera SQL från Redigera-menyn

Här är den första cellen i föregående exempel efter formatering:

Efter formatering av SQL

Visa innehålls förteckning

Om du vill visa en automatiskt genererad innehålls förteckning klickar du på pilen längst upp till vänster i antecknings boken (mellan marginal listen och den översta cellen). Innehålls förteckningen genereras från de markdown-rubriker som används i antecknings boken.

Öppna TOC

Klicka på pilen till vänster om du vill stänga innehålls förteckningen.

Stäng innehålls förteckning

Köra antecknings böcker

I det här avsnittet beskrivs hur du kör en eller flera Notebook-celler.

I det här avsnittet:

Krav

Antecknings boken måste vara ansluten till ett kluster. Om klustret inte körs, startas klustret när du kör en eller flera celler.

Köra en cell

I cell åtgärder-menyn  cell åtgärder längst till höger klickar du på  ikonen kör och väljer Kör cell eller trycker på SKIFT + RETUR.

Viktigt

Den maximala storleken för en Notebook-cell, både innehåll och utdata, är 16 MB.

Prova till exempel att köra det här python-kodfragmentet som refererar till den fördefinierade spark variabeln.

spark

och kör sedan en del verklig kod:

1+1 # => 2

Anteckning

Antecknings böcker har ett antal standardinställningar:

  • När du kör en cell bifogas antecknings boken automatiskt till ett kluster som körs utan att du behöver göra något.
  • När du trycker på SKIFT + RETUR rullar antecknings boken automatiskt till nästa cell om cellen inte är synlig.

Om du vill ändra inställningarna väljer du  konto ikon > användar inställningar > Notebook-inställningar och konfigurerar respektive kryss rutor.

Kör alla ovan eller nedan

Om du vill köra alla celler före eller efter en cell går du till cell åtgärder-menyns  cell åtgärder längst till höger, klickar på  Kör-menyn och väljer Kör alla ovan eller Kör alla nedan.

Kör alla nedan innehåller den cell som du befinner dig i. Kör alla ovan inte.

Kör alla celler

Om du vill köra alla celler i en antecknings bok väljer du Kör alla i verktygsfältet antecknings bok.

Viktigt

Kör inte alla om stegen för att montera och demontera finns i samma bärbara dator. Det kan leda till ett konkurrens tillstånd och eventuellt skada monterings punkterna.

Visa flera utdata per cell

Python-anteckningsböcker och %python celler i icke-python-anteckningsböcker stöder flera utdata per cell.

Flera utdata i en cell

Den här funktionen kräver Databricks Runtime 7,1 eller senare och kan aktive ras i Databricks Runtime 7.1-7.3 genom att ställa in spark.databricks.workspace.multipleResults.enabled true . Den är aktive rad som standard i Databricks Runtime 7,4 och senare.

Fel markering för python och Scala

Python och Scala Notebooks stöder fel markering. Det vill säga att den kodrad som utlöser felet markeras i cellen. Dessutom, om fel utdata är en stacktrace, visas den cell där felet genereras i stacktrace som en länk till cellen. Du kan klicka på den här länken för att hoppa till den felaktiga koden.

Fel markering för python

Scala fel markering

Meddelanden

Aviseringar varnar dig om vissa händelser, t. ex. vilket kommando som körs för närvarande vid körning av alla celler och vilka kommandon som är i fel tillstånd. När din antecknings bok visar flera fel meddelanden, har den första länken en länk som gör att du kan ta bort alla meddelanden.

Notebook-meddelanden

Notebook-meddelanden är aktiverade som standard. Du kan inaktivera dem under  konto ikonen > användar inställningar > Notebook-inställningar.

Databricks Advisor

Databricks Advisor analyserar automatiskt kommandon varje gång de körs och visar lämpliga råd i antecknings böckerna. Aviseringarna innehåller information som kan hjälpa dig att förbättra prestanda för arbets belastningar, minska kostnaderna och undvika vanliga misstag.

Visa råd

En blå ruta med en glöd lampan-ikon signalerar att råd är tillgängliga för ett kommando. Rutan visar antalet distinkta delar av råd.

Databricks-råd

Klicka på glöd lampan för att expandera rutan och Visa råd. En eller flera delar av råd blir synliga.

Visa råd

Klicka på länken Läs mer om du vill visa dokumentationen som innehåller mer information om råd.

Klicka på länken Visa inte det här igen för att dölja råd. Råd om den här typen visas inte längre. Den här åtgärden kan återföras i inställningar för bärbara datorer.

Klicka på glöd lampan igen för att dölja råd rutan.

Tips inställningar

Öppna sidan Inställningar för bärbara datorer genom att välja  ikonen konto > användar inställningar > Notebook-inställningar eller genom att klicka på kugg hjuls ikonen i den expanderade rutan.

Inställningar för Notebook

Aktivera eller inaktivera råd genom att växla alternativet Aktivera Databricks Advisor .

Länken Återställ dolda råd visas om en eller flera typer av råd är dolda. Klicka på länken om du vill att den här typen av rådgivning ska synas igen.

Köra en bärbar dator från en annan antecknings bok

Du kan köra en bärbar dator från en annan antecknings bok med %run <notebook> kommandot Magic. Detta är ungefär detsamma som ett :load kommando i en Scala-repl på din lokala dator eller ett import uttryck i python. Alla variabler som definieras i <notebook> blir tillgängliga i din aktuella antecknings bok.

%run måste vara i själva cellen, eftersom hela Notebook-inlineen körs.

Anteckning

Du kan inte använda %run för att köra en python-fil och import de entiteter som definierats i den filen i en bärbar dator. Om du vill importera från en python-fil måste du paketera filen i ett Python-bibliotek, skapa ett Azure Databricks- bibliotek från det python-biblioteket och installera biblioteket i det kluster som du använder för att köra din bärbara dator.

Exempel

Anta att du har notebookA och notebookB . notebookA innehåller en cell som har följande python-kod:

x = 5

Även om du inte definierade x i notebookB , kan du komma åt x i notebookB när du har kört %run notebookA .

%run /Users/path/to/notebookA

print(x) # => 5

Om du vill ange en relativ sökväg, inled den med ./ eller ../ . Om notebookA och notebookB finns i samma katalog kan du till exempel köra dem från en relativ sökväg.

%run ./notebookA

print(x) # => 5
%run ../someDirectory/notebookA # up a directory and into another

print(x) # => 5

Mer komplexa interaktioner mellan antecknings böcker finns i Notebook-arbetsflöden.

Hantera antecknings boks tillstånd och resultat

När du har anslutit en antecknings bok till ett kluster och kör en eller flera celler, har din antecknings bok tillstånd och visar resultat. I det här avsnittet beskrivs hur du hanterar antecknings bokens tillstånd och resultat.

I det här avsnittet:

Rensa antecknings status och resultat

Om du vill rensa antecknings bokens tillstånd och resultat klickar du på Rensa i verktygsfältet Notebook och väljer åtgärden:

Rensa tillstånd och resultat

Hämta resultat

Som standard är hämtnings resultat aktiverat. Information om hur du växlar den här inställningen finns i Hantera möjligheten att hämta resultat från antecknings böcker. Om hämtning av resultat är inaktiverat  visas inte knappen Hämta resultat.

Hämta ett cell resultat

Du kan hämta ett cell resultat som innehåller tabell data till den lokala datorn. Klicka på Hämta resultat längst ned i cellen.

Hämta cell resultat

En CSV-fil med namnet export.csv hämtas till din standard katalog för hämtning.

Hämta fullständiga resultat

Som standard returnerar Azure Databricks 1000 rader i en DataFrame. Om det finns fler än 1000 rader, en NEDPIL Knapp ned läggs till i Hämta resultat Redigera. Hämta alla resultat från en fråga:

  1. Klicka på nedpilen bredvid  Hämta resultat och välj Hämta fullständiga resultat.

    Hämta fullständiga resultat

  2. Välj Kör igen och hämta.

    Kör om och hämta resultat igen

    När du har hämtat fullständiga resultat hämtas en CSV-fil med namnet export.csv till din lokala dator och /databricks-results mappen har en genererad mapp som innehåller fullständiga frågeresultat.

    Hämtade resultat

Dölj och Visa cell innehåll

Cell innehållet består av cell kod och resultatet av att köra cellen. Du kan dölja och Visa cell koden och resultatet med hjälp av cell åtgärder-menyn Cell åtgärder längst upp till höger i cellen.

Så här döljer du cell koden:

  • Klicka på  cirkumflex och välj Dölj kod

Om du vill dölja och Visa cell resultatet gör du något av följande:

  • Klicka på  cirkumflex och välj Dölj resultat
  • Välj Minimera cell
  • Skriv Esc > Shift + o

Om du vill visa dold cell kod eller resultat klickar du på länken Visa länkar:

Visa dold kod och resultat

Se även komprimerbara rubriker.

Isolering av bärbara datorer

Isolering av bärbara datorer avser visning av variabler och klasser mellan antecknings böcker. Azure Databricks stöder två typer av isolering:

  • Variabel och klass isolering
  • Isolering av Spark-session

Anteckning

Eftersom alla antecknings böcker som är kopplade till samma kluster körs på samma virtuella kluster datorer, även om Spark-session isolering är aktiverat, finns det ingen garanterad användar isolering i ett kluster.

Variabel och klass isolering

Variabler och klasser är bara tillgängliga i den aktuella antecknings boken. Till exempel kan två antecknings böcker som är anslutna till samma kluster definiera variabler och klasser med samma namn, men dessa objekt är distinkta.

Om du vill definiera en klass som är synlig för alla antecknings böcker som är anslutna till samma kluster definierar du klassen i en Package-cell. Sedan kan du komma åt klassen genom att använda dess fullständigt kvalificerade namn, vilket är detsamma som att komma åt en klass i en ansluten Scala eller Java-bibliotek.

Isolering av Spark -session

Alla antecknings böcker som är anslutna till ett kluster som kör Apache Spark 2.0.0 och senare har en fördefinierad variabel spark som representerar en SparkSession . SparkSession är start punkten för att använda Spark-API: er och konfigurera körnings konfigurationerna.

Isolering av Spark-session är aktiverat som standard. Du kan också använda globala temporära vyer för att dela tillfälliga vyer över bärbara datorer. Se Skapa vy eller Skapa vy. Om du vill inaktivera Spark-session isolering ställer spark.databricks.session.share du in på true i Spark-konfigurationen.

Viktigt

spark.databricks.session.shareOm du anger true bryts övervakningen som används av båda cellerna i strömmande Notebook och strömmande jobb. Specifikt:

  • Graferna i strömmande celler visas inte.
  • Jobb blockeras inte så länge en data ström körs (de är bara Slutför) och stoppar strömmen).
  • Strömmar i jobb övervakas inte för uppsägning. I stället måste du anropa manuellt awaitTermination() .
  • Det fungerar inte att anropa Display-funktionen på strömmande DataFrames.

Celler som utlöser kommandon på andra språk (det vill säga celler som använder %scala , %python , %r , och %sql ) och celler som innehåller andra antecknings böcker (det vill säga celler med %run ) ingår i den aktuella antecknings boken. Dessa celler finns därmed i samma session som andra Notebook-celler. Ett arbets flöde för bärbara datorer kör däremot en antecknings bok med en isolerad SparkSession , vilket innebär att tillfälliga vyer som definierats i en sådan antecknings bok inte syns i andra antecknings böcker

Versionskontroll

Azure Databricks har en grundläggande versions kontroll för antecknings böcker. Du kan utföra följande åtgärder för revisioner: Lägg till kommentarer, återställa och ta bort revisioner och rensa revisions historik.

Om du vill komma åt Notebook-revisioner klickar du på revisions historik längst upp till höger i antecknings bokens verktygsfält.

I det här avsnittet:

Lägg till en kommentar

Så här lägger du till en kommentar till den senaste versionen:

  1. Klicka på ändringen.

  2. Klicka på länken Spara nu .

    Spara kommentar

  3. Ange en kommentar i dialog rutan Spara Notebook-revision.

  4. Klicka på Spara. Den bärbara datorns revision sparas med den angivna kommentaren.

Återställa en revision

Återställa en revision:

  1. Klicka på ändringen.

  2. Klicka på Återställ den här ändringen.

    Återställ revision

  3. Klicka på Bekräfta. Den valda revisionen blir den senaste versionen av antecknings boken.

Ta bort en revision

Så här tar du bort en antecknings boks ändrings post:

  1. Klicka på ändringen.

  2. Klicka på pappers korgs ikonen Papperskorgen.

    Ta bort revision

  3. Klicka på Ja, radera. Den valda revisionen tas bort från antecknings bokens revisions historik.

Rensa en revisions historik

Rensa en Notebooks revisions historik:

  1. Välj fil > rensa revisions historik.

  2. Klicka på Ja, rensa. Historiken för notebook-versionen är rensad.

    Varning

    När den har rensats går det inte att återskapa revisions historiken.

Git-versions kontroll

Azure Databricks integreras också med dessa git-baserade versions kontroll verktyg: