Megosztás a következőn keresztül:


Klasszikus Jupyter Notebook használata a Pythonhoz készült Databricks-Csatlakozás

Megjegyzés:

Ez a cikk a Databricks Runtime 13.0-s és újabb verziókhoz készült Databricks Csatlakozás ismerteti.

Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás Pythonhoz a klasszikus Jupyter Notebookkal. A Databricks Csatlakozás lehetővé teszi népszerű notebookkiszolgálók, azonosítók és egyéb egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.

Megjegyzés:

A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.

A Databricks Csatlakozás klasszikus Jupyter Notebookkal és Pythonnal való használatához kövesse az alábbi utasításokat.

  1. A klasszikus Jupyter Notebook telepítéséhez a Python virtuális környezet aktiválásával futtassa a következő parancsot a terminálról vagy a parancssorból:

    pip3 install notebook
    
  2. A klasszikus Jupyter Notebook webböngészőben való elindításához futtassa az alábbi parancsot az aktivált Python virtuális környezetből:

    jupyter notebook
    

    Ha a klasszikus Jupyter Notebook nem jelenik meg a webböngészőben, másolja ki a virtuális környezetből localhost kiinduló VAGY 127.0.0.1 onnan származó URL-címet, és írja be a webböngésző címsorába.

  3. Hozzon létre egy új jegyzetfüzetet: a klasszikus Jupyter Notebookban a Fájlok lapon kattintson az Új > Python 3 (ipykernel) elemre.

  4. A jegyzetfüzet első cellájába írja be a példakódot vagy a saját kódját. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.

  5. A jegyzetfüzet futtatásához kattintson az Összes cellafuttatás > gombra. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.

  6. A jegyzetfüzet hibakereséséhez adja hozzá a következő kódsort a jegyzetfüzet elején:

    from IPython.core.debugger import set_trace

    Ezután hívja meg set_trace() a hibakeresési utasítások megadását a jegyzetfüzet végrehajtásának ezen pontján. Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.

  7. A klasszikus Jupyter Notebook leállításához kattintson a Fájlbezárás > és a Leállítás gombra. Ha a klasszikus Jupyter Notebook-folyamat továbbra is fut a terminálban vagy a parancssorban, állítsa le ezt a folyamatot a megerősítéshez nyomja Ctrl + c le, majd írja be y .