Klasszikus Jupyter Notebook használata a Pythonhoz készült Databricks-Csatlakozás

Cikk
03/01/2024

Megjegyzés:

Ez a cikk a Databricks Runtime 13.0-s és újabb verziókhoz készült Databricks Csatlakozás ismerteti.

Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás Pythonhoz a klasszikus Jupyter Notebookkal. A Databricks Csatlakozás lehetővé teszi népszerű notebookkiszolgálók, azonosítók és egyéb egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.

Megjegyzés:

A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.

A Databricks Csatlakozás klasszikus Jupyter Notebookkal és Pythonnal való használatához kövesse az alábbi utasításokat.

A klasszikus Jupyter Notebook telepítéséhez a Python virtuális környezet aktiválásával futtassa a következő parancsot a terminálról vagy a parancssorból:
```
pip3 install notebook
```
A klasszikus Jupyter Notebook webböngészőben való elindításához futtassa az alábbi parancsot az aktivált Python virtuális környezetből:
```
jupyter notebook
```
Ha a klasszikus Jupyter Notebook nem jelenik meg a webböngészőben, másolja ki a virtuális környezetből localhost kiinduló VAGY 127.0.0.1 onnan származó URL-címet, és írja be a webböngésző címsorába.
Hozzon létre egy új jegyzetfüzetet: a klasszikus Jupyter Notebookban a Fájlok lapon kattintson az Új > Python 3 (ipykernel) elemre.
A jegyzetfüzet első cellájába írja be a példakódot vagy a saját kódját. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.
A jegyzetfüzet futtatásához kattintson az Összes cellafuttatás > gombra. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.
A jegyzetfüzet hibakereséséhez adja hozzá a következő kódsort a jegyzetfüzet elején:

from IPython.core.debugger import set_trace

Ezután hívja meg set_trace() a hibakeresési utasítások megadását a jegyzetfüzet végrehajtásának ezen pontján. Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.
A klasszikus Jupyter Notebook leállításához kattintson a Fájlbezárás > és a Leállítás gombra. Ha a klasszikus Jupyter Notebook-folyamat továbbra is fut a terminálban vagy a parancssorban, állítsa le ezt a folyamatot a megerősítéshez nyomja Ctrl + c le, majd írja be y .

Megosztás a következőn keresztül:

Klasszikus Jupyter Notebook használata a Pythonhoz készült Databricks-Csatlakozás

További források