Klasszikus Jupyter Notebook használata a Pythonhoz készült Databricks-Csatlakozás
Megjegyzés:
Ez a cikk a Databricks Runtime 13.0-s és újabb verziókhoz készült Databricks Csatlakozás ismerteti.
Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás Pythonhoz a klasszikus Jupyter Notebookkal. A Databricks Csatlakozás lehetővé teszi népszerű notebookkiszolgálók, azonosítók és egyéb egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.
Megjegyzés:
A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.
A Databricks Csatlakozás klasszikus Jupyter Notebookkal és Pythonnal való használatához kövesse az alábbi utasításokat.
A klasszikus Jupyter Notebook telepítéséhez a Python virtuális környezet aktiválásával futtassa a következő parancsot a terminálról vagy a parancssorból:
pip3 install notebook
A klasszikus Jupyter Notebook webböngészőben való elindításához futtassa az alábbi parancsot az aktivált Python virtuális környezetből:
jupyter notebook
Ha a klasszikus Jupyter Notebook nem jelenik meg a webböngészőben, másolja ki a virtuális környezetből
localhost
kiinduló VAGY127.0.0.1
onnan származó URL-címet, és írja be a webböngésző címsorába.Hozzon létre egy új jegyzetfüzetet: a klasszikus Jupyter Notebookban a Fájlok lapon kattintson az Új > Python 3 (ipykernel) elemre.
A jegyzetfüzet első cellájába írja be a példakódot vagy a saját kódját. Ha saját kódot használ, legalább inicializálnia
DatabricksSession
kell a példakódban látható módon.A jegyzetfüzet futtatásához kattintson az Összes cellafuttatás > gombra. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.
A jegyzetfüzet hibakereséséhez adja hozzá a következő kódsort a jegyzetfüzet elején:
from IPython.core.debugger import set_trace
Ezután hívja meg
set_trace()
a hibakeresési utasítások megadását a jegyzetfüzet végrehajtásának ezen pontján. Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.A klasszikus Jupyter Notebook leállításához kattintson a Fájlbezárás > és a Leállítás gombra. Ha a klasszikus Jupyter Notebook-folyamat továbbra is fut a terminálban vagy a parancssorban, állítsa le ezt a folyamatot a megerősítéshez nyomja
Ctrl + c
le, majd írja bey
.