Поделиться через


GraphFrames

GraphFrames — это пакет для Apache Spark, который предоставляет графы на основе DataFrame. Он предоставляет высокоуровневые API для Java, Python и Scala, Она предназначена для предоставления функциональных возможностей GraphX и расширенных функциональных возможностей, используя преимущества кадров данных Spark. Эти расширенные возможности включают поиск в Motif, сериализацию на основе DataFrame и выразительные запросы графов.

В этой статье содержатся два примера записных книжек: записная книжка Scala и руководство пользователя Python. Дополнительные примеры использования GraphFrames с Scala см . в руководстве пользователя GraphFrames — Scala.

Databricks рекомендует использовать кластер со средой Databricks Runtime для Машинного обучения, так как он включает оптимизированную установку GraphFrames.

Если вы не используете кластер под управлением Databricks Runtime ML, скачайте JAR-файл из библиотеки GraphFrames, загрузите его в том и установите его в кластер.

Руководство по GraphFrames (Scala)

В следующей записной книжке показано, как использовать GraphFrames для анализа графов с помощью Scala.

Анализ графов с помощью GraphFrames (Scala)

Получить записную книжку

Руководство пользователя GraphFrames (Python)

В следующей записной книжке приведены примеры кода Python по использованию GraphFrames.

Записная книжка GraphFrames на Python

Получить записную книжку