LocationClosestSelector 类

使用最接近的球面距离的标准来定义客户数据与公共数据的联接。

继承
LocationClosestSelector

构造函数

LocationClosestSelector(_granularity: azureml.opendatasets.granularities.granularity.LocationClosestGranularity, enable_telemetry: bool = True)

参数

_granularity
LocationClosestGranularity
必需

要用于数据联接的位置粒度。

enable_telemetry
bool
默认值: True

指示是否启用遥测。

注解

静态方法 process(self, env, customer_data, public_data, aggregator, join_keys, debug) 用于基于此选择器联接数据,其中:

  • customer_data 是 azureml.opendatasets.accessories.location_data.LocationData 的实例

  • public_data 是 azureml.opendatasets.accessories.location_data.LocationData 的实例

  • aggregator 是azureml.opendatasets.aggregators.aggregator.Aggregator 之一

  • join_keys 是联接键对的列表

  • debug 指示是否要打印调试日志。

此方法返回一个元组:更改的客户数据类实例、更改的公共数据类实例和连接密钥对列表。

方法

process

使用指定的聚合器连接客户数据和公共数据。

process

使用指定的聚合器连接客户数据和公共数据。

process(env: Union[azureml.opendatasets.environ.SparkEnv, azureml.opendatasets.environ.PandasEnv], customer_data: azureml.opendatasets.accessories.location_data.LocationData, public_data: azureml.opendatasets.accessories.location_data.LocationData, aggregator: azureml.opendatasets.aggregators.aggregator.Aggregator, join_keys: list, debug: bool)

参数

env
RuntimeEnv
必需

运行时环境。

customer_data
LocationData
必需

LocationData 派生类的实例。

public_data
LocationData
必需

LocationData 派生类的实例。

aggregator
Aggregator
必需

聚合器。

join_keys
list
必需

联接键对的列表。

debug
bool
必需

指示是否要打印调试日志。

返回

一个元组:更改的客户数据类实例、更改的公共数据类实例和联接键对的列表。

返回类型