series_cosine_similarity()

[アーティクル]
01/23/2024

2 つの数値ベクトルのコサイン類似性を計算します。

関数 series_cosine_similarity() は 2 つの数値系列を入力として受け取り、コサインの類似性を計算します。

構文

series_cosine_similarity(series1,series2)

構文規則について詳しく知る。

パラメーター

名前	型	必須	説明
series1、series2	`dynamic`	✔️	数値データを含む入力配列。

戻り値

series1 と series2 のコサイン類似性を値とする型realの値を返します。両方の系列の長さが等しくない場合、長い系列は短い系列の長さに切り捨てられます。入力系列の数値以外の要素は無視されます。

注意

一方または両方の入力配列が空の場合、結果はになります null。

パフォーマンスの最適化

この関数を使用する場合のパフォーマンスの向上とストレージ要件の削減については、ML ベクター埋め込みなど、64 ビットの精度を必要としない浮動小数点ベクトルを格納するためのエンコードポリシーの使用 Vector16 を検討してください。 Bfloat16 浮動小数点表現を利用するプロファイルはVector16、操作を大幅に最適化し、ストレージサイズを 4 倍に減らすことができます。エンコードポリシーの詳細については、「エンコードポリシーのVector16種類」を参照してください。

例

クエリを実行する

datatable(s1:dynamic, s2:dynamic)
[
    dynamic([0.1,0.2,0.1,0.2]), dynamic([0.11,0.2,0.11,0.21]),
    dynamic([0.1,0.2,0.1,0.2]), dynamic([1,2,3,4]),
]
| extend cosine_similarity=series_cosine_similarity(s1, s2)

s1	s2	cosine_similarity
[0.1,0.2,0.1,0.2]	[0.11,0.2,0.11,0.21]	0.99935343825504
[0.1,0.2,0.1,0.2]	[1,2,3,4]	0.923760430703401

次の方法で共有

series_cosine_similarity()

構文

パラメーター

戻り値

パフォーマンスの最適化

例

フィードバック

フィードバック

その他のリソース