文字分析

本文說明 Azure Machine Learning Studio (傳統) 中所包含的文字分析模組。 這些模組提供特製化的計算工具來處理結構化和非結構化文字,包括:

  • 前置處理文字的多個選項。
  • 語言偵測。
  • 使用可自訂的 n 語法字典,從文字建立功能。
  • 特徵雜湊,可有效率地分析文字,而不需預先處理或先進的語言分析。
  • Vowpal Wabbit,適用于非常快速的文字機器學習。 Vowpal Wabbit 支援「特徵雜湊」、 (LDA) 的主題模型,以及分類。
  • 命名實體辨識,用來從非結構化文字中將人員、地點和組織的名稱解壓縮。

注意

適用于 : Machine Learning Studio (傳統)

此內容僅適用于 Studio (傳統) 。 Azure Machine Learning 設計工具中已新增類似的拖放模組。 若要深入瞭解 這兩個版本,請參閱這篇文章

範例

如需使用 Azure Machine Learning 的文字分析範例,請參閱 AZURE AI 資源庫

  • 新聞分類:使用特徵雜湊將文章分類成預先定義的類別清單。

  • 尋找類似的公司:使用維琪百科文章的文字將公司分類。

  • 文字分類:示範在情感分析中使用 Twitter 訊息中的文字 (五部分範例) 的端對端處理常式。

模組清單

Azure Machine Learning Studio 中的 文字分析 類別 (傳統) 包含這些模組:

另請參閱