Форматы данных, принимаемые рабочим процессом оркестрации

Когда модель использует данные для обучения, она ожидает данные в определенном формате. Когда вы добавляете теги к данным в Language Studio, они преобразуются в формат JSON, описанный в этой статье. Вы также можете добавить теги к файлам вручную.

Формат файла JSON

При отправке файла тегов он должен соответствовать этому формату.

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "Orchestration",
    "projectName": "{PROJECT-NAME}",
    "multilingual": false,
    "description": "This is a description",
    "language": "{LANGUAGE-CODE}"
  },
  "assets": {
    "projectKind": "Orchestration",
    "intents": [
      {
        "category": "{INTENT1}",
        "orchestration": {
          "targetProjectKind": "Luis|Conversation|QuestionAnswering",
          "luisOrchestration": {
            "appId": "{APP-ID}",
            "appVersion": "0.1",
            "slotName": "production"
          },
          "conversationOrchestration": {
            "projectName": "{PROJECT-NAME}",
            "deploymentName": "{DEPLOYMENT-NAME}"
          },
          "questionAnsweringOrchestration": {
            "projectName": "{PROJECT-NAME}"
          }
        }
      }
    ],
    "utterances": [
      {
        "text": "utterance 1",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "intent1"
      }
    ]
  }
}
Клавиши Заполнитель Значение Пример
api-version {API-VERSION} Версия вызываемого API. Указанное здесь значение определяет последнюю выпущенную версию модели. 2022-03-01-preview
confidenceThreshold {CONFIDENCE-THRESHOLD} Это пороговая оценка, ниже которой намерение будет прогнозироваться как намерение none. 0.7
projectName {PROJECT-NAME} Имя проекта. Это значение учитывает регистр. EmailApp
multilingual false Оркестрация не поддерживает функцию многоязычности false
language {LANGUAGE-CODE} Строка, указывающая код языка для речевых фрагментов, используемых в проекте. Дополнительные сведения о поддерживаемых кодах языков см. в разделе Поддержка языков. en-us
intents [] Массив, содержащий все типы намерений в проекте. Это намерения, используемые в проекте оркестрации. []

Формат речевого фрагмента

[
    {
        "intent": "intent1",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    },
    {
        "intent": "intent2",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    }
]

Дальнейшие действия

  • Вы можете импортировать данные с метками непосредственно в свой проект. Узнайте, как импортировать проект
  • Дополнительные сведения о добавлении меток к данным приведены в этой статье. Завершив добавление меток к данным, можно приступить к обучению модели.