Устранение неполадок в наборе для контроля работоспособности DataProtectionTroubleshooting DataProtection Health Set

Применимо к: Exchange Server 2013, Project Server 2013Applies to: Exchange Server 2013, Project Server 2013

Последнее изменение раздела: 2015-03-09Topic Last Modified: 2015-03-09

Набор для контроля работоспособности DataProtection служит для мониторинга избыточности баз данных в группе обеспечения доступности баз данных (DAG).The DataProtection Health set monitors the redundancy of databases in a database availability group (DAG).

Если вы получаете оповещение, которое указывает, что DataProtection работает неправильно, это указывает на проблему, которая может повлиять на компоненты репликации или кластера и, можно запретить доступ к базам данных Exchange.If you receive an alert that specifies that DataProtection is unhealthy, this indicates an issue that may affect the replication or cluster components, and that can prevent access to the Exchange databases.

ПояснениеExplanation

Служба работоспособности DataProtection отслеживается с помощью следующих зондов и мониторов.The DataProtection Health service is monitored by using the following probes and monitors.

ЗондProbe Настройки работоспособностиHealth Set ЗависимостиDependencies Связанные мониторыAssociated Monitors

ClusterEndpointProbeClusterEndpointProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ClusterEndpointMonitorClusterEndpointMonitor

ClusterGroupProbeClusterGroupProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ClusterGroupMonitorClusterGroupMonitor

ClusterNetworkProbeClusterNetworkProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ClusterNetworkMonitorClusterNetworkMonitor

ClusterServiceCrashProbeClusterServiceCrashProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ClusterServiceCrashMonitorClusterServiceCrashMonitor

ServerOneCopyProbeServerOneCopyProbe

DataProtectionDataProtection

Active DirectorActive Director

ServerOneCopyMonitorServerOneCopyMonitor

ServerOneCopyInternalMonitorProbeServerOneCopyInternalMonitorProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ServerOneCopyInternalMonitorMonitorServerOneCopyInternalMonitorMonitor

ServiceHealthMSExchangeReplEndpointProbeServiceHealthMSExchangeReplEndpointProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ServiceHealthMSExchangeReplEndpointMonitorServiceHealthMSExchangeReplEndpointMonitor

ServiceHealthMSExchangeReplCrashProbeServiceHealthMSExchangeReplCrashProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ServiceHealthMSExchangeReplCrashMonitorServiceHealthMSExchangeReplCrashMonitor

ServerSiteFailureProbeServerSiteFailureProbe

DataProtectionDataProtection

Active DirectoryActive Directory

ServerSiteFailureMonitorServerSiteFailureMonitor

StorageApparentControllerIssuesProbeStorageApparentControllerIssuesProbe

DataProtectionDataProtection

Active DirectoryActive Directory

StorageApparentControllerIssuesMonitorStorageApparentControllerIssuesMonitor

DatabaseHealthTooManyMountedDatabaseProbeDatabaseHealthTooManyMountedDatabaseProbe

DataProtectionDataProtection

Active DirectoryActive Directory

DatabaseHealthTooManyMountedDatabaseMonitorDatabaseHealthTooManyMountedDatabaseMonitor

Дополнительные сведения о зондов и мониторов можно работоспособности сервера и производительность.For more information about probes and monitors, see Server health and performance.

Действия пользователяUser Action

Служба может восстановить работу после отображения оповещения. Поэтому если вы получите оповещение о неработоспособном состоянии настроек работоспособности, сначала убедитесь в наличии данной проблемы. Если проблема не устранена, выполните соответствующие действия по восстановлению, указанные в приведенных ниже разделах.It's possible that the service recovered after it issued the alert. Therefore, when you receive an alert that specifies that the health set is unhealthy, first verify that the issue still exists. If the issue does exist, perform the appropriate recovery actions outlined in the following sections.

Проверка наличия проблемыVerifying the issue still exists

  1. Определите имена настроек работоспособности и сервера, указанные в оповещении.Identify the health set name and the server name in the alert.

  2. В сообщении приводятся подробные сведения о точной причине возникновения оповещения. В большинстве случаев в сообщении приводится достаточно сведений по устранению неполадок для определения основной причины проблемы. Если в сообщении приводятся непонятные сведения:The message details provide information about the exact cause of the alert. In most cases, the message details provide sufficient troubleshooting information to identify the root cause. If the message details are not clear, do the following:

    1. Откройте консоль управления Exchange и затем выполните следующую команду для получения сведений о настройках работоспособности, с которыми связано оповещение:Open the Exchange Management Shell, and then run the following command to retrieve the details of the health set that issued the alert:

      Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
      

      Например, чтобы извлечь подробные сведения о настройках работоспособности Autodiscover.Protocol относительно сервера server1.contoso.com, выполните следующую команду.For example, to retrieve the Autodiscover.Protocol health set details about server1.contoso.com, run the following command:

      Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "Autodiscover.Protocol"}
      

      Просмотрите вывод команды для определения, какой монитор сообщающих об ошибках. Значение AlertValue для монитор, с которыми связано оповещение будет Unhealthy.Review the command output to determine which monitor reported the error. The AlertValue value for the monitor that issued the alert will be Unhealthy.

    2. Определите зонд на основе монитор. Обратите внимание на то, что большинство зондов используют префикс имени. В предыдущем примере, для поиска "**ClusterNetwork***«:Identify the probe that the monitor is based on. Note that most probes share the same name prefix. By using the previous example, search for “ClusterNetwork*”:

      Get-MonitoringItemIdentity -Identity DataProtection -Server server1.contoso.com | ?{$_.Name -like "ClusterNet ItemType  
      work*"}
      

      Возвращенные результаты должны иметь примерно следующий вид.The returned results should resemble the following.

      ItemType

      HealthSetName

      Name

      TargetResource

      Probe

      DataProtection

      ClusterNetworkProbe

      MSExchangeRepl

    3. Еще раз запустите зонд для средства мониторинга, которое находится в неисправном состоянии. Обратитесь к таблице в разделе Explanation, чтобы найти связанный зонд. Для этого выполните следующую команду.Rerun the associated probe for the monitor that’s in an unhealthy state. Refer to the table in the Explanation section to find the associated probe. To do this, run the following command:

      Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
      

      Например, предположим, что не работает монитор AutodiscoverSelfTestMonitor. С этим монитором связан зонд AutodiscoverSelfTestProbe. Чтобы запустить этот зонд на сервере server1.contoso.com, выполните следующую команду.For example, assume that the failing monitor is AutodiscoverSelfTestMonitor. The probe associated with that monitor is AutodiscoverSelfTestProbe. To run that probe on server1.contoso.com, run the following command:

      Invoke-MonitoringProbe Autodiscover.Protocol\AutodiscoverSelfTestProbe -Server server1.contoso.com | Format-List
      
    4. В выходных данных команды просмотрите значение параметра Результат зонда. Если этот параметр имеет значение Succeeded, ошибка была временной и в настоящее время устранена. В противном случае обратитесь к действиям по восстановлению, приведенным в следующих разделах.In the command output, review the Result value of the probe. If the value is Succeeded, the issue was a transient error, and it no longer exists. Otherwise, refer to the recovery steps outlined in the following sections.

Действия по устранению неполадокTroubleshooting steps

Если вы получите оповещение, связанное с настройками работоспособности, сообщение электронной почты содержит приведенные ниже сведения.When you receive an alert from a health set, the email message contains the following information:

  • Имя сервера, отправившего оповещение.Name of the server that sent the alert

  • Время и дата возникновения оповещения.Time and date when the alert occurred

  • Используемый механизм проверки подлинности и сведения об учетных данных.Authentication mechanism that was used, and credential information

  • Полная трассировка исключения, связанного с последней ошибкой, включая диагностические данные и конкретные сведения о заголовке HTTP.Full exception trace of the last error, including diagnostic data and specific HTTP header information

    Сведения в полной трассировке исключения можно использовать для устранения проблемы. Исключение, созданное зондом, содержит причину сбоя зонда.You can use the information in the full exception trace to help troubleshoot the issue. The exception generated by the probe contains a failure Reason that describes why the probe failed.

Для большинства проблемы, возникающие в средах с высокой доступности можно запустить командлет Test-ReplicationHealth , которые помогут устранить неполадки кластера/сетевые/ActiveManager/службы. Другие настройками работоспособности/компоненты будут иметь разные Test -* командлетов.For most issues that occur in high availability environments, you can run the Test-ReplicationHealth cmdlet to help troubleshoot the cluster/networking/ActiveManager/services. Other HealthSet/Components will have different Test-* cmdlets.

Например:For example:

Test-ReplicationHealth <ServerName>

Возвращенные результаты должны иметь примерно следующий вид.The returned results will resemble the following:

Server

Check

Result

<ServerName><ServerName>

ClusterService

Passed

<ServerName><ServerName>

ReplayService

Passed

<ServerName><ServerName>

ActiveManager

Passed

<ServerName><ServerName>

TasksRpcListener

Passed

<ServerName><ServerName>

TcpListener

Passed

<ServerName><ServerName>

ServerLocatorService

Passed

<ServerName><ServerName>

DagMembersUp

Passed

<ServerName><ServerName>

ClusterNetwork

Passed

<ServerName><ServerName>

QuorumGroup

Passed

<ServerName><ServerName>

FileShareQuorum

Passed

<ServerName><ServerName>

DatabaseRedundancyCheck

Passed

<ServerName><ServerName>

DatabaseAvailabilityCheck

Passed

<ServerName><ServerName>

DBCopySuspended

Passed

<ServerName><ServerName>

DBCopyFailed

Тест пройденPassed

<ServerName><ServerName>

DBInitializing

Passed

<ServerName><ServerName>

DBDisconnected

Passed

<ServerName><ServerName>

DBLogCopyKeepingUp

Passed

<ServerName><ServerName>

DBLogReplayKeepingUp

Passed

Если для всех компонентов отображается значение Тест пройден в столбце Результат, попробуйте перезапустить связанный зонд, как это показано в шаге 2c в разделе Verifying the issue still exists.If all components display Passed in the Result column, try to rerun the associated probe as shown in step 2c in the Verifying the issue still exists section.

Если проблема не устранена, перезапустите сервер. После перезапуска сервера повторно запустите связанный зонд, как показано в шаге 2c раздела Verifying the issue still exists.If the issue still exists, restart the server. After the server restarts, rerun the associated probe as shown in step 2c in the Verifying the issue still exists section.

Если зонд сохранится, обратитесь за помощью для устранения этой проблемы. Обращение к специалисту службы поддержки Майкрософт, чтобы устранить эту проблему. Чтобы обращение к специалисту службы поддержки Майкрософт, посетите Центр решений Exchange Server. В области навигации щелкните поддерживают параметры и ресурсы и используйте один из параметров, указанных в разделе Техническая поддержка для обращение к специалисту службы поддержки Майкрософт. Так как организации могут иметь определенные процедуры для прямого обращения в службу технической поддержки Майкрософт, убедитесь, что сначала просмотрите рекомендации по вашей организации.If the probe continues to fail, you may need assistance to resolve this issue. Contact a Microsoft Support professional to resolve this issue. To contact a Microsoft Support professional, visit the Exchange Server Solutions Center. In the navigation pane, click Support options and resources and use one of the options listed under Get technical support to contact a Microsoft Support professional. Because your organization may have a specific procedure for directly contacting Microsoft Product Support Services, be sure to review your organization's guidelines first.