Устранение проблем с подключениями к базе данных Azure для PostgreSQL — гипермасштабирование (Citus)

ОБЛАСТЬ ПРИМЕНЕНИЯ: База данных Azure для PostgreSQL с Гипермасштабированием (Citus)

Проблемы с подключением могут быть вызваны несколькими причинами:

  • Параметры брандмауэра
  • Время ожидания подключения.
  • Неверные данные для входа
  • Достигнуто предельное число подключений для группы серверов
  • Проблемы с инфраструктурой службы.
  • Обслуживание службы
  • Выполнение отработки отказа узла координатора на новое оборудование

В общих чертах проблемы подключения к гипермасштабированию (Citus) можно классифицировать следующим образом:

  • временные ошибки (кратковременные или возникающие периодически);
  • постоянные или регулярно возникающие ошибки.

Устранение временных ошибок

Временные ошибки возникают по ряду причин. Наиболее распространенные: обслуживание системы, ошибка с оборудованием или программным обеспечением, а также обновление узла координатора vCore.

Включение высокого уровня доступности для узлов группы серверов с гипермасштабированием (Citus) позволяет автоматически устранять проблемы этих типов. Тем не менее, приложение должно быть готово к кратковременной потере подключения. Устранение неполадок при некоторых событиях иногда требует больше времени, например, когда большая транзакция приводит к длительному восстановлению.

Порядок устранения временных проблем подключения

  1. Проверьте панель мониторинга Microsoft Azure на наличие каких-либо известных сбоев, произошедших в то время, когда приложение сообщало об ошибках.
  2. Приложения, подключающиеся к облачной службе, такой как гипермасштабирование (Citus), должны ожидать возникновения временных ошибок и корректно реагировать на них. Например, приложения должны реализовать логику повторных попыток для обработки этих ошибок, вместо того, чтобы показывать их пользователям, как ошибки приложения.
  3. Если группа сервера близка к исчерпанию доступных ресурсов, ошибки могут быть похожи на временные проблемы при подключении. В этом случае может помочь увеличение объема ОЗУ узла, добавление рабочих узлов и перераспределение данных.
  4. Если проблемы с подключением продолжаются, их длительность превышает 60 секунд или они наблюдаются несколько раз в день, отправьте запрос в службу поддержки Azure, нажав кнопку Получить поддержку на сайте поддержки Azure.

Устранение постоянных ошибок

Если приложению регулярно не удается подключиться к службе гипермасштабирования (Citus), то наиболее распространенные причинами являются неправильно настроенные параметры брандмауэра или ошибка пользователя.

  • Настройка параметров брандмауэра узла координатора. Убедитесь, что брандмауэр сервера гипермасштабирования (Citus) ("линейка") разрешает подключений от вашего клиента, включая прокси-серверы и шлюзы.
  • Настройка параметров брандмауэра клиента: брандмауэр на вашем клиенте должен разрешать подключения к серверу базы данных. В некоторых брандмауэрах необходимо разрешить подключения не только от имени приложения, но и для IP–адресов плюс портов сервера.
  • Ошибка пользователя: перепроверьте строку подключения. Возможно, что параметры введены неправильно, например указано иное имя сервера. Строки подключения для различных языковых платформ и psql можно найти на портале Azure. Перейдите на страницу Строки подключения в своей группе серверов гипермасштабирования (Citus). Помните, что в кластерах с гипермасштабированием (Citus) есть только одна база данных и ее предопределенное имя — citus.

Порядок устранения постоянных проблем подключения

  1. Настройте правила брандмауэра , разрешив предоставление IP-адреса клиенту. Для временных целей тестирования настройте правило брандмауэра, используя 0.0.0.0 как начало диапазона IP-адресов и 255.255.255.255 как завершение. Такое правило открывает доступ к серверу со всех IP-адресов. Если правило решило проблему с подключением, удалите его и создайте правило брандмауэра для надлежащим образом ограниченных IP-адресов или диапазона адресов.
  2. Откройте порт 5432 для входящих соединений на всех брандмауэрах между клиентом и Интернетом (и порт 6432, если используются пулы подключений).
  3. Проверьте строку подключения и другие параметры подключения.
  4. Проверьте работоспособность службы на панели мониторинга.

Дальнейшие действия