Изменение хранилища данных для SharePoint 2010

Дата публикации исходной статьи: суббота, 9 июля 2011 г.

​Сегодня мы представляем два связанных изменения в описании хранилища данных SharePoint. Во-первых, пользуясь улучшениями производительности и надежности в пакете обновления 1 (SP1) и определяя особые требования для большого хранилища данных в SharePoint, Майкрософт может увеличить поддерживаемые ограничения для хранилища данных в SharePoint.

 Кроме того, мы объявляем, что теперь поддерживается использование поставщика RBS SQL Server FILESTREAM с SharePoint, что позволяет использовать дешевые диски NAS с подключением iSCSI. В этой статье представлены новые ограничения поддержки хранилища данных и рекомендации по масштабированию в соответствии с этими ограничениями, а также дано определение удаленного хранилища больших двоичных объектов и нового поставщика RBS FILESTREAM.

 

Ограничение размера данных для базы данных контента SharePoint

С выпуском SharePoint 2010 с пакетом обновления 1 (SP1) и нового руководства мы изменяем поддерживаемые ограничения на размер данных для баз данных контента SharePoint. До выхода SP1 размер базы данных контента ограничивался 200 ГБ для совместной работы и 1 ТБ для архива документов. Размер базы данных контента учитывает как метаданные, так и большие двоичные объекты, независимо от того, где они находятся, и использование удаленного хранилища больших двоичных объектов не помогает обойти или увеличить эти ограничения.

 

В новом руководстве приведены подробные инструкции по поддерживаемым размерам баз данных контента для администраторов SharePoint при росте объема данных. Согласно этому руководству SharePoint может поддерживать до 4 ТБ данных во всех сценариях использования и не накладывает ограничений на размер для сценариев архивации документов. В документе TechNet "Управление емкостью SharePoint Server 2010: программные ограничения" приводятся сведения о следующих основных изменениях:

 

  1. Для баз данных контента SharePoint с размером до 200 ГБ не существует особых требований; это ограничение включено для согласованности.
  2. Для баз данных контента SharePoint с размером до 4 ТБ не обходимо дополнительно запланировать следующие требования:
    • Минимальная производительность дисковой подсистемы 0,25 операций ввода/вывода в секунду на ГБ; для оптимальной производительности рекомендуется 2 операции ввода/вывода в секунду на ГБ.
    • Клиенты должны запланировать высокий уровень доступности, аварийное восстановление, будущий рост емкости и тестирование производительности.
    • Также обратите внимание на дополнительные рекомендации, приведенные в статье TechNet о программных ограничениях.
  3. Для баз данных контента SharePoint с размером свыше 4 ТБ, особенно для сценария архивации документов, необходимо дополнительно запланировать следующие аспекты:
    • Сайты SharePoint должны быть основаны на шаблонах Центра документов или Центра записей; должен существовать сценарий архивирования, когда ежемесячно активно считывается менее 5 % контента и активно записывается менее 1 %.
    • Не используйте оповещения, рабочие процессы, корректировки ссылок или безопасность на уровне элементов в любых объектах SharePoint из базы данных контента. Примечание. Базы данных контента архива документов могут получать документы в результате выполнения рабочего процесса маршрутизации контента.
  4. Другие особые изменения ограничений, внесенные одновременно с вышеуказанными:
    • Новое ограничение на количество элементов в одной базе данных контента SharePoint: 60 миллионов
    • Особое ограничение в 5 ТБ на экземпляр SQL Server было отменено.  Вместо этого рекомендуется запланировать размер хранилища баз данных с привлечением специалиста по SQL Server.

Ознакомьтесь со статьей TechNet Управление емкостью SharePoint Server 2010: программные ограничения полностью. Мы также опубликовали руководство по масштабируемости SharePoint 2010: http://go.microsoft.com/fwlink/?LinkId=223599. В ближайшем будущем мы опубликуем пробный отчет о масштабном тестировании поддержки новых ограничений размеров.

Значение удаленного хранилища больших двоичных объектов в SharePoint

RBS (удаленное хранилище больших двоичных объектов) — это набор стандартизированных API, которые позволяют сохранять/извлекать данные больших двоичных объектов без использования основной базы данных SQL, когда для них требуется выделенное хранилище. RBS использует модель поставщика для подключения к любому выделенному хранилищу больших двоичных объектов, которое реализует API-интерфейсы RBS. Концепция удаленного хранилища больших двоичных объектов была введена в SharePoint 2010, и теперь в SharePoint можно устанавливать поставщиков RBS и использовать их для хранения больших двоичных объектов. Документы в библиотеках документов SharePoint являются большими двоичными объектами, и с помощью RBS их можно хранить вне базы данных SQL Server. Это означает, что большие двоичные объекты сохраняются на одном компьютере с SQL Server, хотя они могут находиться на компьютере SQL Server, подключенном к сети.

 

Выше приведены две диаграммы, на которых показаны стандартные архитектуры SharePoint, использующие удаленное хранилище больших двоичных объектов. В обоих вариантах показан поставщик клиента RBS, установленный на веб-интерфейсе SharePoint. На левой диаграмме показана универсальная реализация RBS, в которой третья сторона реализует RBS для доступа к своему хранилищу. На правой диаграмме показан поставщик RBS SQL Server FILESTREAM, который сохраняет большие двоичные объекты в файловой системе Windows.

 

Хранение больших двоичных объектов вне базы данных SQL Server позволяет получить следующие преимущества:

· Удаленное хранилище больших двоичных объектов позволяет SharePoint Foundation 2010, работающему на SQL Express, хранить объем данных, превышающий ограничение SQL Express в 4 ГБ. В SQL Express 2008 R2 это ограничение было увеличено до 10 ГБ.

· Производительность некоторых операций может быть улучшена, если средний размер больших двоичных объектов превышает 1 МБ. Это результат тестирования с поставщиком RBS SQL. Ссылка: http://msdn.microsoft.com/en-us/library/cc949109(SQL.100).aspx

· Возможна оптимизация хранилища с экономией дискового пространства и расходов на диски при использовании разностного резервного копирования или многоуровневого хранилища.

· Мы провели тестирование на поставщике SQL RBS FILESTREAM, который позволяет использовать удаленное хранилище больших двоичных объектов с подключением iSCSI. Использование iSCSI позволяет применять более дешевое хранилище NAS.

· Независимые поставщики программного обеспечения могут разработать другие возможности оптимизации данных с помощью поддерживаемых открытых API-интерфейсов RBS и SharePoint.

При реализации удаленного хранилища больших двоичных объектов необходимо учитывать следующие факторы:

· Следует тщательно продумать стратегию резервного копирования. Резервное копирование метаданных и больших двоичных объектов документов должно выполняться одновременно. Это означает, что любое стороннее решение резервного копирования должно быть способно восстановить как базу данных SQL, так и большие двоичные объекты, используемые SharePoint, как набор без расхождений, которые возникли бы между большими двоичными объектами со ссылками на базу данных из разных резервных копий.

· Использование удаленного хранилища больших двоичных объектов наиболее вероятно для сценариев архивации документов, когда документы записываются и не обновляются. Большие двоичные объекты в удаленном хранилище никогда не обновляются после записи; вместо обновления создается новый объект. Большие двоичные объекты неизменны, старые объекты — это мусор, собираемый позднее. Дополнительные сведения о сборе мусора в удаленном хранилище больших двоичных объектов можно найти в этой статье: http://technet.microsoft.com/en-us/library/ff628583.aspx 

· Поставщики RBS должны возвращать первый байт данных в течение 20 мс после запроса. Это относится ко всем запросам между SharePoint и уровнем хранилища поставщика RBS.

· База данных SharePoint не предназначена для чтения или записи другими приложениями, кроме SharePoint. Поставщики RBS не имеют отдельного доступа к данным. Это относится и к прямому доступу к большим двоичным объектам. Ссылка: http://support.microsoft.com/kb/841057/en-us

· Использование удаленного хранилища для больших двоичных объектов малого размера может ухудшить производительность. Это также показано в статье "Хранилище FILESTREAM в SQL Server 2008" (см. ссылку выше).

· Существует множество поставщиков RBS и клиенты должны оценить их пригодность для своих реализаций.

Дополнительная документация Майкрософт по удаленным хранилищам больших двоичных объектов в SharePoint

 

Ссылки на документацию по RBS в TechNet:

· Планирование удаленного хранилища больших двоичных объектов (SharePoint Server 2010) [http://technet.microsoft.com/en-us/library/ff628583.aspx]

· Общие сведения об удаленном хранилище больших двоичных объектов (SharePoint Server 2010) [http://technet.microsoft.com/en-us/library/ee748649.aspx]

· Обслуживание удаленного хранилища больших двоичных объектов (SharePoint Server 2010) [http://technet.microsoft.com/en-us/library/ff943565.aspx]

Вопросы и ответы

· Вопрос. Почему вы не реализовали эти увеличенные ограничения данных при запуске SharePoint 2010?

· Ответ. За последние 12 месяцев мы получили дополнительные сведения о том, как клиенты реализуют решения архивации документов в SharePoint. Теперь, предоставляя специальное руководство по масштабированию размера данных и обращая внимание на возможности поддержки, мы можем увеличить ограничение размера данных для SharePoint и отменить ограничение размера данных для сценариев архивации документов.

 

· Вопрос. Каково новое ограничение размера данных для архивов документов в SharePoint?

· Ответ. Ограничения размера данных не существует, но при построении поддерживаемых масштабных систем необходимо следовать новым инструкциям. Если дополнительные факторы не учитываются должным образом, возможности поддержки ограничиваются.

 

· Вопрос. Что делать, если мне нужно больше 4 ТБ на ферме SharePoint и это не архив документов?

· Ответ. Вы должны использовать масштабируемую топологию, т. е. иметь несколько баз данных контента на одной ферме и распределять сайты между ними. Каждая база данных контента может расти до 4 ТБ при соблюдении инструкций.

 

· Вопрос. Что делать, если я неправильно предположил, что ограничение в 200 ГБ можно обойти, если перенести большие двоичные объекты в поставщик удаленного хранилища, таким образом уменьшив объем хранимых данных SQL Server для SharePoint?

· Ответ. Мы рекомендуем выполнить обновление до SharePoint 2010 с пакетом обновления 1 (SP1) и применить новые инструкции ко всем имеющимся данным. Проконсультируйтесь с компанией, у которой вы приобрели поставщик RBS, чтобы убедиться, что он прошел тестирование с SharePoint 2010 с пакетом обновления 1 (SP1). Если у вас есть развертывание, которое выходит за пределы новых и старых ограничений, рекомендуем обратиться в службу технической поддержки Майкрософт и запросить анализ возможностей поддержки. Это платная услуга; инженер службы поддержки определит, может ли поддерживаться ваша текущая реализация или необходимо уменьшить объем данных на каждую базу данных контента.

 

· Вопрос. Поскольку поддерживается NAS, позволяет ли поставщик SQL Server RBS FILESTREAM использовать для хранения больших двоичных объектов сетевую папку?

· Ответ. Нет, накопитель NAS должен быть подключен с помощью iSCSI и должен отображаться на компьютере SQL Server как локальный диск.

 

· Вопрос. Будет ли ограничение на размер баз данных контента или на время возврата первого байта поставщиком (20 мс) принудительно применяться в программном обеспечении?

· Ответ. Нет, это ограничения поддержки, которые мы рекомендуем клиентам не превышать для оптимизации производительности и получения наилучшей поддержки от Майкрософт. Они не являются жесткими ограничениями, которые регулируются программным обеспечением SharePoint.

 

· Вопрос. В какой статье TechNet можно найти сведения о старом ограничении в 200 ГБ?

· Ответ. Эти сведения приведены на странице TechNet "Ограничения планирования емкости SharePoint". Пока удаленные хранилища и большие двоичные объекты конкретно не назывались, ограничение в 200 ГБ было ясно указано для баз данных контента SharePoint, содержащих метаданные и большие двоичные объекты. Эта статья была обновлена информацией о новых ограничениях и удаленных хранилищах больших двоичных объектов, чтобы сделать ее более ясной и избежать неправильного понимания в будущем.

 

· Вопрос. Может ли большой архив документов иметь несколько семейств сайтов SharePoint?

· Ответ. Да, однако мы рекомендуем, чтобы семейство сайтов размером свыше 100 ГБ было единственным в базе данных контента.

 

· Вопрос. Может ли большой архив документов иметь несколько библиотек документов?

· Ответ. Да, у вас может быть несколько библиотек документов с разными разрешениями.

 

· Вопрос. Обязательно ли выполнять обновление до SharePoint 2010 с пакетом обновления 1 (SP1), чтобы воспользоваться преимуществами новых ограничений размеров баз данных контента?

· Ответ. Нет, ограничения применяются к SharePoint 2010 независимо от обновления до версии SP1. Однако мы настоятельно рекомендуем установить SharePoint 2010 с пакетом обновления 1 (SP1) из-за улучшений, которые в нем появились.

 

Это локализованная запись блога. Исходная статья доступна по адресу Data Storage Changes for SharePoint 2010