将 NoSQL 数据库用作持久性基础结构

提示

此内容摘自电子书《适用于容器化 .NET 应用程序的 .NET 微服务体系结构》,可在 .NET 文档上获取,也可作为免费可下载的 PDF 脱机阅读。

.NET Microservices Architecture for Containerized .NET Applications eBook cover thumbnail.

将 NoSQL 数据库用于基础结构数据层时,通常不使用 Entity Framework Core 等 ORM。 而是使用 NoSQL 引擎提供的 API,如 Azure Cosmos DB、MongoDB、Cassandra、RavenDB、CouchDB 或 Azure 存储表等。

但是,当使用 NoSQL 数据库时,尤其是诸如 Azure Cosmos DB、CouchDB 或 RavenDB 等面向文档的数据库时,在关于聚合根、子实体类和值对象类的标识方面,使用 DDD 聚合设计模型的方式部分类似于在 EF Core 中执行的方式。 但从根本上讲,数据库的选择会影响设计。

当使用面向文档的数据库时,可将聚合作为单个文档实现,以 JSON 或其他格式进行序列化。 但是,从域模型代码的角度来看,数据库的使用是透明的。 在使用 NoSQL 数据库时,仍然使用实体类和聚合根类,但比使用 EF Core 时具有更大的灵活性,因为持久性不相关。

区别在于如何保留该模型。 如果基于 POCO 实体类实现域模型,与基础结构持久性无关,则似乎你可能会移至不同的持久性基础结构,即使从关系数据库到 NoSQL 也是如此。 但是,这不应该是你的目标。 不同的数据库技术中总是存在各种约束和权衡,因此无法对关系数据库或 NoSQL 数据库使用相同的模型。 更改持久性模型并不是简单的任务,因为事务和永久性操作大不相同。

例如,在面向文档的数据库中,聚合根可以拥有多个子集合属性。 在关系数据库中,无法轻松对查询多个子集合属性进行优化,因为会从 EF 返回 UNION ALL SQL 语句。 对关系数据库或 NoSQL 数据库使用相同的域模型并不简单,且不应尝试这样做。 设计模型必须真正了解数据在每个特定数据库中的使用方式。

使用 NoSQL 数据库的一项优势是实体更加非规范化,所以不用设置表映射。 域模型较使用关系数据库时更加灵活。

当基于聚合设计域模型时,移至 NoSQL 和面向文档的数据库可能比使用关系数据库更容易,因为设计的聚合类似于面向文档的数据库中的序列化文档。 然后,可以在这些“包”中包含该聚合可能需要的所有信息。

例如,以下 JSON 代码是使用面向文档的数据库时,一个实现订单聚合的示例。 它与在 eShopOnContainers 示例中实现的订单聚合类似,但未在下方使用 EF Core。

{
    "id": "2024001",
    "orderDate": "2/25/2024",
    "buyerId": "1234567",
    "address": [
        {
        "street": "100 One Microsoft Way",
        "city": "Redmond",
        "state": "WA",
        "zip": "98052",
        "country": "U.S."
        }
    ],
    "orderItems": [
        {"id": 20240011, "productId": "123456", "productName": ".NET T-Shirt",
        "unitPrice": 25, "units": 2, "discount": 0},
        {"id": 20240012, "productId": "123457", "productName": ".NET Mug",
        "unitPrice": 15, "units": 1, "discount": 0}
    ]
}

Azure Cosmos DB 和本机 Cosmos DB API 简介

Azure Cosmos DB 是 Microsoft 针对任务关键型应用程序的全球分布式数据库服务。 Azure Cosmos DB 提供统包全局分发、全球范围内吞吐量和存储的弹性扩展、99% 的情况下低至个位数的毫秒延迟、五种定义完善的一致性级别以及有保证的高可用性,所有这些均由业界领先的 SLA 提供支持。 Azure Cosmos DB 自动为数据编制索引,无需用户处理架构和管理索引。 它是多模型的,支持文档、键-值、图和列式数据模型。

Diagram showing the Azure Cosmos DB global distribution.

图 7-19。 Azure Cosmos DB 全局分发

使用 C# 模型实现 Azure Cosmos DB API 使用的聚合时,该聚合可类似于结合 EF Core 使用的 C# POCO 类。 区别在于从应用程序和基础结构层使用它们的方式,如以下代码所示:

// C# EXAMPLE OF AN ORDER AGGREGATE BEING PERSISTED WITH AZURE COSMOS DB API
// *** Domain Model Code ***
// Aggregate: Create an Order object with its child entities and/or value objects.
// Then, use AggregateRoot's methods to add the nested objects so invariants and
// logic is consistent across the nested properties (value objects and entities).

Order orderAggregate = new Order
{
    Id = "2024001",
    OrderDate = new DateTime(2005, 7, 1),
    BuyerId = "1234567",
    PurchaseOrderNumber = "PO18009186470"
}

Address address = new Address
{
    Street = "100 One Microsoft Way",
    City = "Redmond",
    State = "WA",
    Zip = "98052",
    Country = "U.S."
}

orderAggregate.UpdateAddress(address);

OrderItem orderItem1 = new OrderItem
{
    Id = 20240011,
    ProductId = "123456",
    ProductName = ".NET T-Shirt",
    UnitPrice = 25,
    Units = 2,
    Discount = 0;
};

//Using methods with domain logic within the entity. No anemic-domain model
orderAggregate.AddOrderItem(orderItem1);
// *** End of Domain Model Code ***

// *** Infrastructure Code using Cosmos DB Client API ***
Uri collectionUri = UriFactory.CreateDocumentCollectionUri(databaseName,
    collectionName);

await client.CreateDocumentAsync(collectionUri, orderAggregate);

// As your app evolves, let's say your object has a new schema. You can insert
// OrderV2 objects without any changes to the database tier.
Order2 newOrder = GetOrderV2Sample("IdForSalesOrder2");
await client.CreateDocumentAsync(collectionUri, newOrder);

可以看到,使用域模型的方式可与当基础架构为 EF 时在域模型层中使用它的方式类似。 仍使用相同的聚合根方法,确保聚合内的一致性、不变量和验证。

但是,当将模型保存到 NoSQL 数据库时,与 EF Core 代码或与关系数据库相关的任何其他代码相比,该代码和 API 会发生显著变化。

实现针对 MongoDB 和 Azure Cosmos DB 的 .NET 代码

从 .NET 容器使用 Azure Cosmos DB

可以像从其他任何 .NET 应用程序一样,从运行在容器中的 .NET 代码访问 Azure Cosmos DB 数据库。 例如,实现 eShopOnContainers 中的 Locations.API 和 Marketing.API 微服务,这样它们就可以使用 Azure Cosmos DB 数据库。

但是,从 Docker 开发环境的角度来看,Azure Cosmos DB 存在限制。 即使有可以在本地开发计算机上运行的本地 Azure Cosmos DB 仿真器,它也仅支持 Windows。 不支持 Linux 和 macOS。

此外,也可能在 Docker 上运行此仿真器,但仅在 Windows 容器上运行,而不在 Linux 容器上运行。 如果将应用程序部署为 Linux 容器,这对开发环境来说从一开始就是一个障碍,因为目前无法同时在用于 Windows 的 Docker 上部署 Linux 和 Windows 容器。 所有正在部署的容器都必须适用于 Linux 或 Windows。

对于开发/测试解决方案,更为直接且理想的部署是能够将数据库系统作为容器与自定义容器一起部署,这样开发/测试环境就始终一致。

将 MongoDB API 用于本地开发/测试 Linux/Windows 容器以及 Azure Cosmos DB

Cosmos DB 数据库支持 .NET 的 MongoDB API 以及本地 MongoDB 网络协议。 这意味着通过使用现有的驱动程序,为 MongoDB 编写的应用程序现在可以与 Cosmos DB 通信,并且可使用 Cosmos DB 数据库而非 MongoDB 数据库,如图 7-20 所示。

Diagram showing that Cosmos DB supports .NET and MongoDB wire protocol.

图 7-20。 使用 MongoDB API 和协议访问 Azure Cosmos DB

这对于含有 Linux 容器的 Docker 环境中的概念证明来说是一种非常便捷的方法,因为 MongoDB Docker 映像是一种支持 Docker Linux 容器和 Docker Windows 容器的多体系映像。

如下图所示,通过使用 MongoDB API,eShopOnContainers 支持适用于本地开发环境的 MongoDB Linux 和 Windows 容器,随后只需将 MongoDB 连接字符串更改为指向 Azure Cosmos DB,即可作为 Azure Cosmos DB 移至可伸缩的 PaaS 云解决方案。

Diagram showing that the Location microservice in eShopOnContainers can use either Cosmos DB or Mongo DB.

图 7-21。 使用用于 dev-env 或 Azure Cosmos DB 的 MongoDB 容器进行生产的 eShopOnContainers

生产 Azure Cosmos DB 将作为 PaaS 和可扩展服务在 Azure 云中运行。

自定义 .NET 容器可以在本地开发 Docker 主机(在 Windows 10 计算机上使用用于 Windows 的 Docker)上运行,也可以被部署到生产环境中,如 Azure AKS 中的 Kubernetes 或 Azure Service Fabric。 在第二个环境中,只需部署 .NET 自定义容器,而不是 MongoDB 容器,因为你将在云中使用 Azure Cosmos DB 来处理生产中的数据。

使用 MongoDB API 的明显好处是解决方案可以在数据库引擎、MongoDB 或 Azure Cosmos DB 中运行,因此要迁移到不同环境应该很容易。 但是,有时为充分利用特定数据库引擎的功能,使用本机 API(即本机 Cosmos DB API)是值得的。

若要进一步比较在云中仅使用 MongoDB 和 Cosmos DB 的差异,请参阅此页中使用 Azure Cosmos DB 的好处

分析适用于生产应用程序的方法:MongoDB API vs.Cosmos DB API

我们在 eShopOnContainers 中使用 MongoDB API,因为我们的首要任务是从根本上拥有使用 NoSQL 数据库的一致开发/测试环境,该数据库也可以与 Azure Cosmos DB 一起使用。

但是,如果打算使用 MongoDB API 访问 Azure 中的 Azure Cosmos DB 以实现生产应用程序,则应该分析与使用本机 Azure Cosmos DB API 相比,使用 MongoDB API 访问 Azure Cosmos DB 数据库的功能和性能差异。 如果相似,则可以使用 MongoDB API,并且可以获取同时支持两个 NoSQL 数据库引擎的好处。

此外,也可以将 MongoDB 群集作为 Azure 云中的生产数据库与 MongoDB Azure 服务一起使用。 但这不是由 Microsoft 提供的 PaaS 服务。 在这种情况下,Azure 只托管来自 MongoDB 的解决方案。

基本上,这只是指出不应总是针对 Azure Cosmos DB 使用 MongoDB API 的免责声明,就像在 eShopOnContainers 中所做的那样,因为这对于 Linux 容器来说是一个方便的选择。 应根据特定需求以及需要对生产应用程序执行的测试来做出决定。

代码:在 .NET 应用程序中使用 MongoDB API

适用于 .NET 的 MongoDB API 是基于 NuGet 包的,你需要添加到类似于下图所示的 Locations.API 项目中。

Screenshot of the dependencies in the MongoDB NuGet packages.

图 7-22。 .NET 项目中的 MongoDB API NuGet 包引用

让我们来研究下面几节中的代码。

MongoDB API 使用的模型

首先,需要定义一个在应用程序内存空间中保存来自数据库的数据的模型。 以下是 eShopOnContainers 中用于定位的模型示例。

using MongoDB.Bson;
using MongoDB.Bson.Serialization.Attributes;
using MongoDB.Driver.GeoJsonObjectModel;
using System.Collections.Generic;

public class Locations
{
    [BsonId]
    [BsonRepresentation(BsonType.ObjectId)]
    public string Id { get; set; }
    public int LocationId { get; set; }
    public string Code { get; set; }
    [BsonRepresentation(BsonType.ObjectId)]
    public string Parent_Id { get; set; }
    public string Description { get; set; }
    public double Latitude { get; set; }
    public double Longitude { get; set; }
    public GeoJsonPoint<GeoJson2DGeographicCoordinates> Location
                                                             { get; private set; }
    public GeoJsonPolygon<GeoJson2DGeographicCoordinates> Polygon
                                                             { get; private set; }
    public void SetLocation(double lon, double lat) => SetPosition(lon, lat);
    public void SetArea(List<GeoJson2DGeographicCoordinates> coordinatesList)
                                                    => SetPolygon(coordinatesList);

    private void SetPosition(double lon, double lat)
    {
        Latitude = lat;
        Longitude = lon;
        Location = new GeoJsonPoint<GeoJson2DGeographicCoordinates>(
            new GeoJson2DGeographicCoordinates(lon, lat));
    }

    private void SetPolygon(List<GeoJson2DGeographicCoordinates> coordinatesList)
    {
        Polygon = new GeoJsonPolygon<GeoJson2DGeographicCoordinates>(
                  new GeoJsonPolygonCoordinates<GeoJson2DGeographicCoordinates>(
                  new GeoJsonLinearRingCoordinates<GeoJson2DGeographicCoordinates>(
                                                                 coordinatesList)));
    }
}

可以看到来自 MongoDB NuGet 包的一些属性和类型。

NoSQL 数据库通常非常适合处理非关系分层数据。 在此示例中,我们使用专用于地理位置的 MongoDB 类型,例如 GeoJson2DGeographicCoordinates

检索数据库和集合

在 eShopOnContainers 中,我们已经创建了自定义数据库上下文,并在其中实现代码来检索数据库和 MongoCollections,如以下代码所示。

public class LocationsContext
{
    private readonly IMongoDatabase _database = null;

    public LocationsContext(IOptions<LocationSettings> settings)
    {
        var client = new MongoClient(settings.Value.ConnectionString);
        if (client != null)
            _database = client.GetDatabase(settings.Value.Database);
    }

    public IMongoCollection<Locations> Locations
    {
        get
        {
            return _database.GetCollection<Locations>("Locations");
        }
    }
}

检索数据

在 C# 代码中,如 Web API 控制器或自定义存储库实现,可在查询 MongoDB API 时,编写如下代码。 请注意,_context 对象是之前的 LocationsContext 类的实例。

public async Task<Locations> GetAsync(int locationId)
{
    var filter = Builders<Locations>.Filter.Eq("LocationId", locationId);
    return await _context.Locations
                            .Find(filter)
                            .FirstOrDefaultAsync();
}

在 docker-compose.override.yml 文件中对 MongoDB 连接字符串使用 env-var

创建 MongoClient 对象时,需要一个基本参数,该参数恰好是指向正确数据库的 ConnectionString 参数。 对于 eShopOnContainers,连接字符串可以指向本地 MongoDB Docker 容器或“生产”Azure Cosmos DB 数据库。 该连接字符串来自在 docker-compose.override.yml 文件中定义的环境变量,该文件在使用 docker-compose 或 Visual Studio 进行部署时使用,如以下 yml 代码所示。

# docker-compose.override.yml
version: '3.4'
services:
  # Other services
  locations-api:
    environment:
      # Other settings
      - ConnectionString=${ESHOP_AZURE_COSMOSDB:-mongodb://nosqldata}

ConnectionString 环境变量通过以下方式解析:如果使用 Azure Cosmos DB 连接字符串在 .env 文件中定义该 ESHOP_AZURE_COSMOSDB 全局变量,则将使用它访问云中的 Azure Cosmos DB 数据库。 如果未定义,它将采用 mongodb://nosqldata 值并使用 MongoDB 开发容器。

以下代码演示带有 Azure Cosmos DB 连接字符串全局环境变量的 .env 文件,如在 eShopOnContainers 中实现一样:

# .env file, in eShopOnContainers root folder
# Other Docker environment variables

ESHOP_EXTERNAL_DNS_NAME_OR_IP=host.docker.internal
ESHOP_PROD_EXTERNAL_DNS_NAME_OR_IP=<YourDockerHostIP>

#ESHOP_AZURE_COSMOSDB=<YourAzureCosmosDBConnData>

#Other environment variables for additional Azure infrastructure assets
#ESHOP_AZURE_REDIS_BASKET_DB=<YourAzureRedisBasketInfo>
#ESHOP_AZURE_STORAGE_CATALOG_URL=<YourAzureStorage_Catalog_BLOB_URL>
#ESHOP_AZURE_SERVICE_BUS=<YourAzureServiceBusInfo>

取消注释 ESHOP_AZURE_COSMOSDB 行,并使用从 Azure 门户获得的 Azure Cosmos DB 连接字符串进行更新,如将 MongoDB 应用程序连接到 Azure Cosmos DB 中所述。

如果 ESHOP_AZURE_COSMOSDB 全局变量为空,则意味着它在 .env 文件中已被注释掉,那么容器将使用默认的 MongoDB 连接字符串。 此连接字符串指向部署在 eShopOnContainers 中的本地 MongoDB 容器,该容器名为 nosqldata,并在 docker-compose 文件中定义,如以下 .yml 代码所示:

# docker-compose.yml
version: '3.4'
services:
  # ...Other services...
  nosqldata:
    image: mongo

其他资源