Veri biçimlerini tanımlama

Tamamlandı

Veriler, bilgileri kaydetmek için kullanılan sayılar, açıklamalar ve gözlemler gibi olgulardan oluşan bir koleksiyondur. Bu verilerin düzenlendiği veri yapıları genellikle bir kuruluş için önemli olan varlıkları (müşteriler, ürünler, satış siparişleri vb.) temsil eder. Her varlığın genellikle bir veya daha fazla özniteliği veya özelliği vardır (örneğin, bir müşterinin adı, adresi, telefon numarası vb.) olabilir.

Verileri yapılandırılmış, yarı yapılandırılmış veya yapılandırılmamış olarak sınıflandırabilirsiniz.

Yapılandırılmış veriler

Yapılandırılmış veriler, sabit bir şemaya bağlı olan verilerdir, bu nedenle tüm veriler aynı alanlara veya özelliklere sahiptir. En yaygın olarak, yapılandırılmış veri varlıklarının şeması tablosaldır ; başka bir deyişle, veriler bir veri varlığının her örneğini temsil eden satırlardan ve varlığın özniteliklerini temsil eden sütunlardan oluşan bir veya daha fazla tabloda temsil edilir. Örneğin, aşağıdaki görüntüde Müşteri ve Ürün varlıkları için tablosal veri gösterimleri gösterilmektedir.

Image showing how structured data is represented in tables

Yapılandırılmış veriler genellikle ilişkisel modelde anahtar değerleri kullanarak birden çok tablonun birbirine başvurabileceği bir veritabanında depolanır. Bunu daha sonra daha ayrıntılı inceleyeceğiz.

Yarı yapılandırılmış veriler

Yarı yapılandırılmış veriler, bazı yapıya sahip olan ancak varlık örnekleri arasında bazı çeşitlemeler yapılmasını sağlayan bilgilerdir. Örneğin, çoğu müşterinin e-posta adresi olabilirken, bazılarının birden çok e-posta adresi olabilir ve bazılarının hiç e-posta adresi olmayabilir.

Yarı yapılandırılmış veriler için yaygın biçimlerden biri JavaScript Nesne Gösterimi (JSON). Aşağıdaki örnekte müşteri bilgilerini temsil eden bir çift JSON belgesi gösterilmektedir. Her müşteri belgesi adres ve iletişim bilgilerini içerir, ancak belirli alanlar müşteriler arasında farklılık gösterir.

// Customer 1
{
  "firstName": "Joe",
  "lastName": "Jones",
  "address":
  {
    "streetAddress": "1 Main St.",
    "city": "New York",
    "state": "NY",
    "postalCode": "10099"
  },
  "contact":
  [
    {
      "type": "home",
      "number": "555 123-1234"
    },
    {
      "type": "email",
      "address": "joe@litware.com"
    }
  ]
}

// Customer 2
{
  "firstName": "Samir",
  "lastName": "Nadoy",
  "address":
  {
    "streetAddress": "123 Elm Pl.",
    "unit": "500",
    "city": "Seattle",
    "state": "WA",
    "postalCode": "98999"
  },
  "contact":
  [
    {
      "type": "email",
      "address": "samir@northwind.com"
    }
  ]
}

Dekont

JSON, yarı yapılandırılmış verilerin temsil edilebileceği birçok yoldan yalnızca biridir. Burada önemli olan JSON söz diziminin ayrıntılı bir incelemesini sağlamak değil, yarı yapılandırılmış veri gösterimlerinin esnek yapısını göstermektir.

Yapılandırılmamış veriler

Verilerin tümü yapılandırılmamış veya yarı yapılandırılmış değildir. Örneğin, belgeler, görüntüler, ses ve video verileri ve ikili dosyalar belirli bir yapıya sahip olmayabilir. Bu tür veriler yapılandırılmamış veriler olarak adlandırılır.

Image showing unstructured data in documents

Veri depolama alanları

Kuruluşlar genellikle verileri yapılandırılmış, yarı yapılandırılmış veya yapılandırılmamış biçimde depolayarak varlıkların (örneğin, müşteriler ve ürünler), belirli olayların (satış işlemleri gibi) veya belgelerdeki, resimlerdeki ve diğer biçimlerdeki diğer bilgilerin ayrıntılarını kaydeder. Daha sonra depolanan veriler analiz ve raporlama için daha sonra alınabilir.

Ortak kullanımda iki geniş veri deposu kategorisi vardır:

  • Dosya depoları
  • Veritabanları

Sonraki konularda bu veri deposu türlerinin her ikisini de inceleyeceğiz.