Verilerinizi sınıflandırma

Tamamlandı

Bir çevrimiçi perakende işletmesinin farklı türlerde verileri olur. Her veri türü farklı bir depolama çözümünden yararlanabilir.

Uygulama verileri şu üç yoldan birinde sınıflandırılabilir: yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış. Burada, veri türü için uygun depolama çözümünü seçebilmeniz için verilerinizi sınıflandırmayı öğreneceksiniz.

Bulutta veri depolama yaklaşımları

Aşağıdaki video, verileri bulutta depolama seçeneklerinizi tanıtır:

Yapılandırılmış veriler

İlişkisel veriler olarak da adlandırılan yapılandırılmış verilerde, tüm veriler aynı alanlara veya özelliklere sahiptir. Tüm veriler aynı kuruluşa ve şekle veya şemaya sahiptir. Paylaşılan şema, Yapılandırılmış Sorgu Dili (SQL) gibi sorgu dilleri kullanılarak bu tür verilerin kolayca aranmasını sağlar. Bu özellik, bu veri stilini CRM sistemleri, rezervasyonlar ve envanter yönetimi gibi uygulamalar için mükemmel hale getirir.

Yapılandırılmış veriler genellikle satırlar ve sütunlar içeren veritabanı tablolarında depolanır. Tabloda anahtar sütunu, tablodaki bir satırın başka bir tablonun başka bir satırındaki verilerle nasıl ilişkili olduğunu gösterir. Aşağıdaki görüntüde, notlar hakkında veri içeren bir tablo, anahtar sütunlarını kullanarak bir öğrenci adları tablosundan ve sınıf verilerinden oluşan bir tablodan veri alır.

Diagram that shows two structured data tables and a relationship table that has data that ties them together.

Yapılandırılmış verilerde veri girişi, sorgulama ve analiz işlemleri oldukça kolaydır. Tüm veriler aynı biçimdedir. Ancak tutarlı bir yapıyı zorlamak, verilerin evriminin daha zor olduğu anlamına da gelir. Veri alanları ekler veya kaldırırsanız, her kaydı yeni yapıya uyacak şekilde güncelleştirmeniz gerekir.

Yarı yapılandırılmış veriler

Yarı yapılandırılmış veriler, yapılandırılmış verilerden daha az düzenlenmiştir. Alanlar tablolara, satırlara ve sütunlara düzgün bir şekilde sığmadığından yarı yapılandırılmış veriler ilişkisel biçimde depolanmaz. Yarı yapılandırılmış veriler, verilerin düzenini ve hiyerarşisini anlaşılır hale getiren etiketler içerir. Örneklerden biri anahtar/değer çiftleridir. Yarı yapılandırılmış veriler, ilişkisel olmayan veya yalnızca SQL (NoSQL) verileri olarak da adlandırılır.

Yarı yapılandırılmış veriler, veri serileştirme diliyle tanımlanır. Veri sınıflandırmasında serileştirme, verileri iletilebilen veya depolanabilen bir biçime dönüştürme işlemidir.

Yazılım geliştiricileri, bellekte depolanan verileri bir dosyaya yazmak için veri serileştirme dillerini kullanır. Bu diller başka bir sisteme gönderilebilir, ayrıştırılabilir ve okunabilir. Gönderenin ve alıcının diğer sistemle ilgili ayrıntıları bilmesi gerekmez. Aynı serileştirme dili kullanıldığı sürece veriler her iki sistem tarafından da anlaşılabilir.

Yaygın serileştirme dilleri

Xml, JSON ve YAML üç yaygın serileştirme dilidir.

XML

Genişletilebilir biçimlendirme dili (XML), yaygın olarak kullanılan ilk veri dillerinden biriydi. XML, kolayca insan tarafından okunabilen ve makine tarafından okunabilen metin tabanlıdır. XML ayrıştırıcıları neredeyse tüm popüler geliştirme platformlarında kullanılabilir.

İlişkileri ifade etmek için XML kullanabilirsiniz. XML'de şema, dönüştürme ve hatta web'de görüntüleme standartları vardır.

Xml ile ifade edilen kişinin adı, yaşı ve hobilerine bir örnek aşağıda verilmiştir:

<Person Age="23">
    <FirstName>Quinn</FirstName>
    <LastName>Anderson</LastName>
    <Hobbies>
        <Hobby Type="Sports">Golf</Hobby>
        <Hobby Type="Leisure">Reading</Hobby>
        <Hobby Type="Leisure">Guitar</Hobby>
   </Hobbies>
</Person>

XML, açı ayraçları içinde tanımlanan etiketleri kullanarak verilerin şeklini ifade eder. Etiketler iki biçimde gelir: gibi öğeler ve gibi <FirstName>Age="23"metinlerle ifade edilebilen öznitelikler. Öğelerin ilişkileri ifade etmek için alt öğeleri olabilir. Örneğin, <Hobbies> etiket bir öğe koleksiyonunu Hobby ifade eder.

XML esnektir ve karmaşık verileri kolayca ifade edebilir. Ancak, daha ayrıntılı olma eğilimindedir, bu da bir ağı depolamayı, işlemeyi ve ağ üzerinden geçirmeyi büyütür. Sonuç olarak, diğer biçimler daha popüler hale gelmiştir.

JSON

JavaScript Nesne Gösterimi (JSON) basit bir belirtime sahiptir ve veri yapısını belirtmek için küme ayracı kullanır. XML ile karşılaştırıldığında, JSON daha az ayrıntılıdır ve insanların okuması daha kolaydır. JSON, web hizmetleri tarafından sık sık veri döndürmek için kullanılır.

JSON ile ifade edilen kişinin adı, yaşı ve hobileri şunlardır:

{
    "firstName": "Quinn",
    "lastName": "Anderson",
    "age": "23",
    "hobbies": [
        { "type": "Sports", "value": "Golf" },
        { "type": "Leisure", "value": "Reading" },
        { "type": "Leisure", "value": "Guitar" }
    ]
}

JSON biçimi XML kadar resmi değildir. Bir anahtar/değer çifti modeline, resmi bir veri ifadesinden daha yakındır. Adından tahmin edebileceğiniz gibi, JavaScript programlama dili bu biçim için yerleşik desteğe sahiptir, bu nedenle web geliştirme için popülerdir. XML gibi diğer dillerin de bu veri biçimiyle çalışmak için kullanabileceğiniz çözümleyicileri vardır. JSON'un dezavantajı, daha programcı odaklı olma eğiliminde olmasıdır, bu nedenle teknik olmayan kişilerin okuması ve değiştirmesi daha zordur.

YAML

YAML İşaretleme Dili Değil (YAML), daha yakın zamanda geliştirilen bir veri serileştirme dilidir. YAML kullanmanın avantajlarından biri, insanların okumasının diğer dillerden daha kolay olmasıdır. Veri yapısı, satır ayırma ve girintileme ile tanımlanır. YAML biçimi parantez, virgül ve köşeli ayraç gibi yapısal karakterlere bağımlılığı azaltır.

YAML'de ifade edilen verilerin aynıları aşağıdadır:

firstName: Quinn
lastName: Anderson
age: 23
hobbies:
    - type: Sports
      value: Golf
    - type: Leisure
      value: Reading
    - type: Leisure
      value: Guitar

Bu biçim JSON'dan daha okunabilir ve genellikle kişiler tarafından yazılması gereken ancak programlar tarafından ayrıştırılan yapılandırma dosyaları için kullanılır. YAML, bu veri biçimlerinden en yenileridir.

Yarı yapılandırılmış veya NoSQL verileri nedir?

Aşağıdaki videoda yarı yapılandırılmış veriler ve NoSQL veri depolama seçenekleri açıklanmaktadır:

Yapılandırılmamış veriler

Yapılandırılmamış verilerin organizasyonu tanımlanmamıştır. Yapılandırılmamış veriler genellikle fotoğraf veya video dosyaları gibi dosya biçiminde teslim edilir. Video dosyasının kendisi genel bir yapıya sahip olabilir ve yarı yapılandırılmış meta verilerle birlikte gelebilir, ancak videonun kendisini oluşturan veriler yapılandırılmamış durumdadır. Bu nedenle fotoğraflar, videolar ve benzer diğer dosyalar yapılandırılmamış veri sınıfına girer.

Yapılandırılmamış veri örnekleri:

  • Fotoğraflar, videolar ve ses dosyaları gibi medya dosyaları
  • Word belgeleri gibi Microsoft 365 dosyaları
  • Metin dosyaları
  • Günlük dosyaları

Veri sınıflandırması: Veri türlerinizi değerlendirme

Verileri üç yoldan biriyle sınıflandırabilirsiniz: yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış. Verilerinizi sınıflandırabilmeniz için farklılıkları anlamak, doğru depolama çözümünü seçmenize yardımcı olur.

Yapılandırılmış veriler, veri tablolarına veya sütunlarına düzgün bir şekilde uyan düzenli verilerdir. Yarı yapılandırılmış veriler de düzenlidir, net özellikleri ve değerleri vardır ancak veriler birbirinden farklıdır. Yapılandırılmamış veriler tablolara veya sütunlara düzgün bir şekilde sığmaz ve tekdüzen bir şeması yoktur.

Şimdi çevrimiçi perakende sektöründe kullanılan veri kümelerine göz atalım ve bunları sınıflandıralım.

Ürün kataloğu verileri

Çevrimiçi perakende satış işletmesi için ürün kataloğu verileri doğası gereği yarı yapılandırılmıştır. Her ürünün bir ürün SKU'su, açıklaması, miktarı, fiyatı, boyut seçenekleri, renk seçenekleri, fotoğrafı ve muhtemelen bir videosu vardır. Bu nedenle, hepsi aynı yapıya sahip olduğundan, bu veriler başlangıçta ilişkisel görünür. Ancak, yeni ürünler veya farklı türlerde ürünler tanıttıkça veri alanları eklemek isteyebilirsiniz. Örneğin, taşıdığınız yeni tenis ayakkabıları, ayakkabıdaki sensör verilerini kullanıcının telefonundaki bir fitness uygulamasına aktarmak için Bluetooth özelliklidir. Bu özellik giderek artan bir eğilim gibi görünüyor ve müşterilere "Bluetooth özellikli" ayakkabılara filtre uygulama seçeneği vermek istiyorsunuz. Mevcut tüm ayakkabı verilerinizi Bluetooth özellikli bir özellik ile güncelleştirmek istemezsiniz. Bu yeni özelliği yalnızca yeni ayakkabılara eklemek istiyorsunuz.

Bluetooth özellikli özelliğin eklenmesiyle ayakkabı verileriniz artık homojen değildir. Şemada farklılıklar sağladınız. Bu değişiklik, karşılaşmayı beklediğiniz tek özel durumsa, tüm ürünlerin yapılandırılmış, ilişkisel bir kuruluşu korumak için "Bluetooth özellikli" bir alan içerebilmesi için mevcut verileri normalleştirebilirsiniz. Ancak, gelecekte desteklemeyi hayal ettiğiniz birçok özel alandan yalnızca biriyse, verilerin sınıflandırması yarı yapılandırılmıştır. Veriler etiketlere göre düzenlenir ancak katalogdaki her ürün benzersiz alanlara sahip olabilir.

Ürün kataloğu verilerinin sınıflandırması yarı yapılandırılmıştır.

Fotoğraflar ve videolar

Ürün sayfalarında gösterilen fotoğraflar ve videolar yapılandırılmamış verilerdir. Medya dosyası meta veriler içerse de, medya dosyasının gövdesi yapılandırılmamış.

Fotoğraflar ve videolar için veri sınıflandırması yapılandırılmamış.

İş verileri

İş analistleri stok işlem hattı değerlendirmesi ve satış verisi gözden geçirmesi gerçekleştirmek için iş zekası kullanmak istiyor. Bu işlemleri gerçekleştirmek için birden çok aya ait verilerin toplanması ve ardından sorgulanması gerekir. Benzer verilerin toplanması gerektiğinden, bir ayın bir sonrakiyle karşılaştırılabilmesi için bu verilerin yapılandırılması gerekir.

İş verilerinin sınıflandırması yapılandırılmıştır.

Bilgilerinizi kontrol edin

1.

JSON dosyası ne tür verilerdir?

2.

Video ne tür verilerdir?