Kategori Data Berdasarkan Struktur

  1. Definisi Data:
    • Data adalah informasi yang tidak terorganisir dan perlu diproses agar memiliki makna.
    • Data terdiri dari fakta, observasi, persepsi, angka, karakter, simbol, dan gambar yang dapat diinterpretasikan untuk menghasilkan makna.
  2. Kategori Data Berdasarkan Struktur:
    • Data dapat dikategorikan menjadi 3 jenis berdasarkan strukturnya:
      • Structured Data (Data Terstruktur).
      • Semi-structured Data (Data Semi-terstruktur).
      • Unstructured Data (Data Tidak Terstruktur).
  3. Structured Data (Data Terstruktur):
    • Memiliki struktur yang terdefinisi dengan baik atau mengikuti model data tertentu.
    • Dapat disimpan dalam skema yang terdefinisi, seperti database, dan sering direpresentasikan dalam bentuk tabel (baris dan kolom).
    • Berisi fakta objektif dan angka yang dapat dikumpulkan, disimpan, dan diorganisir dalam database.
    • Sumber Data Terstruktur:
      • Database SQL.
      • Sistem OLTP (Online Transaction Processing) untuk transaksi bisnis.
      • Spreadsheet (Excel, Google Spreadsheets).
      • Formulir online.
      • Sensor (GPS, RFID).
      • Log server web dan jaringan.
    • Penyimpanan: Biasanya disimpan dalam database relasional (SQL).
    • Analisis: Mudah dianalisis dengan metode dan alat analisis data standar.
  4. Semi-structured Data (Data Semi-terstruktur):
    • Memiliki beberapa properti organisasi tetapi tidak memiliki skema yang kaku.
    • Tidak dapat disimpan dalam bentuk baris dan kolom seperti database.
    • Menggunakan tag, elemen, atau metadata untuk mengelompokkan dan mengorganisir data dalam hierarki.
    • Sumber Data Semi-terstruktur:
      • Email.
      • XML dan bahasa markup lainnya.
      • File biner (executables).
      • Paket TCP/IP.
      • File terkompresi (zip).
      • Integrasi data dari berbagai sumber.
    • Format Penyimpanan: XML dan JSON sering digunakan untuk menyimpan dan bertukar data semi-terstruktur karena memungkinkan definisi tag dan atribut.
  5. Unstructured Data (Data Tidak Terstruktur):
    • Tidak memiliki struktur yang mudah diidentifikasi dan tidak dapat diorganisir dalam database relasional (baris dan kolom).
    • Tidak mengikuti format, urutan, semantik, atau aturan tertentu.
    • Dapat menangani heterogenitas sumber dan memiliki aplikasi dalam business intelligence dan analitik.
    • Sumber Data Tidak Terstruktur:
      • Halaman web.
      • Feed media sosial.
      • Gambar (JPEG, GIF, PNG).
      • File video dan audio.
      • Dokumen dan PDF.
      • Presentasi PowerPoint.
      • Log media.
      • Survei.
    • Penyimpanan: Disimpan dalam file/dokumen (seperti Word) untuk analisis manual atau di database NoSQL yang memiliki alat analisis khusus.
  6. Ringkasan:
    • Structured Data: Terorganisir dengan baik, disimpan dalam database, dan mudah dianalisis dengan alat standar.
    • Semi-structured Data: Sebagian terorganisir, menggunakan metadata untuk pengelompokan dan hierarki.
    • Unstructured Data: Tidak terorganisir secara konvensional, disimpan dalam file atau database NoSQL.

Catatan Tambahan:

  • Pelajari lebih lanjut tentang jenis struktur file untuk memahami cara menyimpan dan memproses setiap jenis data.
  • Pahami alat dan metode yang sesuai untuk menganalisis setiap kategori data.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *