- Definisi Data:
- Data adalah informasi yang tidak terorganisir dan perlu diproses agar memiliki makna.
- Data terdiri dari fakta, observasi, persepsi, angka, karakter, simbol, dan gambar yang dapat diinterpretasikan untuk menghasilkan makna.
- Kategori Data Berdasarkan Struktur:
- Data dapat dikategorikan menjadi 3 jenis berdasarkan strukturnya:
- Structured Data (Data Terstruktur).
- Semi-structured Data (Data Semi-terstruktur).
- Unstructured Data (Data Tidak Terstruktur).
- Data dapat dikategorikan menjadi 3 jenis berdasarkan strukturnya:
- Structured Data (Data Terstruktur):
- Memiliki struktur yang terdefinisi dengan baik atau mengikuti model data tertentu.
- Dapat disimpan dalam skema yang terdefinisi, seperti database, dan sering direpresentasikan dalam bentuk tabel (baris dan kolom).
- Berisi fakta objektif dan angka yang dapat dikumpulkan, disimpan, dan diorganisir dalam database.
- Sumber Data Terstruktur:
- Database SQL.
- Sistem OLTP (Online Transaction Processing) untuk transaksi bisnis.
- Spreadsheet (Excel, Google Spreadsheets).
- Formulir online.
- Sensor (GPS, RFID).
- Log server web dan jaringan.
- Penyimpanan: Biasanya disimpan dalam database relasional (SQL).
- Analisis: Mudah dianalisis dengan metode dan alat analisis data standar.
- Semi-structured Data (Data Semi-terstruktur):
- Memiliki beberapa properti organisasi tetapi tidak memiliki skema yang kaku.
- Tidak dapat disimpan dalam bentuk baris dan kolom seperti database.
- Menggunakan tag, elemen, atau metadata untuk mengelompokkan dan mengorganisir data dalam hierarki.
- Sumber Data Semi-terstruktur:
- Email.
- XML dan bahasa markup lainnya.
- File biner (executables).
- Paket TCP/IP.
- File terkompresi (zip).
- Integrasi data dari berbagai sumber.
- Format Penyimpanan: XML dan JSON sering digunakan untuk menyimpan dan bertukar data semi-terstruktur karena memungkinkan definisi tag dan atribut.
- Unstructured Data (Data Tidak Terstruktur):
- Tidak memiliki struktur yang mudah diidentifikasi dan tidak dapat diorganisir dalam database relasional (baris dan kolom).
- Tidak mengikuti format, urutan, semantik, atau aturan tertentu.
- Dapat menangani heterogenitas sumber dan memiliki aplikasi dalam business intelligence dan analitik.
- Sumber Data Tidak Terstruktur:
- Halaman web.
- Feed media sosial.
- Gambar (JPEG, GIF, PNG).
- File video dan audio.
- Dokumen dan PDF.
- Presentasi PowerPoint.
- Log media.
- Survei.
- Penyimpanan: Disimpan dalam file/dokumen (seperti Word) untuk analisis manual atau di database NoSQL yang memiliki alat analisis khusus.
- Ringkasan:
- Structured Data: Terorganisir dengan baik, disimpan dalam database, dan mudah dianalisis dengan alat standar.
- Semi-structured Data: Sebagian terorganisir, menggunakan metadata untuk pengelompokan dan hierarki.
- Unstructured Data: Tidak terorganisir secara konvensional, disimpan dalam file atau database NoSQL.
Catatan Tambahan:
- Pelajari lebih lanjut tentang jenis struktur file untuk memahami cara menyimpan dan memproses setiap jenis data.
- Pahami alat dan metode yang sesuai untuk menganalisis setiap kategori data.
Leave a Reply