Buka 2026 dengan Skill Baru
Diskon 25% untuk Semua Kelas di ITBOX
Periode 4-10 Desember 2025
Hari
Jam
Menit
Detik
SKILLBOX
Periode promo 17-24 Oktober 2025

Data Set Adalah: Pengertian, Jenis, dan Contohnya

March 1, 2024

Data set

Buat kamu yang udah sering bermain dengan data, kamu pasti nggak asing dengan data set. Tapi apa, sih, data set, dan apa contohnya?Data adalah komponen penting dalam bisnis dan perusahaan di era digital ini. Di dunia data science, bagaimana kita berinteraksi dengan data tidak terlepas dari penggunaan data set. Di artikel ini, MinDi bakal jelasin, apa itu data set, dan apa saja contoh-contoh data set yang bisa kita gunakan. Baca sampai habis, ya!

Apa itu Data Set?

Data set merupakan kumpulan data yang diatur dalam format yang terstruktur, seperti tabel atau file, dan berisi informasi dari berbagai sumber. Data set dapat berupa data numerik, teks, gambar, atau gabungan dari semuanya. Keberagaman jenis data set ini memungkinkan aplikasi dalam berbagai industri dan disiplin ilmu.

Data set dikumpulkan oleh profesional di bidang data, seperti data analyst. Untuk bisa digunakan, data set perlu melewati beberapa tahapan pengolahan data, seperti data cleaning dan kategorisasi. Sehingga, data set yang dapat digunakan oleh profesional biasanya terkumpul berdasarkan kategorinya masing-masing, dan di dalamnya terdapat variabel-variabel yang saling berhubungan.

Jenis-jenis Data Set

Berikut jenis data set yang dapat Anda pilih untuk memudahkan pekerjaan: 

Numerical Data Set

Numerical Data set merupakan data yang terdiri dari data numerik. Data numerik merupakan data yang dapat dihitung, diukur dan diolah menggunakan penghitungan matematik. Contoh dari numerical data set yaitu jumlah siswa laki-laki dan siswa perempuan dalam satu kelas. Kemudian dijumlahkan untuk mendapatkan jumlah keseluruhan siswa dalam kelas tersebut. 

Correlation Data Set

Correlation data set merupakan data yang terdiri dari dua entitas atau variabel yang menunjukkan suatu bentuk hubungan satu sama lain. Contoh dari data correlation data set yaitu adanya asumsi bahwa orang yang tinggi cenderung lebih berat daripada orang yang pendek, di sini variabel berat badan dan tinggi badan saling berkaitan satu sama lain. 

Categorical Data Set

Categorical data set merupakan data yang terdiri dari kumpulan informasi yang dapat dibagi menjadi beberapa kelompok. Data yang dihasilkan dikatakan categorical karena dapat dikelompokkan berdasarkan variabel yang sama. Contohnya, dalam biodata seperti jenis kelamin, negara tempat tinggal dan lain sebagainya. 

Multivariate Data Set

Multivariate data set merupakan sekumpulan data yang terdiri dari dua variabel atau lebih. Contoh dari data multivariate data set yaitu kumpulan data tinggi badan dan berat badan siswa dalam satu kelas. Mengapa dikatakan multivariate data set karena terdapat dua variabel yaitu, tinggi badan dan berat badan siswa. 

Bivariate Data Set

Bivariate Data Set merupakan data yang dikumpulkan ke dalam dua variabel dan dalam setiap titik variabel memiliki data yang sesuai dengan nilainya. Contohnya, Anda dapat mengumpulkan data suhu luar dengan penjualan es campur. 

Contoh Data Set

Biar kamu makin paham tentang data set, yuk kita lihat contoh-contoh berikut.

Populasi Ternak

No.KecamatanSapiKerbauKuda
1Sanga Desa1769620
2Babat Toman14124000
3Batanghari Leko734570
4Plakat Tinggi467500
5Lawang Wetan130800

Data set di atas menggambarkan populasi ternak dari berbagai kecamatan di suatu wilayah. Dalam data set tersebut, terdapat nama-nama kecamatan, dan populasi dari hewan-hewan ternak seperti sapi, kerbau, dan kuda.

Dari data set tersebut, kamu bisa mengambil beberapa informasi, seperti populasi ternak total pada suatu kecamatan, atau mencari kecamatan mana yang memiliki populasi hewan tertentu paling banyak.

Netflix Userbase

User IDSubscription TypeJoin DateLast Payment DateCountryAgeDevice
1Basic15-01-2210/6/2023United States28Smartphone
2Premium5/9/202122-06-23Canada35Tablet
3Standard28-02-2327-06-23United Kingdom42Smart TV
4Standard10/7/202226-06-23Australia51Laptop
5Basic1/5/202328-06-23Germany33Smartphone

Data set selanjutnya adalah contoh userbase dari Netflix, yang dapat diunduh pada situs Kaggle. Pada userbase tersebut, ada beberapa dimensi yang tercakup, seperti jenis langganan, tanggal berlayanan pertama dan terbaru, negara asal, umur, dan perangkat penggunaan.

Dari kategori yang banyak ini, kamu bisa mengambil banyak informasi pula. Misalnya, kamu dapat mencari informasi tentang retention rate. Dari kolom country, kamu juga bisa membuat peta data. Masih banyak lagi informasi yang bisa kamu gali.

Selain itu, kamu juga bisa lihat bahwa pada data set di atas, format penanggalan berbeda-beda untuk setiap barisnya. Hal itu menandakan bahwa kamu perlu memberlakukan formatting terlebih dahulu agar data lebih mudah diolah.

Kegiatan Radiologi dan Pelayanan Rumah Sakit

BulanFoto tanpa bahan kontrasFoto dengan bahan kontrasFoto gigiUSGCT Scan di kepalaCT Scan di luar kepala
  Januari2109010300
  Februari199508800
  Maret2351008100
  April201409700

Contoh data set terakhir adalah data set tentang kegiatan radiologi di suatu rumah sakit dari bulan Januari hingga April. Di dalam data set, ada beberapa layanan, dan banyaknya akses terhadap layanan tersebut tiap bulannya.

Seperti data set populasi ternak di atas, data set ini juga memberikan informasi numerik untuk berbagai layanan dan bulan yang berbeda-beda. Kamu bisa menyimpulkan layanan mana yang paling banyak diakses, juga bulan apa yang paling banyak aktivitas.

Public Data Set yang Bisa Kamu Akses

Kalau kamu ingin mencoba mengolah data set secara mandiri, ada beberapa situs yang memberikan data set publik dan dapat kamu akses. Berikut adalah beberapa contohnya.

  • Kaggle. Kaggle merupakan situs yang berisi beragam data set untuk berbagai kondisi dan kasus.
  • Google Dataset Search. Yang satu ini sama seperti search engine Google pada umumnya, namun dikhususkan untuk pencarian data set. Kamu menulis informasi yang ingin kamu cari, dan Google Dataset Search akan memberikan link ke situs yang menyediakan data set buat kamu.
  • Datahub.io. Situs ini juga menyediakan banyak data, khususnya yang berhubungan dengan bisnis. Namun kamu perlu membuat akun, dan beberapa data set juga memerlukan akses khusus.
  • Data.go.id. Kalau kamu ingin mencari data-data dalam negeri yang dikumpulkan oleh pemerinthan, kamu bisa periksa situs ini.

Apabila Anda yang tertarik mempelajari lebih dalam mengenai penggunaan data set, Anda dapat mengikuti kursus IT online di Coding Studio, untuk informasi lebih lanjutnya Anda dapat menghubungi link resmi ITBOX.

Share Artikel
Shopping cart0
There are no products in the cart!
Continue shopping
0

Level

Course Level

Category

Skill