Pengertian Data Mining: Proses, Tahapan dan Fungsi Data Mining!

0
Gambar Pengertian Data Mining
Ilustrasi Gambar Pengertian Data Mining

Sebenarnya apa itu Data Mining dan pengertian Data Mining? Pengertian Data Mining adalah adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidaklah sepele, implisit dan tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat dengan kepastian tertentu, berguna dan juga baru.

Data Mining atau penggalian data memiliki beberapa nama alternatif, meskipun definisi tepatnya yang berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, E-commerce, data saham, data sensus dan data bioinformatika), tetapi tidak tahu pola apa yang bisa untuk didapatkan.

Terdapat beberapa istilah lain yang mempunyai makna sesuai dengan data mining, yaitu Knowledge discovery in databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern analysis), kecerdasan usaha (business intelligence) dan data archaeology dan juga data dredging (Larose, 2005). Kemampuan Data mining atau Penggalian Data (dalam bahasa Indonesia) dalam mencari informasi bisnis yang berharga dari basis data yang sangat besar ini, bisa dianalogikan dengan penambangan logam mulia oleh lahan sumbernya, teknologi ini biasa digunakan untuk:

  • Prediksi trend dan juga sifat-sifat bisnis, dimana data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar.
  • Penemuan pola-pola yang mana pola-pola tersebut tidak diketahui sebelumnya, dimana data mining menyapu basis data, lalu mengidentifikasi pola-pola yang sebelumnya tersembunyi didalam satu sapuan.
  • Membuat keputusan penting. Data mining berguna bagi membuat keputusan yang kritis, terutama didalam strategi.

Pengertian Data Mining Menurut Para Ahli

1. Larose

Berikut ini beberapa definisi dan pengertian data mining oleh beberapa sumber (Larose, 2005):

  • Data mining ini adalah proses menemukan sesuatu yang bermakna oleh suatu korelasi baru, pola dan juga tren yang terdapat dengan cara memilah-milah data yang berukuran besar yang mana data tersebut disimpan dalam repositori, menggunakan teknologi sosialisasi pola serta teknik matematika dan statistik.
  • Data mining adalah analisis pengamatan database bagi menemukan hubungan yang tidaklah terduga dan juga buat meringkas data dengan cara atau metode baru yang dapat dimengerti dan berguna pada pemilik data.
  • Data mining merupakan bidang ilmu interdisipliner yang menyatukan teknik pembelajaran oleh mesin (machine learning), pengenalan pola (pattern recognition), statistik, database, dan juga visualisasi buat mengatasi kasus ekstraksi informasi oleh basis data yang besar.
  • Data mining ini diartikan Sebagaimana suatu proses ekstraksi informasi yang berguna dan juga potensial oleh sekumpulan data yang secara implisit terdapat didalam suatu basis data.
Baca Juga :  CSS Adalah: Pengertian, Penggunaan dan Cara Menerapkan CSS

2. Turban Dkk.

Data Mining adalah proses yang memakai teknik statistik, matematika, kecerdasan protesis, machine learning buat mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan juga pengetahuan yang terkait oleh berbagai database besar (Turban dkk. 2005).

Proses Data Mining

Berdasarkan pengertian data mining di atas, proses yang umumnya dilakukan data mining diantaranya: deskripsi, prediksi, estimasi, klasifikasi, clustering dan juga asosiasi. Secara detailnya proses data mining ini dijelaskan sebagai berikut (Larose, 2005):

a. Deskripsi

Deskripsi bertujuan buat mengidentifikasi pola yang timbul secara berulang pada suatu data dan mengubah pola tersebut menjadi aturan dan kriteria yang mampu gampang dimengerti oleh para pakar kepada domain aplikasinya. Aturan yang didapatkan harus mudah dimengerti agar dapat dengan ampuh mempertinggi tingkat pengetahuan (knowledge) pada sistem. Tugas deskriptif merupakan tugas data mining yang sering dibutuhkan kepada teknik postprocessing buat melakukan validasi dan juga mengungkapkan hasil oleh proses data mining. Postprocessing merupakan proses yang dipakai buat memastikan hanya hasil yang valid dan juga berguna yang dapat dipakai oleh pihak yang berkepentingan.

b. Prediksi

Prediksi memiliki kemiripan dengan dan juga penjabaran, akan tetapi data diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan akan datang pada masa yang akan datang. Contoh dari tugas prediksi misalnya buat memprediksikan adanya pengurangan jumlah pelanggan didalam waktu dekat dan prediksi harga saham didalam tiga bulan yang akan datang.

c. Estimasi

Estimasi hampir sama dengan prediksi, kecuali untuk variabel target perkiraannya lebih ke arah numerik dari kepada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai oleh variabel target Sebagaimana nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai oleh variabel target dibentuk menurut nilai variabel prediksi. Sebagai contoh, akan dilakukan perkiraan tekanan darah sistolik kepada pasien tempat tinggal sakit berdasarkan umur pasien, jenis kelamin, berat badan, dan juga level sodium darah. Hubungan antara tekanan darah sistolik dan juga nilai variabel prediksi didalam proses pembelajaran akan menghasilkan model estimasi.

Baca Juga :  Pengertian Engagement (Keterlibatan) dalam Media Sosial Lengkap

d. Klasifikasi

Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang mendeskripsikan dan juga membedakan data ke didalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan karakteristik oleh objek dan memasukkan objek ke didalam salah satu kelas yang telah didefinisikan sebelumnya.

e. Clustering

Clustering adalah pengelompokan data tanpa berdasarkan kelas data eksklusif ke dalam kelas objek yang sesuai. Sebuah kluster merupakan kumpulan record yang mempunyai kemiripan suatu dengan dan juga yang lainnya dan juga mempunyai ketidakmiripan dengan record didalam kluster lain. Tujuannya merupakan bagi membentuk pengelompokan objek yang seperti satu sama lain dalam gerombolan-gerombolan. Semakin besar kemiripan objek didalam suatu cluster dan juga semakin besar disparitas tiap cluster maka kualitas analisis cluster semakin baik.

f. Asosiasi

Tugas asosiasi dalam data mining yaitu adalah menemukan atribut yang timbul dalam suatu waktu. Dalam dunia bisnis, ini lebih awamnya dianggap analisis keranjang belanja (market basket analisys). Tugas asosiasi berusaha agar mengungkap anggaran untuk mengukur hubungan antara dua atau lebih atribut yang ada.

Tahapan Data Mining

Gambar Pengertian Data Mining
Ilustrasi Gambar Tahapan Data Mining

Tahapan yang dilakukan terhadap proses data mining ini biasanya dimulai dari seleksi data dari data sumber ke data sasaran, tahap preprocessing buat memperbaiki kualitas data, transformasi, data mining dan tahap interpretasi dan juga evaluasi yang membuat hasil berupa pengetahuan baru yang dibutuhkan memberikan kontribusi yang lebih baik. Secara detail dijelaskan sebagai berikut (Fayyad, 1996):

a. Data selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum menuju tahap penggalian informasi dalam KDD dimulai. Data output seleksi yang dipakai buat proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

Baca Juga :  Pengertian Version Control Adalah: Tujuan, Manfaat dan Contoh VCS

b. Pre-processing/cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning terhadap data yang menjadi fokus KDD. Proses cleaning meliputi diantaranya membuang duplikasi data, mengusut data yang inkonsisten, dan memperbaiki kesalahan pada data.

c. Transformation

Coding adalah proses transformasi kepada data yang sudah dipilih, dan sehingga data tersebut sesuai untuk proses data miningnya. Proses coding didalam KDD adalah proses yang kreatif dan sangat tergantung terhadap jenis atau pola informasi yang akan dicari dalam basis data.

d. Data mining

Data mining adalah proses mencari pola atau informasi menarik didalam data terpilih dengan menggunakan teknik atau metode tertentu saja. Teknik, metode, atau algoritma didalam data mining ini sangat bervariasi. Pemilihan metode atau prosedur pemecahan yang tepat sangat bergantung kepada tujuan dan juga proses KDD secara keseluruhan.

e. Interpretation/evalution

Pola informasi yang didapatkan dari proses data mining ini perlu ditampilkan dalam bentuk yang gampang dimengerti dari pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini meliputi inspeksi apakah pola atau informasi yang ditemukan bertentangan dengan dan juga liputan atau hipotesis yang terdapat sebelumnya.

Fungsi Data Mining

Data mining memiliki fungsi yang penting dalam membantu menerima informasi yang ampuh serta mempertinggi pengetahuan buat pengguna. Pada dasarnya, data mining ini memiliki empat fungsi dasar yakni:

  • Fungsi Prediksi (prediction). Proses buat menemukan pola dari data dengan dan juga menggunakan beberapa variabel buat memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.
  • Fungsi Deskripsi (description). Proses untuk menemukan suatu ciri krusial dari data didalam suatu basis data.
  • Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses bagi menemukan contoh atau fungsi bagi menggambarkan group atau konsep oleh suatu data. Proses yang digunakan bagi menggambarkan data yang penting dan bisa meramalkan kecenderungan data pada masa depan.
  • Fungsi Asosiasi (association). Proses ini dipakai bagi menemukan suatu hubungan yang terdapat terhadap nilai atribut dari sekumpulan data.

Demikianlah ulasan singkat Kami kali ini mengenai pengertian Data Mining dan penjelasannya secara lengkap. Semoga dapat bermanfaat dan menambah wawasan Kita semua. Sekian dari Saya, Terima Kasih.

Tinggalkan Komentar