Mengenal Pengertian Data Mining: Menurut Ahli, Sejarah, Fungsi, Jenis, Proses dan Tahapannya!

0
Gambar Pengertian Data Mining Penambangan Atau Penggalian Data Menurut Para Ahli Sejarah Fungsi Jenis Proses Dan Tahapannya
Gambar Pengertian Data Mining Penambangan Atau Penggalian Data Menurut Para Ahli Sejarah Fungsi Jenis Proses Dan Tahapannya

Tahukah Kalian Pengertian Data Mining, Apa itu Penambangan atau Penggalian Data? Menurut Para Ahli, Sejarah, Fungsi, Jenis, Proses dan Tahapannya? Ya! Data Mining dapat membantu kita mengidentifikasi pelanggan terbaik kita. Organisasi dapat menggunakan Teknik Data Mining untuk menganalisis pembelian pelanggan sebelumnya dan memperkirakan apa yang mungkin akan dibeli oleh pelanggan di masa mendatang. Hal tersebut juga dapat menyoroti pembelian yang tidak biasa bagi pelanggan dan mungkin mengindikasikan penipuan.

Sebuah Perusahaan dapat menggunakan untuk menemukan Inefisiensi dalam proses manufaktur, potensi cacat pada produk atau kelemahan dalam rantai pasokan. Strategi Manajemen Data yang baik adalah yang meliputi Data Mining. Betul! Dalam postingan kali ini, Kami akan membahas secara lengkap tentang Apa itu Pengertian Data Mining. Mari simak ulasannya di bawah ini!

Pengertian Data Mining

Penambangan Data atau Data Mining adalah proses yang digunakan oleh perusahaan untuk mengubah Data mentah menjadi Informasi yang bermanfaat. Dengan menggunakan Software atau Perangkat Lunak untuk mencari pola dalam kumpulan Data yang besar seperti Big Data, bisnis dapat belajar lebih banyak tentang pelanggan mereka untuk mengembangkan strategi pemasaran yang lebih efektif, meningkatkan penjualan dan mengurangi biaya. Penambangan Data tergantung pada pengumpulan Data yang efektif, pergudangan, dan pemrosesan Komputer berdasarkan simpulan yang Kami ambil dari Situs Investopedia.

Apa itu Data Mining (Penambangan atau Penggalian Data)?

Gambar Dari Apa Itu Data Mining Penambangan Atau Penggalian Data Menurut Para Ahli Sejarah Fungsi Jenis Proses Dan Tahapannya
Gambar Dari Apa Itu Data Mining Penambangan Atau Penggalian Data Menurut Para Ahli Sejarah Fungsi Jenis Proses Dan Tahapannya

Jadi, Apa itu sebenarnya Data Mining? Mengacu pada penjelasan di atas Pengertian Data Mining adalah ekstraksi pola yang menarik dari Data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak biasa, implisit dan tidak diketahui sebelumnya, serta juga berguna. Pola yang disajikannya haruslah mudah dipahami, berlaku untuk Data yang akan diprediksi dengan derajat dengan kepastian tertentu, berguna serta baru.

Penggalian Data diperlukan saat Data yang tersedia terlalu banyak (misalnya Data yang diperoleh dari Sistem Basis Data sebuah Perusahaan, E-commerce, Data Saham, Data Sensus dan Data Bioinformatika), tetapi tidak tahu pola apa yang bisa untuk didapatkan. Terdapat beberapa Istilah lain yang mempunyai makna yang sama dengan apa itu Data Mining, yaitu Knowledge Discovery in Databases (KDD), Ekstraksi Pengetahuan (Knowledge Extraction), Analisa Data/Pola (Data/Pattern Analysis), Kecerdasan Usaha (Business Intelligence) dan Data Archeology serta Data Dredging (Larose, 2005).

Kemampuan Data Mining atau Penggalian Data (dalam bahasa Indonesia) dalam mencari Informasi bisnis yang berharga dari Basis Data atau Database yang sangat besar ini, bisa dianalogikan dengan penambangan logam mulia dari lahan sumbernya, dapat Kami katakan Teknologi ini biasa digunakan untuk:

  • Prediksi Trend dan Sifat-Sifat Bisnis; Dimana Data Mining disini mengotomatisasi proses pencarian Informasi pemprediksi di dalam Basis Data yang besar.
  • Penemuan Pola-Pola; Yang mana pola-pola tersebut tidak diketahui sebelumnya, disini Data Mining menyapu Basis Data, lalu mengidentifikasi pola-pola yang sebelumnya tersembunyi di dalam sapuan tersebut.
  • Membuat Keputusan Penting; Data mining berguna untuk membuat sebuah keputusan yang penting atau kritis, terutama didalam strategi.

Pengertian Data Mining Menurut Para Ahli

Membahas mengenai Data Mining, agar lebih memahaminya, kita juga harus merujuk kepada Pendapat Para Ahli terkait Definisi mereka tentang Data Mining. Adapun Pengertian Data Mining Menurut Para Ahli adalah sebagai berikut:

1. Larose

Menurut Larose (2005), Berikut ini beberapa Pengertian dan Definisi Data Mining dari beberapa sumber:

  • Data Mining adalah proses menemukan sesuatu yang bermakna oleh suatu korelasi baru, pola dan juga tren yang terdapat dengan cara memilah-milah Data yang berukuran besar, dimana Data tersebut disimpan dalam Repository atau Repositori, menggunakan Teknologi Sosialisasi Pola serta Statistik dan Teknik Matematika.
  • Pengertian Data Mining adalah Analisis pengamatan Database dalam menemukan hubungan yang tidak terduga serta juga untuk meringkas Data dengan cara atau sebuah Metode baru yang dapat dimengerti yang berguna pada pemilik Data.
  • Data Mining merupakan bidang Ilmu Interdisipliner yang menyatukan Teknik Pembelajaran berdasarkan Mesin atau bisa disebut dengan Machine Learning, Pengenalan Pola (Pattern Recognition), Databases, Statistik dan juga Visualisasi dalam mengatasi kasus ekstraksi Informasi dari sebuah Basis Data yang besar atau Big Database.
  • Pengertian Data Mining ini diartikan sebagai suatu proses ekstraksi sebuah Informasi yang berguna serta juga potensial dari sekumpulan Data yang secara implisit terdapat didalam suatu Kumpulan Data atau Database.
Baca Juga :  Ini Pengertian Hilal (Bulan Sabit): Penentuan dan Dzikir ketika Melihatnya!

2. Turban Dkk.

Menurut Turban Dkk. (2005), Data Mining adalah proses yang memakai Teknik Statistik, Teknik Matematika, Kecerdasan Protesis, Machine Learning dalam melakukan ekstraksi dan mengidentifikasi Informasi yang bermanfaat serta pengetahuan yang terkait oleh berbagai Database (yang berukuran) besar.

Sejarah Data Mining

Membahas mengenai Apa itu Pengertian Data Mining, pastinya kita juga harus mengetahui Sejarah Data Mining. Salah satu Artikel pertama yang menggunakan Frasa “Data Mining” diterbitkan oleh Michael C. Lovell pada Tahun 1983. Pada saat itu, Lovell dan banyak ekonom lain mengambil pandangan yang cukup negatif dari praktik tersebut, percaya bahwa Statistik dapat mengarah pada kesimpulan yang salah ketika tidak diinformasikan oleh pengetahuan tentang materi pelajaran.

Tetapi pada Tahun 1990-an, gagasan untuk mengekstraksi nilai dari Data dengan mengidentifikasi Pattern atau Pola telah menjadi jauh lebih populer. Database dan Vendor Data Warehouse mulai menggunakan kata kunci untuk memasarkan Perangkat Lunak mereka. Dan perusahaan mulai menyadari manfaat potensial dari praktik tersebut.

Pada Tahun 1996, sekelompok perusahaan yang termasuk Teradata dan NCR memimpin proyek untuk menstandarisasi dan memformalkan metodologi penambangan Data. Pekerjaan mereka menghasilkan Proses Standar Lintas-Industri untuk Penambangan Data atau Cross-Industry Standard Process for Data Mining (CRISP-DM). Standar terbuka ini memecah proses Data Mining menjadi 6 (Enam) Fase:

  • Business Understanding (Pemahaman Bisnis)
  • Data Understanding (Pemahaman Data)
  • Data Preparation (Persiapan Data)
  • Modelling (Pemodelan)
  • Evaluation (Evaluasi)
  • Deployment (Penyebaran)

Perusahaan seperti IBM terus mempromosikan Model CRISP-DM ini hingga sekarang, dan pada Tahun 2015, IBM merilis versi terbaru yang memperluas Model Dasarnya.

Pada awal Tahun 2000-an, perusahaan Web mulai melihat kekuatan dari Data Mining, dan praktiknya benar-benar berjalan bahkan sampai sekarang ii. Sementara Frase “Data Mining” sejak saat itu telah dikalahkan oleh kata kunci lain seperti “Data Analytics atau Analisis Data” “Big Data” dan “Machine Learning” prosesnya tetap menjadi bagian Integral dari praktik bisnis. Bahkan, wajar untuk mengatakan bahwa Data Mining telah menjadi bagian De Facto dari menjalankan Bisnis Modern.

Fungsi Data Mining

Dalam membahas Apa itu Pengertian Data Mining, perlu kalian ketahui bahwa Data Mining memiliki Fungsi yang penting dalam membantu kita mendapatkan Informasi yang efektif serta meningkatkan pengetahuan untuk penggunanya. Pada dasarnya, Data Mining ini memiliki 4 (Empat) Fungsi Dasar yaitu adalah:

  1. Prediction (Prediksi)
  2. Description (Deskripsi)
  3. Classification (Klasifikasi)
  4. Association (Asosiasi)

Di bawah ini adalah penjelasan dari masing-masing Fungsi Data Mining secara detailnya.

1. Prediction (Prediksi)

Fungsi Data Mining yang pertama adalah Prediction. Prediction (Prediksi) adalah Proses untuk menemukan pola dari Data dengan dan juga menggunakan beberapa Variabel untuk memprediksikan Variabel lainnya yang tidak diketahui jenis atau nilainya.

2. Description (Deskripsi)

Fungsi Description (Deskripsi) adalah Proses untuk menemukan suatu ciri krusial dari Data yang terdapat didalam suatu Basis Data atau Database.

3. Classification (Klasifikasi)

Fungsi berikutnya adalah Klasifikasi. Classification (Klasifikasi) adalah suatu proses untuk menemukan contoh atau fungsi agar dapat menggambarkan Group atau Konsep dari suatu Data. Proses yang digunakan untuk menggambarkan Data tersebut adalah merupakan hal yang penting serta juga bisa memprediksi kecenderungan Data yang ada pada masa depan (mendatang).

4. Association (Asosiasi)

Association (Asosiasi) adalah Proses yang dipakai untuk menemukan suatu hubungan yang terdapat pada Nilai Atribut daripada sekumpulan Data.

Jenis-Jenis Data Mining

Ilustrasi Gambar Jenis Data Mining Atau Penggalian Penambangan Data Dalam Membahas Pengertiannya
Ilustrasi Gambar Jenis Data Mining Atau Penggalian Penambangan Data Dalam Membahas Pengertiannya

Mengacu pada pembahasan Pengertian dan Sejarah Data Mining di atas, perlu kalian ketahui bahwa, para Ilmuwan dan Analis Data menggunakan berbagai Teknik Data Mining untuk mencapai tujuan mereka. Adapun beberapa Jenis Data Mining yang paling umum digunakan adalah sebagai berikut.

Baca Juga :  Memahami Pengertian Google: Apa itu Google? Sejarah, Tujuan dan Manfaatnya!

a. Clustering

Pengelompokan atau Clustering melibatkan menemukan kelompok dengan karakteristik yang sama. Misalnya, pemasar sering menggunakan Clustering ini untuk mengidentifikasi kelompok dan subkelompok dalam target pasar mereka. Clustering bermanfaat ketika Anda tidak tahu kesamaan apa yang mungkin ada dalam data Anda.

b. Classification

Jenis Data Mining yang selanjutnya yaitu adalah Classification. Jenis Data Mining ini mengurutkan Item (atau individu) ke dalam kategori berdasarkan model yang telah dipelajari sebelumnya. Klasifikasi sering muncul setelah pengelompokan (walaupun Anda juga dapat membuat suatu Sistem untuk mengklasifikasikan Data berdasarkan kategori yang didefinisikan oleh Ilmuwan atau Analis Data).

c. Association

Jenis Data Mining Association mengidentifikasi potongan-potongan Data yang biasanya ditemukan berdekatan satu sama lain. Ini adalah teknik yang menggerakkan sebagian besar mesin rekomendasi, seperti ketika Amazon menyarankan bahwa jika Anda membeli satu item, Anda mungkin juga menyukai item lain.

d. Anomaly Detection

Anomaly Detection atau Deteksi Anomali mencari potongan Data yang tidak sesuai dengan pola yang biasa. Teknik-teknik ini sangat berguna untuk deteksi penipuan.

e. Regression

Regression adalah alat statistik yang lebih maju yang umum dalam analitik prediktif. Ini dapat membantu pengembang Media Sosial dan Aplikasi Smartphone meningkatkan keterlibatan atau yang biasa disebut dengan Engagement, dan juga dapat membantu memperkirakan penjualan di masa mendatang dan meminimalkan risiko. Regresi dan klasifikasi juga dapat digunakan bersama dalam Model Tree (Pohon) yang berguna dalam berbagai situasi.

f. Text Mining

Penambangan Teks atau Text Mining adalah Jenis Data Mining yang menganalisis seberapa sering orang menggunakan kata-kata tertentu. Ini dapat berguna untuk sentimen atau analisis kepribadian, serta untuk menganalisis Postingan Media Sosial untuk tujuan pemasaran atau untuk menemukan potensi kebocoran data dari karyawan.

g. Summarization

Peringkasan atau Summarization adalah jenis Data Mining dengan menempatkan sekelompok Data ke dalam bentuk yang lebih ringkas, lebih mudah dipahami. Sebagai contoh, misalnya, Anda dapat menggunakan ringkasan untuk membuat Grafik atau menghitung rata-rata dari Set Data yang diberikan. Summarization adalah salah satu bentuk Penambangan Data yang paling akrab dan dapat diakses.

Proses Data Mining

Ilustrasi Gambar Proses Data Mining Penambangan Atau Penggalian Data Dalam Pembahasan Pengertiannya
Ilustrasi Gambar Proses Data Mining Penambangan Atau Penggalian Data Dalam Pembahasan Pengertiannya

Berdasarkan Pengertian Data Mining di atas, proses yang umumnya dilakukan dan terdapat dalam Data Mining diantaranya adalah Deskripsi, Prediksi, Estimasi, Klasifikasi, Clustering dan juga Asosiasi. Hal ini sesuai dengan pendapat Larose (2005), secara detailnya, Proses Data Mining ini akan Kami jelaskan sebagai berikut:

a. Deskripsi

Proses Deskripsi bertujuan untuk mengidentifikasi pola yang timbul secara berulang pada suatu Data dan mengubah pola tersebut menjadi aturan dan kriteria yang dapat dan mudah dimengerti oleh Para Ahli pada Domain Aplikasinya. Aturan yang didapatkan disini harus mudah dimengerti agar dapat dengan efektif meningkatkan tingkat pengetahuan (Knowledge) pada Sistem.

Tugas Deskriptif merupakan Tugas Data Mining yang sering dibutuhkan Teknik Postprocessing untuk melakukan validasi serta mengungkapkan hasil daripada Proses Data Mining. Postprocessing merupakan proses yang dipakai dan digunakan untuk memastikan (hanya) hasil yang Valid dan juga berguna yang dapat dipakai oleh pihak yang berkepentingan.

b. Prediksi

Proses Prediksi memiliki kemiripan dengan Proses Deskripsi, akan tetapi, Data disini diklasifikasikan berdasarkan perilaku atau nilai yang diperkirakan akan datang pada masa yang akan datang. Contoh dari Tugas Prediksi, misalnya adalah untuk memprediksikan adanya pengurangan jumlah pelanggan didalam waktu dekat serta prediksi harga saham 3 (Tiga) bulan yang akan datang.

c. Estimasi

Proses Estimasi disini hampir sama dengan Prediksi, kecuali untuk Variabel target perkiraannya yang lebih ke arah Numerik dari kepada ke arah Kategori. Model dibangun menggunakan Record lengkap yang menyediakan nilai dari Variabel Target, sebagaimana Nilai Prediksi. Selanjutnya, pada peninjauan berikutnya, Estimasi Nilai dari Variabel Target dibentuk berdasarkan dari nilai Variabel Prediksi.

Sebagai contoh, misalnya akan dilakukan perkiraan Tekanan Darah Sistolik terhadap seorang pasien yang ada di Rumah Sakit berdasarkan umur Pasien, Jenis Kelamin, Berat Badan, dan juga Level Sodium Darah. Hubungan antara Tekanan Darah Sistolik dan juga Nilai Variabel Prediksi didalam proses pembelajaran akan menghasilkan Model Estimasi.

d. Klasifikasi

Proses Klasifikasi merupakan proses menemukan sebuah Model atau Fungsi yang mendeskripsikan serta juga membedakan Data kedalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan Karakteristik dari objek dan memasukkan objek ke dalam salah satu kelas yang telah didefinisikan sebelumnya.

Baca Juga :  Inilah Cara Cek Data Forlap Dikti Mahasiswa: Langkah + Gambarnya!

e. Clustering

Proses Clustering adalah pengelompokan Data tanpa berdasarkan Kelas Data tertentu ke dalam kelas objek yang sesuai. Sebuah Kluster atau Cluster merupakan kumpulan Record yang mempunyai kemiripan suatu dengan yang lainnya serta juga mempunyai ketidakmiripan dengan Record yang ada dalam Kluster lain.

Tujuannya adalah untuk membentuk pengelompokan objek yang mirip satu sama lain dalam kumpulannya. Semakin besar kemiripan objek yang ada dalam suatu Cluster dan semakin besar perbedaan tiap Cluster maka kualitas Analisis Cluster pun akan menjadi semakin baik.

f. Asosiasi

Tugas Proses Asosiasi dalam Data Mining adalah menemukan Atribut yang ada dalam suatu waktu. Dalam Dunia Bisnis, hal ini lebih awamnya dianggap Analisis Keranjang Belanja atau Market Basket Analisys. Tugas Asosiasi berusaha agar dapat mengetahui anggaran untuk mengukur hubungan antara 2 (Dua) atau lebih Atribut yang ada.

Tahapan Data Mining

Ilustrasi Gambar Tahapan Penggalian Data Atau Penambangan Data
Ilustrasi Gambar Tahapan Penggalian Data Atau Penambangan Data

Membahas mengenai Pengertian Data Mining, adalah merupakan hal yang penting untuk Anda mengetahui apa saja Tahapan Data Mining. Tahapan yang dilakukan pada Proses Data Mining ini biasanya dimulai dari seleksi Data dari Data sumber ke Data Target (Sasaran).

Tahap Preprocessing adalah untuk memperbaiki kualitas Data, Transformasi, Data Mining dan Tahap Interpretasi serta juga Evaluasi yang membuat hasil berupa sebuah Pengetahuan baru yang dibutuhkan memberikan kontribusi yang lebih baik. Hal ini sesuai dengan penjelasan Fayyad (1996), di bawah ini adalah penjelasan datail mengenai Tahapan dalam Data Mining.

a. Data Selection

Data Selection adalah Tahapan Pemilihan (seleksi) Data dari sekumpulan Data operasional perlu dilakukan sebelum menuju tahap penggalian Informasi dalam KDD atau Knowledge Discovery in Databases dimulai. Data Output seleksi yang dipakai untuk proses Data Mining ini disimpan dalam suatu berkas, dan terpisah dari Database Operasional.

b. Pre-Processing atau Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan Pre-Processing atau Cleaning terhadap Data yang akan menjadi fokus KDD atau Knowledge Discovery in Databases. Proses ini diantaranya meliputi pembuangan Duplikasi Data, memerik Data yang inkonsisten, dan memperbaiki kesalahan terhadap Data.

c. Transformation

Coding merupakan proses Transformasi pada Data yang sudah dipilih, sehingga Data tersebut sesuai untuk proses Data Miningnya. Proses Coding didalam KDD atau Knowledge Discovery in Databases adalah proses yang kreatif dan sangat tergantung terhadap jenis atau pola informasi yang akan dicari dalam basis data.

d. Data mining

Data Mining adalah Proses mencari pola atau Informasi menarik yang ada dalam Data terpilih dengan menggunakan teknik atau metode tertentu saja. Teknik, metode, atau Algoritma dalam Data Mining ini sangat bervariasi. Pemilihan metode atau prosedur pemecahan yang tepat sangat bergantung kepada tujuan dan juga proses KDD atau Knowledge Discovery in Databases secara keseluruhan.

e. Interpretation atau Evaluation

Pola Informasi yang didapatkan dari Proses Data Mining ini perlu ditampilkan dalam bentuk yang mudah untuk dimengerti dari pihak bersangkutan yang memiliki kepentingan. Tahapan ini merupakan bagian dari proses KDD atau Knowledge Discovery in Databases yang disebut Interpretation atau Evaluation. Tahap ini meliputi inspeksi apakah pola atau Informasi yang ditemukan bertentangan dengan liputan atau hipotesis yang terdapat sebelumnya.

f. Knowledge Representation

Representasi Pengetahuan atau Knowledge Representation adalah langkah atau tahapan di mana visualisasi Data dan alat representasi pengetahuan digunakan untuk mewakili Data yang digali atau Mined Data. Data divisualisasikan dalam bentuk laporan, tabel, dan lain sebagainya.

Kesimpulan

Bagaimana? Sudah jelaskan? Baiklah, dari penjelasan dan pembahasan mengenai Pengertian Data Mining, Apa itu Penambangan atau Penggalian Data? Menurut Para Ahli, Sejarah, Fungsi, Jenis, Proses dan Tahapannya di atas, dapat kita simpulkan bahwa Pengertian Data Mining adalah proses menemukan Pattern atau Pola dan pengetahuan menarik dari sejumlah besar Data. Sumber Datanya dapat mencakup Database atau Basis Data, Datawerehouses (Gudang Data), Website, dan Repositori Informasi lainnya atau Data yang dialirkan ke Sistem secara Dinamis.

Penutup

Demikianlah ulasan Kami kali ini yang membahas mengenai Pengertian Data Mining, Apa itu Penambangan atau Penggalian Data? Menurut Para Ahli, Sejarah, Fungsi, Jenis, Proses dan Tahapannya. Semoga dapat bermanfaat dan menambah wawasan Kita semua. Sekian dari Saya, Terima Kasih.

Tinggalkan Komentar