Tentang Data Mining
Rabu, 27 November 2013
0
komentar
Kali
ini saya akan mencoba share materi perkuliahan mengenai Data Mining. Semoga saja bermanfaat bagi rekan -
rekan semua terutama bagi yang membutuhkan bahasan dan berikut ulasannya :
Pengertian Data Mining
Data
Mining merupakan Serangkaian proses untuk menggali nilai tambah berupa
informasi yang selama ini tidak diketahui secara manual dari suatu basis data
atau bisa disebut dengan KDD ( Knowledge Discovery in Database).
Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali
pola yang penting atau menarik dari data yang terdapat dalam basis data.
Pengertian dan Manfaat KDD
KDD
(Knowledge Discovery in Database) adalah keseluruhan proses non-trivial
untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang
ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.
Serangkaian proses tersebut yang memiliki tahap. Pembersihan data dan integrasi
data (cleaning and integration). Proses ini digunakan untuk membuang data yang
tidak konsisten dan bersifat noise dari data yang terdapat di berbagai
basisdata yang mungkin berbeda format maupun platform yang kemudian
diintegrasikan dalam satu database datawarehouse.
Latar Belakang Terbentuknya Data
Mining
- Melimpahnya data (overload
data) yang dialami oleh berbagai institusi, perusahaan atau organisasi.
- Merlimpahnya data ini merupakan
akumulasi data transaksi yang terekam bertahun-tahun..
- Data–data tersebut merupakan
data transaksi yang umumnya diproses menggunakan aplikasi komputer yang
biasa disebut dengan OLTP (On Line Transaction Processing).
Fungsi - Fungsi Umum Data Mining
- Assosiation, adalah proses
untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu
waktu
- Sequence, proses untuk
menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu
dan diterapkan lebih dari satu periode
- Clustering, adalah proses
pengelompokan seumlah data/obyek ke dalam kelompok data sehingga setiap
kelompok berisi data yang mirip
- Classification, proses penemuan
model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data,
dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang
labelnya tidak diketahui.
- Regretion, adalah proses
pemetaan data dalam suatu nilai prediksi
- Forecasting, adalah proses
pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan
data.
- Solution, adalah proses
penemuan akar masalah dan problem solving dari persoalan bisnis yang
dihadapkai atau paling tidak sebagai informasi dalam pengambilan
keputusan.
Proses Data Mining
1. Pembersihan data dan integritas
data (Cleaning & Integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian dinintegrasikan dalam satu database datawarehouse
2. Seleksi dan transformasi data (selection and transformation)
Data yang ada dalam database datawarehouse kemudian direduksi untuk mendapatkan hasil yang akurat. Beberapa cara seleksi, antara lain :
Metode seleksi pada data Mining
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian dinintegrasikan dalam satu database datawarehouse
2. Seleksi dan transformasi data (selection and transformation)
Data yang ada dalam database datawarehouse kemudian direduksi untuk mendapatkan hasil yang akurat. Beberapa cara seleksi, antara lain :
Metode seleksi pada data Mining
- Sampling, adalah seleksi subset
representatif dari populasi data yang besar.
- Denoising, adalah proses
menghilangkan noise dari data yang akan ditransformasikan
- Feature extraction, adalah
proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
Metode transformasi pada Data Mining
- Centering, mengurangi setiap
data dengan rata-rata dari setiap atribut yang ada.
- Normalisation, membagi setiap
data yang dicentering dengan standar deviasi dari atribut bersangkutan.
- Scaling, mengubah data sehingga
berada dalam skala tertentu.
3. Penambangan data (data mining)
Data yang telah ditransformasi, kemudian ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunkan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi, dimana pemilihannya bergantung pada tujuan dan proses pencarian pengetahuan secara menyeluruh.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna.
Data yang telah ditransformasi, kemudian ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunkan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi, dimana pemilihannya bergantung pada tujuan dan proses pencarian pengetahuan secara menyeluruh.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna.
Manfaat Data Mining
Dari sudut pandang komersial
Pemanfaatan
data mining dapat digunakan dalam menangani meledaknya volume data. Bagaimana
mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik
komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi
yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi.
Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya
data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang
penting (warehousing). Data mining juga diperlukan untuk menyelesaikan
permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya :
- Bagaimana mengetahui hilangnya
pelanggan karena pesaing
- Bagaimana mengetahui item
produk atau konsumen yang memiliki kesamaan karakteristik
- Bagaimana mengidentifikasi
produk-produk yang terjual bersamaan dengan produk lain
- Bagaimana memprediski tingkat
penjualan
- Bagaimana menilai tingkat
resiko dalam menentukan jumlah produksi suatu item.
- Bagaimana memprediksi prilaku
bisnis di masa yang akan datang
Dari sudut pandang keilmuan
Data
mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang
bersifat real-time dan sangat besar, misal :
- Remote sensor yang ditempatkan
pada suatu satelit.
- Teleskop yang digunakan untuk
memindai langit.
- Simulasi saintifik yang membangkitkan data dalam ukuran terabytes.
TERIMA KASIH ATAS KUNJUNGAN SAUDARA
Judul:
Tentang Data Mining
Ditulis oleh Unknown
Rating Blog 5 dari 5
Semoga artikel ini bermanfaat bagi saudara. Jika ingin mengutip, baik itu sebagian atau keseluruhan dari isi artikel ini harap menyertakan link dofollow ke
http://dua7an.blogspot.com/2013/11/tentang-data-mining.html
. Terima kasih sudah singgah membaca artikel ini.
Ditulis oleh Unknown
Rating Blog 5 dari 5
0 komentar :
Posting Komentar