Definisi Penambangan Data

Saya telah mendengar pepatah untuk waktu yang lama bahwa data adalah minyak baru, tetapi jika kita harus menilai dengan nama salah satu disiplin ilmu yang berhubungan dengan eksploitasi dan penggunaannya, yang disebut data mining, saya lebih suka menyebutnya itu “batubara baru”, dengan analogi bentuk ekstraksinya.

Data mining adalah disiplin yang terdiri dari penarikan kesimpulan dari analisis statistik otomatis dari kumpulan data yang besar.

Data ini dapat berasal dari berbagai sumber, memiliki struktur yang berbeda, atau bahkan tidak terstruktur. Untuk alasan ini, data mining melibatkan kecerdasan buatan dan mesin belajar sistem yang mampu beradaptasi dengan data yang tidak terstruktur dan melewati melalui filter yang memungkinkan analisisnya.

Pada akhirnya, apa itu tentang adalah kesimpulan berfungsi untuk membantu pengambilan keputusan pada sistem tertentu, yang dapat sangat bervariasi: dari lalu lintas jalan di kota atau wilayah, dengan ketersediaan dari petugas pemadam kebakaran dan pelayanan publik lainnya untuk menangani kemungkinan darurat.

Ini juga tentang mengungkap pola-pola yang diikuti data dan yang selama ini tersembunyi atau tidak terlihat jelas, di tengah-tengah rawa-rawa, sejumlah besar data yang ada.

Apa yang membedakan penambangan data dari data besar ? Nah, pertambangan hanya berurusan dengan analisis, sedangkan data besar adalah disiplin yang bertanggung jawab untuk menangkap dan menyimpan data, serta administrasinya.

Untuk dapat menganalisis data dengan benar, pertama-tama kita harus menentukan beberapa tujuan yang kita kejar dengan analisis, serangkaian pertanyaan yang harus kita temukan jawabannya, karena ini akan memandu ke mana kita harus mencari.

Berawal dari pertanyaan-pertanyaan tersebut dalam bentuk premis, kita memilih data untuk diproses (mungkin kita hanya membutuhkan sebagian dari database, dan tidak semua).

Fase pemrosesan berbeda dalam setiap kasus, dan kecerdasan buatan serta alat pembelajaran mesin digunakan di dalamnya, sehingga mereka dapat secara dinamis beradaptasi dengan data yang dimasukkan, memodifikasi operasinya jika perlu.

Produk akhir dari pemrosesan ini harus berupa serangkaian kesimpulan, tetapi jangan bingung dengan kesimpulan yang ditarik oleh mereka yang bertanggung jawab atas sistem atau mereka yang membuat keputusan akhir. Kesimpulan ini adalah tentang volume data yang dianalisis.

Jika kita mengambil kembali contoh lalu lintas jalan di kota, kita dapat memperoleh kesimpulan bahwa jalan tertentu menerima arus kendaraan yang berlebihan, tetapi sistem tidak akan memberi kita resep ajaib untuk mengatasi kelebihan tersebut.

Meskipun sistem memiliki keterampilan kecerdasan buatan yang dapat mengusulkan solusi, tugas personel manusia akan selalu menjadi keputusan terakhir.

Penambangan data sedang diterapkan dalam praktik di sejumlah besar disiplin ilmu, di antaranya keuangan menonjol.

Dengan demikian, kita dapat menemukan aplikasi di bagian seperti pasar saham (untuk memprediksi perilaku sekuritas), tetapi juga di sektor yang tidak sepenuhnya keuangan tetapi memiliki hubungan dekat dengan sektor tersebut, seperti asuransi.

Pemrosesan bahasa alami, pencarian online, atau mobil pintar adalah disiplin ilmu lain di mana penambangan data diterapkan.

Foto fotolia: Moartist / Thinglass

Topik dalam Data Mining

Menarik lainnya

© 2023 Pengertian.Apa-itu.NET