Data Mining adalah sebuah teknik pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar. Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya.

Data mining muncul sekitar tahun 90-an. Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai  sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. Ada pihak yang berpendapat bahwa data mining  tidak lebih dari machine learning atau analisa statistik yang berjalan di atas  database. Namun pihak lain berpendapat bahwa  database  berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya.

Kehadiran data mining dilatarbelakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah,  data transaksi dsb.). Hampir semua data tersebut dimasukkan denganmenggunakan aplikasi komputer yang digunakan untuk  menangani transaksi sehari-hari yang kebanyakan adalah OLTP (On Line Transaction Processing). Bayangkan berapa transaksi yang dimasukkan oleh  hypermarket  semacam Carrefour atau transaksi kartu kredit dari sebuah bank dalam  seharinya dan bayangkan betapa besarnya ukuran data mereka jika  nanti telah berjalan beberapa tahun. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat me-‘nambang’-nya untuk mencari ‘emas’, ‘berlian’ yaitu informasi yang berguna untuk organisasi kita. Banyak diantara kita yang kebanjiran data tapi miskin informasi.

Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data mining. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan – perusahaan untuk memecahkan berbagai permasalahan bisnis. Kebutuhan dari dunia bisnis yang ingin memperoleh nilai tambah dari data yang telah mereka kumpulkan telah mendorong penerapan teknik-teknik analisa data dari berbagai bidang seperti statistik, kecerdasan buatan dsb pada data berskala besar itu. Ternyata penerapan pada data berskala besar memberikan tantangan-tantangan baru yang akhirnya memunculkan metodologi baru yang disebut data mining ini.

Bermula dari penerapan di dunia bisnis, sekarang ini data mining juga diterapkan pada bidang-bidang lain yang memerlukan analisa data berskala besar seperti bioinformasi dan pertahanan negara. Dalam paper ini, kami mencoba memperkenalkan data mining dengan membandingkannya dengan bidang ilmu yang sudah ada, dan juga memberikan beberapa ilustrasi tentang teknik-teknik yang umum dipakai di data mining.

Pengenalan Data Mining dibawah ini terdapat beberapa definisi dari beberapa sumber yakni dari website, yaitu sebagai berikut : Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra).

Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu sudut pandang komersial dan sudut pandang keilmuan. Dari sudut pandang komersial, pemanfaatan dataming dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data/informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting (warehousing). Data mining juga diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya:

  • Bagaimana mengetahui hilangnya pelanggan karena pesaing
  • Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
  • Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain.
  • Bagaimana memprediski tingkat penjualan
  • Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu item.
  • Bagaimana memprediksi prilaku bisnis di masa yang akan datang

Dari sudut pandang keilmuan, data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misalnya:

  • Remote sensor yang ditempatkan pada suatu satelit
  • Telescope yang digunakan untuk memindai langit
  • Simulasi saintifik yang membangkitkan data dalam ukuran terrabytes Gambar

Data mining merupakan salah satu metode alternatif yang dapat digunakan untuk mengolah data mentah, ketika metode konvensional tidak fisibel untuk dilakukan karena besarnya volume data yang diolah. Hal ini dapat terjadi karena datamining memiliki kemampuan mereduksi data baik melalui teknik katalogisasi, klasifikasi maupun segementasi.

Salah satu contoh penerapan data mining yang ada adalah pada bidang olahraga yaitu sebagai sensor atau alat untuk mencatat jumlah statistik pada permainan olahraga seperti pada permainan sepak bola, volly, basket dan perlombaan olahraga lainnya.

Di Indonesia juga butuh sebuah aplikasi yang dapat membantu KPK dalam mengawasi keuangan negara, karena banyaknya para pekerja negara yang menyalah gunakan jabatannya untuk kesenangannya sendiri dengan melakukan aksi Korupsi. Aplikasi yang menerapkan data mining dapat merecord semua kegiatan keuangan para pejabat atau pekerja negara, sehingga jika terjadi sebuah transaksi yang mencurigakan dapat di deteksi oleh aplikasi.