Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir. Veri madenciliği belirli aşamalardan ve kontrollerden sonra veri tabanınızdaki verilerin mantıklı sonuçlara dönüştürülmesi ve bu verilerin sizin kullanımınıza sunulması için geliştirilmiş özel yapılardır.
Aşamaları veri seçimi, ön işleme, indirgeme, veri madenciliği, doğrulama ve yorumlama gibi ana başlıklarda toplayabiliriz. Gelişmiş yapıların tamamında kullanılan bu özel yöntem firmanızdaki verilerin performans raporlamalarından fayda / maliyet hesaplarına kadar faydalı ve temiz veri kümelerine dönüştürülmesini sağlamaktadır.
Basit bir tanım yapmak gerekirse veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır.