Veri Madenciliği Süreci Nedir?
Veri madenciliği işlemi büyük bir
veri miktarında istatistiksel olarak anlamlı bir desen ortaya çıkarılması için
bir araçtır. kredi notum düşük nasıl kredi çekerimGenellikle
hazırlık, veri araştırması, model oluşturma, yerleştirme ve gözden geçirmeyi
içeren beş ana adımı içerir. Süreçteki her adım, farklı teknikler içerir, ancak
çoğu bir tür istatistiksel analiz kullanır.
Veri madenciliği süreci başlamadan önce, araştırmacılar
genellikle araştırma hedefleri belirler. Bu hazırlık aşaması, genellikle hangi
türdeki verilerin üzerinde çalışılması gerektiğini , hangi veri madenciliği
tekniklerinin kullanılması gerektiğini ve sonuçların hangi biçimleri alacağını
belirler. Sürecin bu ilk adımı, yararlı bilgi toplamak için çok önemli
olabilir.
Veri madenciliği sürecindeki bir sonraki adım keşiftir. Bu
adım genellikle gerekli bilgileri bir bilgi deposundan veya koleksiyon
varlıklarından toplamayı içerir. Daha sonra, madencilik uzmanları genellikle
analiz için ham veri setlerini hazırlarlar. Bu adım genellikle tüm verilerin
hatalar için toplanması, temizlenmesi, organize edilmesi ve kontrol
edilmesinden oluşur.
Bu hazırlanan veriler genellikle veri madenciliği sürecinde
üçüncü aşamaya girer, model oluşturma. Bunu başarmak için, araştırmacılar
genellikle küçük test örneklerini alırlar ve onlara çeşitli veri madenciliği
teknikleri uygularlar. Modelleme adımı, istenen sonuçlara ulaşmak için gereken en
iyi istatistiksel analiz yöntemini belirlemek için sıklıkla kullanılır.
Veri madenciliği sürecinde
uygulanabilecek dört ana teknik vardır. Birincisi, verileri önceden tanımlanmış
gruplara veya kategorilere göre düzenleyen sınıflandırmadır. Araştırmacılar,
kümeleme olarak adlandırılan ikinci teknikte, bilgisayarın gelir belgesiz kredi veren bankalarverileri istediği gibi gruplara göre düzenlemesine izin
verir. Üçüncü bir veri madenciliği tekniği değişkenler arasındaki ilişkileri
arar. Dördüncüsü, tipik olarak gelecekteki eğilimleri tahmin etmek için
kullanılabilecek veride sıralı modeller arar.
Veri madenciliği işlemindeki son adım dağıtımdır. Bunu
yapmak için, modelde seçilen teknikler daha büyük veri setine uygulanır ve
sonuçlar analiz edilir. Bu adımdan gelen rapor, genellikle, veri kümesinde
bulunan herhangi bir sınıflandırma, küme, ilişki veya sıralı desen dahil olmak
üzere, tüm süreçte bulunan kalıpları gösterir.
Gözden geçirme genellikle önemli bir son adımdır. Süreçteki
bu aşama genellikle, ana kümenin tüm veri popülasyonunu temsil ettiğini
doğrulamak için yeni bir veri seti ile madencilik modellerini tekrarlamayı
içerir. Sonuçlar, veri örneği doğru bir şekilde temsil etmiyorsa, daha büyük
popülasyondaki eğilimleri tahmin edemez.
Yorumlar
Yorum Gönder