Veri Madenciliği Nedir?
Hız kesmeyen teknolojik gelişimler sayesinde veri üretimi, depolanması ve bu verilere erişim oldukça kolay bir hal almıştır. Bu verileri detaylarıyla inceleyip anlamlı hale getirmek gerekir. Veri madenciliği, büyük veri yığılmaları arasından gerekli verilere gerekli anlamları yükleyerek bilgilere erişme anlamına gelmektedir. Bu kavramı, verileri bilgisayar programları kullanarak arama ve derleme olarak da kısaca tanımlayabilmek mümkün. Veri toplulukları içerisinden işe yarayacak verileri seçip çıkararak, bu verilere çeşitli yöntemler uygulayarak ve anlam kazandırmaya çalışarak veri madenciliği yapılmaktadır.
Veri madenciliği; bankacılık, pazarlama, sigortacılık ve e-ticaret gibi birçok alanda kullanılmaktadır. Bu alanlarda ki gerekli verileri analiz ederek stratejik kararlar almaya odaklanılmalıdır. Veri madenciliği için pek de alan sınıflaması yoktur denilebilir. Verilerin biriktiği her yerde veri madenciliği yapılır.
Veri Madenciliği Süreçleri Nelerdir?
Veri madenciliği, son derece dikkat gerektiren ve özveri isteyen bir meslektir. Düzenli ve sıralı bir şekilde yapılan veri madenciliği çok güzel sonuçlarla taçlanır. Veri toplamanın 2 temel yolu vardır. Bunlardan birisi, ‘’açık veri toplama’’ yöntemidir. Bir diğeri ise ‘’kapalı veri toplama’’ olarak bilinir. Açık veriler, kişinin sisteme kendisinin girdiği, yani görülmeye izin verdiği bilgilerdir. Kapalı veri ise, arama motorlarında ki veriler toplamıdır. Bu veriler sayesinde kullanıcıların ilgi alanları belirlenir ve bununla birlikte detaylı bilgiler elde edilir. Veri madenciliği süreçlerini tüm detaylarıyla inceleyelim.
Verileri Filtreleme: İşe öncelikle kullanılacak verileri belirlemekle başlanmalıdır.
Veri Temizliği: Toplanan verilerin içerisinden gereksiz olanları ayıklamak gerekir.
Verileri Birleştirme: Çeşitli kaynaklardan elde edilen, aynı amaca hizmet eden ilişkili veriler birleştirilir.
Veri Seçme Ve Dönüştürme: Temizlenip, belirlenen veriler arasından analize uygun olanları seçip ardından elde edilen verilerin madencilik için uygun hale getirilmesi gerekir.
Madencilik Çalışması: Daha önceden hazırlanan veriler üzerinde amaca yönelik olan verilere veri madenciliği algoritması uygulanır.
Yorumlama Ve Doğrulama: Veri madenciliği işlemi gerçekleştirildikten hemen sonra elde edilen tüm sonuçlar yorumlanır ve bu doğrultuda gerekli araştırmalar yapılır. Doğrulama işlemi, farklı uygulamalardan elde edilen sonuçlarla karşılaştırılarak test edilir ve onaylanır.
Son yorumlar