:::: MENU ::::

A density-based algorithm for discovering clusters in large spatial databases with noise

“A density-based algorithm for discovering clusters in large spatial databases with noise” başlıklı çalışma Martin Ester, Hans-Peter Kriegel, Jiirg Sander, Xiaowei Xu tarafından yapılmış olup KDD-96 konferansında sunulmuştur.

Sınıf belirleme, veritabanındaki nesneleri anlamlı alt sınıflara gruplama işlemidir. Örneğin nehir kenarındaki evleri gruplamak isteyebiliriz.

Kümeleme işlemi için öne çıkan zorluklar:

-Kümelenecek veriler hakkında bilgi sahibi olunmaması
-Kümelerin belirsiz şekillerde birbirinden ayrılması(küresel, doğrusal, çizgisel gibi…)
-Kümelenecek veri sayısının binlerle ifade edilmesi

DBSCAN büyük hacimli veritabanlarında, kümelerin birbirinden keyfi şekillerle ayrıldığı durumlarda da başarılı sonuçlar üretmektedir.

Kümeleme Algoritmaları
1-Parçalayarak Kümeleme
2-Hiyerarşik Kümeleme

Parçalayarak Kümeleme yaklaşımında başlangıçta belirlenen küme sayısına mevcut veriler dağıtılır. k-means ve k-medoid algoritmaları bu gruba girmektedir. Sonuçta oluşan bütün kümeler konveks (dışbükeydir) ve bu verilerin bu şekilde kümelenmediği veritabanları için doğru sonuçlar üretilemeyeceğini göstermektedir. Bu yaklaşımda uzay voronoi diyagramı şeklinde bölümlenir ve her bir voronoi hücresi bir kümeyi temsil eder.

k-medoid algoritması geliştirilerek CLARANS algoritması üretilmiştir. CLARANS algoritması 2’den n’e kadar küme sayıları için siluet katsayısı {silhouette coefficient (Kaufman & Rousseeuw 1990) } değeri üretir ve bu katsayının maksimum olduğu durumu ideal küme sayısı olarak belirler. Fakat bu işlemi n’e kadar yapmak O(n) kadar zaman gerektirdiğinden uygulanması zordur.

CLARANS tüm kümelenecek veriyi aynı anda hafızaya alma stratejisini benimsediğinden büyük veritabanları için uygun değildir. Büyük veritabanları için CLARANS’ın çalışma zamanı çok uzundur. Bu yüzden tüm nesneler değil, sadece bir grup nesnenin aynı anda ele alındığı bir yaklaşım düşünülmüştür. Böylece hem daha az bellek alanı kullanılacak, hem de işlem zamanı kısalacaktır.

Hiyerarşik Kümeleme yaklaşımında veritabanı hiyerarşik bir şekilde bölünerek kümelenir. Hiyerarşik kümelemede önceden küme sayısı belirlenmemektedir. Burada belirlenen sonlandırma kriterine kadar işlem sürer ve her bir nesne bir ağaç dalında yaprak misali tek kalıncaya kadar işlem sürdürülür.Sonlandırma kriterini belirlemek ciddi bir problemdir. Dışbükey olmayan kümeleme işlemlerinde kullanılmaktadır. Ejcluster algoritması her iki nokta arasındaki mesafeyi hesapladığından O(n2) hesaplama zamanına ihtiyaç duymaktadır.

Küme alanlarında yoğunluk fazlayken, boş alanlarda veya gürültülü verilerin bulunduğu yerlerde yoğunluk azdır.

DBSCAN algoritmasında yoğunluk ölçümü için Öklid ve Manhattan uzaklığı gibi yöntemler veya başka uzaklık ölçüm yaklaşımları kullanılabilir.

Eps ve MinPts parametrelerinin belirlenmesi

2 boyutlu veri setleri için MinPts değerinin 4 olarak alınması önerilmiştir.

DBSCAN sentetik ve gerçek veri setleri ile CLARANS algoritması ile karşılaştırılmıştır. Renksiz bir şekilde sonuç grafikleri verildiğinden tam anlaşılamayan sonuçları görmek için renkli grafiklere bakılması önerilmiştir.

dbscan-clarans

İndirmek için:
A-density-based-algorithm-for-discovering-clusters-in-large-spatial-databases-with-noise



Çünkü insan en değersiz şeyini kaybedince her şeyi kaybettiğini anlar

“Pers imparatoru Kambis, Mısır seferine çıkarken zaferinden emindi. Çünkü bütün kâhinleri ittifak halindeydi. Zühre yıldızı demişlerdi hep bir ağızdan; ‘İmparatorun burcuna girdi.’ Mısır’ın fethi yakındı.
Öyle de oldu. Kırk gün kırk gece sürdü Nil’in yanı başındaki savaş. Ve Mısır düştü.
Ama önceden müjdelenmiş bu fetih acımasız Pers İmparatoru’na kâfi gelmedi.
Merkiz Kalesi’nin önüne bir otağ kurdurdu ve mağlup Mısır Kralı Kısamelutu’yu huzuruna çağırttı. Amacı belliydi: Mağlup kralı daha da aşağılamak.
Muzaffer Pers alayları otağın önünden geçti önce. Ardından da mağlup Mısır ordusunun Generalleri; başları önde ve yüzlerinde horlanmanın utancı. Generalleri öteki rütbeli askerler izledi; süngüsü düşmüş Mısır ordusunun sefil artıkları… Hangi Kral bu utanç verici manzara karşısında aşağılanmanın ezikliğini duymaz ki?
Oysa Mısır Kralı gözünü kırpmamıştı, öylesine gururluydu, öylesine soğukkanlı. Perişan bir halde önünden geçen ordu sanki kendi ordusu değilmiş gibi. Sonra Kral’ın sevgili kızı Mısır Prensesi geçti otağın önünden beş paralık bir cariye kılığında. Pers ordusunun çirkin bir aşçı yamağı saçlarından tutup sürükledi prensesi. Bunu gören Mısır ahalisinin acı çığlığı yeri göğü inletti. Hangi yürek o güzeller güzeli prensesi böyle bir düşmüşlük içinde görmeye katlanabilir? Fakat Mısır Kralı’nın kılı dahi kıpırdamamıştı. Bir aşçı yamağının cariyesi olan kız sanki kendi kızı değilmiş gibiydi. Az sonra kralın biricik oğlu veliaht prens geçti otağın önünden… Kolları bağlı, ayakları prangalı, iki yanında dağ gibi birer Pers askeri darağacına doğru sürüklediler veliaht prensi ve hemen oracıkta idam ettiler. Fakat Kral kılını bile kıpırdatmadı. Az önce idam edilen oğul sanki kendi oğlu değilmiş gibi…
Sonunda hizmetçisi geçti otağın önünden. Mısır Kralı yerden yere attı kendisini. Hizmetçisini zincire vurulmuş görünce acımasızca yumruklar göğsünü, dövündükçe dövündü, iki gözü iki çeşme… Pers İmparatoru hem memnundu bu manzaradan hem de hayretler içindeydi. Ordusunu, kızını, oğlunu, ülkesini, her şeyini kaybetmiş bir Kral soğukkanlılığını korudu da; maiyetinde en değersiz kişinin, hizmetçisinin perişanlığını göründüğünde böylesine yıkıldı.
Neden?
Çünkü insan en değersiz şeyini kaybedince her şeyi kaybettiğini anlar.”


Selecting fuzzy if-then rules for classification problems using genetic algorithms

“Selecting fuzzy if-then rules for classification problems using genetic algorithms” başlıklı çalışma Hisao Ishibuchi, Ken Nozaki, Naohisa Yamamoto ve Hideo Tanaka tarafından yapılmış olup IEEE Transactions on fuzzy systems 3.3 (1995): 260-270.sayfaları arasında yayınlanmıştır.

Bulanık kural kümelerinin sınıflandırma işlemi için kullanımını anlatılmış ve IRIS veri seti üzerinde deneyler yapılmıştır.

İndirmek için:
Selecting-fuzzy-if-then-rules-for-classification-problems-using-genetic-algorithms


Sayfalar:12345678...78