:::: MENU ::::
İncelemeler

Air pollution modelling using a Graphics Processing Unit with CUDA

“Air pollution modelling using a Graphics Processing Unit with CUDA” başlıklı makale Molnár, F., Szakaly, T., Meszaros, R., & Lagzi, I. tarafından hazırlanmış olup Computer Physics Communications dergisinin 2010 yılında yayınlanan 181.sayısının 105-112.sayfalarında yayınlanmıştır.

Hava kirliliği modeli oluştururken kabul edilebilir bir zamanda, en doğruya yakın çözümler üreten bir sistem kurmak ana amaçtır.

Tek kaynaktan yayılan kimyasal parçacıkların dağılması farklı dinamik modellerle hesaplanabilir. Bunların en bilinenleri Eulerian ve Lagrangian taşıma modelleridir. Çalışmada Stokastik Lagrangian taşıma modeli’nin CUDA ile gerçeklenmesi sağlanmıştır.

Stokastik Lagrangian parçacık modelini formülleri ve parametrelerinin açıklaması:

Stochastic-Lagrangian-particle-model

CPU ve GPU versiyonlarının akış şeması:

flowchart

Seri ve paralel gerçekleştirimlerin sonuçları arasındaki önemsenmeyecek farkla ilgili de farklı platformlarda hesaplama yapılması gösterilmiştir. GPU platformunda tek hassasiyetli hesaplama yapıldığından x86 sistemlerden farklı sonuçlar çıkmaktadır denmiştir. Bu durum çalışmada aşağıdaki şekilde ifade edilmiştir.

Generally, a well parallelized algorithm must produce exactly
the same results as the sequential version. However, it is only true,
if the parallel computing system is built by units of the same platform (e.g. x86) as the one used to run the non-parallelized calculation. A CUDA-compatible GPU is a different platform, it is only capable of single precision computation (except for the newest video
cards, which provide double precision with low performance) and
although it follows many points of the IEEE-754 floating-point
standard, precision of the mathematical functions is usually even
lower, as it is explicitly described in the Programming Guide [39].
We reveal that the numerical error arising from this inaccuracy,
compared to a common CPU, is within tolerable limits, and the result of the simulation produced by the GPU is equally valid as the
result of the CPU version.

Çalışmada ALADIN sayısal hava tahmin modelinden alınan veriler ile yapay meteorolojik bilgiler kullanılmıştır.

Çalışmanın sonucunda yaklaşık 60 ile 120 kat hızlanma elde edildiği açıklanmıştır.

speedup

Makaleyi indirmek için:
Air-pollution-modelling-using-a-Graphics-Processing-Unit-with-CUDA

Kaynak kodların yayınlandığı web sayfası: http://nimbus.elte.hu/~cuda/A Constraint-Handling Mechanism for Particle Swarm Optimization

“A Constraint-Handling Mechanism for Particle Swarm Optimization” başlıklı çalışma Pulido, Gregorio Toscano ve Carlos A. Coello Coello tarafından hazırlanıp 2004. CEC2004 kongresinde sunulmuştur.

“Constraint-Handling Mechanism” kısıtların üstesinden gelmek için önerilen mekanizmalar olarak değerlendirilebilir. Çalışmada basit bir mekanizma önerilmiştir. Bu mekanizma PSO’daki feasible alana en yakın parçanın lider olmasına dayanmaktadır. Ayrıca PSO’nun araştırma kapasitesini geliştirmek için bir de türbülans operatörü önerilmiştir. Bu basit mekanizmanın literatürde bilinen ve kullanılan 3 kısıtın üstesinden gelme mekanizmalarıyla yarışan sonuçlar ürettiği bildirilmiştir.

Gerçek dünya problemleri genellikle kısıtlı problemlerdir. Kısıtların içerisinde çözümler(feasible) üretmek sezgisel yaklaşımlar için bazen çok zor olmaktadır, bu da yüksek hesaplama maliyetine sebep olmaktadır. Mantıklı bir zamanda sorunun çözülememesi çözücüye olan itibarı yok etmektedir.

Yaygın kullanımına rağmen klasik ceza(penalty) fonksiyonları bazı güçlüklerle karşılaşmaktadır, bu yüzden evrimsel hesaplama tekniklerine göre farklı ceza kısıtlarla baş etme yöntemleri önerilmektedir.

Eşitlikleri eşitsizliğe çevirmek için bir tolerans değeri kullanılır.
esitsizlik-esitlik

Arama uzayına S derken, uygun çözümler F ise, F kümesi S’in içerisindedir.

Çalışmada kullanılan algoritmanın sözde kodu:

cpso

Çalışmada türbülans operatörü ile lokal minimuma takılmış parçacıkların kurtarılması hedeflenmiştir.
temp

Aşağıda 3 parçacık ve 2 kısıtın grafiksel gösterimi mevcuttur:
feasible-areas

Parçacık 1, Parçacık 2 ve 3’ten daha iyi fitness değerine sahiptir.

Feasible ve infeasible alanları belirlemek için p=F/S şeklinde bir işlem yapılmıştır. F=Feasible Çözümler S=Rastgele üretilen çözümler. Bu çalışmada S=1,000,000 alınmıştır.
13 test problemi için p değerleri:
p-value

İndirmek için:

A_Constraint_Handling_Mechanism_for_Particle_Swarm_Optimization


A PSO-Based Document Classification Algorithm accelerated by the CUDA Platform

“A PSO-Based Document Classification Algorithm accelerated by the CUDA Platform” başlıklı çalışma Jan Platos, Vaclav Snasel, Tomas Jezowicz, Pavel Kromer ve Ajith Abraham tarafından hazırlanmış olup 14-17 Ekim 2012 tarihleri arasında Güney Kore’nin başkenti Seul’de düzenlenmiş olan “2012 IEEE International Conference on Systems, Man, and Cybernetics” isimli konferansta sunulmuştur.

Dokümanların belirlenmiş etiket ve kategorilere göre sınıflandırılması bilinen bir problemdir. Bu problemi çözmek için çeşitli algoritmalar önerilmiştir. Klasik yöntemlerin doküman sayısının artmasıyla bağlantılı olarak çözüm süresini uzatması sonucu sezgisel yöntemlerle bu probleme çözümler üretilmiştir. Doküman sayısının çok büyük olduğu durumlarda bu çözümünde süre olarak verimsiz olmasından dolayı GPU ile CUDA platformu kullanarak bir hızlandırma işlemi yapılmıştır.

Doküman sınıflandırma bilgi alma ve kişiselleştirilmiş öneri sistemleri gibi alanlara da uyarlanabilir.

Doküman Sınıflandırma Nedir?

Bir doküman birden fazla kategoriye ait olabilir. Bir kategoride birden çok doküman bulunabilir.

Evrimsel bir algoritmada ana görev fitness fonksiyonunu belirlemektir. Doküman sınıflandırmada ölçüm yapmak için hassasiyet(precision) ve geri çağırma(recall) metrikleri kullanılır.

pr-re

TP (true positive): Doğru tasnif edilmiş doküman sayısı
FP (false positives): Yanlış tasnif edilmiş doküman sayısı
FN (false negatives): Yanlışlıkla tasnif edilememiş doküman sayısı

f1

Amaç fonksiyonu yukarıdaki şekilde oluşturulur. Bu amaç fonksiyonu tek bir kategori için iyi çalışırken birden çok kategori için iyi çalışmamaktadır. Dolayısıyla precision ve recall değerlerinin ortalamasını alma yaklaşımı kullanılmıştır. Temelde iki ortalama yaklaşımı bulunmaktadır, Mikro ve Makro Ortalama ile nasıl hesaplama yapıldığını öğrenmek için tıklayınız..

Çalışmada doküman sayısı küçük olduğu zaman makro ortalama, büyük olduğu zaman mikro ortalama kullanılmıştır.

Çalışmada paralelleştirme süreci ile ilgili 2 farklı varyant/versiyon/yaklaşım önerilmiştir.

1.Yaklaşım:
variant1

m kategorileri n dökümanları işaret etmektedir. Her kernel k kadar karşılaştırma yapmaktadır. Bu da (MxN)/k kadar thread’in işlem yapması gerekliliği demektir.

2.Yaklaşım:
variant2

Her bir thread benzerlik vektöründeki bir elemanla karşılaştırılmaktadır. Her blokta d kadar thread çalıştırılır. MxN adet blok gerekmektedir. Bu yaklaşımda geçici benzerlik vektörü shared memory’de tutulmakta böylelikle hız kazanımı elde edilmektedir.

Çalışmada shared memory ile önerilen modelin daha yavaş çalıştığı açıklanmıştır.

Çalışmada literatürde bilinen 3 doküman sınıflandırma veri seti kullanılmıştır. Bunlar;
Reuters-21578 : http://www.daviddlewis.com/resources/testcollections/reuters21578/
Iris : http://archive.ics.uci.edu/ml/datasets/Iris
20 Newsgroup: http://people.csail.mit.edu/jrennie/20Newsgroups/

İlk ikisinde literatürdeki çalışmalarla kıyaslanabilecek sonuçlar üretilsede üçüncü set için iyi bir sonuç elde edilememiştir.

İndirmek için:
A_PSO-Based_Document_Classification_Algorithm_accelerated_by_the_CUDA_Platform


Sayfalar:1...1213141516171819