:::: MENU ::::
MATLAB

Matlab’ta veriler sütun bazlı şekilde sıralanmaktadır

Matlab’ta veriler sütun bazlı şekilde sıralanmaktadır. Bellekteki verilerin satır bazlı sıralandığına yeni yeni alışırken, Matlab’ta verilerin sütun bazlı şekilde sıralandığını öğrenmenin şokunu yaşamaktayım. Satır bazlıya göre verilerimizi ayarlayıp, ona uygun bir indeks yapısı kurmuştuk, şimdi de sütun bazlı sıralamaya göre bir yapı kurmamız gerekli.

Aynı işlemin satır ve sütun bazlı yapıldığı vakit sütun bazlının daha hızlı olduğunu aşağıdaki örneklerden görebiliriz.


clear all;
A=rand(300,300,40,40);
B=zeros(300,300,40,40);
tic
for i=1:300
for j=1:300
B(i,j,:,:)=2.5 * A(i,j,:,:);
end
end
toc

Yukarıdaki kod 9.972601 saniyede çalışmıştır.

clear all;
A=rand(300,300,40,40);
B=zeros(300,300,40,40);
tic
for j=1:300
for i=1:300
B(i,j,:,:)=2.5 * A(i,j,:,:);
end
end
toc

Yukarıdaki kod 7.140390 saniyede çalışmıştır.

Kodlar incelendiğinde satırların önce okunmasıyla yapılan işlemin daha yavaş olduğu görülmektedir.


Matlab’ta boyutu baştan belirleyerek hız kazanımı elde edilir

Matlab’ta boyutu baştan belirleyerek hız kazanımı elde edilir. Aşağıdaki kodlar incelendiğinde ilk kısımdaki kod 0.000032 saniyede çalışmış, ikinci kısımdaki kod ise 0.000014 saniyede çalışmıştır. Kullanacağımız dizilerin boyutlarını baştan belirlemek bize performans sağlayacaktır.


tic
x=8;
x(2)=10;
x(3)=11;
x(4)=20;
toc
tic
y=zeros(4,1);
y(1)=8;
y(2)=10;
y(3)=11;
y(4)=20;
tocMATLAB GPU CUDA Thread, Block, Grid boyutlarının ayarlanması

Kerneli aşağıdaki şekilde oluşturabiliriz:
k = parallel.gpu.CUDAKernel('test.ptx','test.cu');
Peki bu kaç kere çalıştırılacak?
Bunun ayarlanmasını ise GridSize ve ThreadBlockSize özellikleri ile yapmaktayız.
Örneğin:
k.ThreadBlockSize = [500,1,1];
kodu 500 kere ilgili kernelin çalıştırılacağını belirtir.

GridSize: Blok sayısını belirleyen 3 boyutlu bir vektördür = [a b c] = Varsayılan değeri = [1 1 1]’dir.
ThreadBlockSize: Bloklardaki thread sayısını belirleyen 3 boyutlu bir vektördür = [a b c] = Varsayılan değeri = [1 1 1]’dir.

MaxThreadsPerBlock özelliği ise cihazın kapasitesine göre bir blokta olabilecek maksimum thread sayısını tutmaktadır. Böylece rastgele değerler verilerek programın yanlış çalışması önlenmiş olur.


Sayfalar:1234567