:::: MENU ::::
Genel

A cross-sectional examination of marketing of electronic cigarettes on Twitter

İlgili makaleye sunum olarak erişmek için:
A_cross-sectional_examination_of_marketing_of_electronic_cigarettes_on_Twitter

“A cross-sectional examination of marketing of electronic cigarettes on Twitter” başlıklı çalışma Jidong Huang, Rachel Kornfield, Glen Szczypka, Sherry L Emery tarafından yapılmış olup 2014 yılında Tobacco control,23.suppl 3: iii26-iii30’de yayınlanmıştır.

Çalışmanın yayınlandığı dergi olan (SCI) Tobacco Control(http://tobaccocontrol.bmj.com/)’ün Impact Factor değeri 6.321’dir.

Sosyal medya üzerinde elektronik sigara satışının yaygın olduğu bilinmekte fakat bunun ne şekilde yapıldığı tam olarak bilinmemektedir. Twitter Firehose’dan elde edilmiş elektronik sigara ile ilgili 1 Mayıs 2012 ve 30 Haziran 2012 tarihleri arasında gönderilmiş tweetler toplanmıştır. Ticari ve ticari olmayan şeklinde Naive Bayes, Anahtar kelime algoritmaları ve insan kodlaması ile sınıflandırma yapılmıştır. 73672 tweet toplanmış ve %90’ı ticari olarak etiketlenmiştir. Sosyal medya etkinliğinizi ölçerek 0-100 arasında bir puan ile değerlendiren Klout puanı ile incelendiğinde elektronik sigara reklamını yapan hesapların Klout puanlarının düşük olduğu belirlendi. Ticari tweetlerin %94’ü çok aktif olan küçük bir grup tarafından atılarak, ilgili firmaların web sayfalarına ait linkler içermektedir. Ticari ve organik tweetlerin %10’u sigarayı bırakma ile ilgiliyken, %34’ü sigara fiyatları veya indirimleri ile bilgi vermektedir.

2010 yılında %3 olan elektronik sigara kullanımının 2011 yılında 2 katına çıkarak %6 olduğu açıklanmıştır. Bir çok platformda elektronik sigara reklamları yapılmaktadır. Elektronik sigara kullanan kişilerin sigarayı tamamen bıraktıkları veya elektronik sigara ile devam ettikleri söylenmektedir. Sigara reklamının yasak olması ve elektronik sigara reklamının henüz yasak olmaması sosyal medyada bu ürünün pazarlanmasına yönelik ilgiyi açıklamak için söylenebilir.

Twitter 2006 yılında kurulmuş ve hızla büyüyen bir mikroblog sitesidir. 2013 itibariyle aylık 200 milyon aktif kullanıcı, 500 milyon tweet atmakta ve 2,1 milyar arama yapmaktadır. Kullanıcılarının %30’u genç(18-29 yaş) ve %27’si Afro-Amerikan, %28’i Latin, %14’ü beyazdır.

Oluşturulan veride;
Tweet’in içeriği
Zaman
Mekan(kullanıcı izin verdiyse)
Kullanıcının takip ettikleri
Kullanıcının takipçileri
Kullanıcının Klout puanı

Twitter Firehose, Twitter’ın sertifikalı tam veri akışı hizmetidir. Tweet içeriklerinde genel manada elektronik sigara fiyatları, güvenilirliliği ve sigarayı bırakma ile ilgili konular geçmektedir.

METOD
Veri Toplama

gnip

Twitter’ın lisanslı veri sağlama şirketlerinden olan Gnip ( https://www.gnip.com/ ) üzerinden belli bir ücret karşılığı veriler temin edilmiştir. Twitter API hizmeti gerçek zamanlı tweet akışının %1’ini vermektedir. Firehose ise %100 erişim imkanı sağlamaktadır.

Twitter API ile Firehose’un detaylı karşılaştırmasının yapıldığı “Is the Sample Good Enough? Comparing Data from Twitter’s Streaming API with Twitter’s Firehose” çalışması ilgililerce incelenebilir.

‘e-cigarette’
‘ecigarette’
‘e-cig’
‘ecig’

kelimeleri geçen,
‘electronic’ ‘blu’ ‘njoy’ kelimeleri ile birlikte ‘cig’ veya ‘cigarette’ geçen

tweetler toplanmıştır.

Blu ve Njoy, ABD’de en çok satılan e-sigara markalarıdır. (Nielsen markası da vardır ama dahil edilmemiştir.)

‘vape’ kelimesi geçen tweetler toplanmamıştır.

Kelimelerdende anlaşılacağı üzere sadece İngilizce tweetler toplanmıştır.

Toplanan tweetlerin içerisinden çekilen 500 tweet’lik bir veri analiz edilmiş. İçeriğin %99 İngilizce ve %99 e-sigara ile ilgili olduğu görülmüştür.

İçerik Kodlaması

Toplanan tweetleri organik veya ticari olarak sınıflandırmak için insan kodlaması ve makine öğrenimini birleştiren iteratif bir süreç kullanılmıştır. Bulut tabanlı bir metin analiz yazılımı olan DiscoverText, tweetleri toplamak, arşivlemek ve makine sınıflandırması için kullanılmıştır.DiscoverText, kodlamadan önce ön işlem gerektiren hiçbir metin gerektirmez.

discover-text

Sponsor olunmamış, bireysel düşünceleri veya deneyimleri yansıtan ve tanıtım amaçlı olmayan içerikler organik tweet olarak sınıflandırılmıştır.

Markalı tanıtım mesajları, Ticari web sitelerine bağlantı veren URL’ler, Ticari sitelerle olan ilişkileri gösteren kullanıcı adları, yalnızca kullanıcının promosyon tweetlerinden oluşan Twitter sayfaları (yani spam gönderen hesaplar) ticari tweet olarak sınıflandırılmıştır.

Ticari bağlantılar barındıran kişisel görünümlü tweetler de ticari olarak sayılmıştır. Ayrıca direk satış yapmasa da satıcılara yönlendiren veya reklam içeren sitelerde ticari olarak sayılmıştır.

Toplanmış tweetlerden rastgele seçilen 2000 tanesi 2 insan kodlayıcı tarafından ticari veya organik olarak sınıflandırılmışlardır. Bu iki insan kodlayıcı ek 500 tweet’te 0.93 oranında bir örtüşme ile aynı karara varmışlardır. Hazırlanmış olan bu eğitim seti ile Naive Bayes sınıflandırıcısı eğitilmiştir.

500 örnek tweet ile makine ve insan sınıflandırıcılar kıyaslandığında; Makine sınıflandırıcının ticari tweetleri daha başarılı bir şekilde tasnif ettiği görülmüştür. Bazı ticari tweetleri, organik olarak yanlış sınıflandırma işlemini, organik olanları ticari olarak sınıflandırmaya göre daha fazla yapmıştır.

Bu aşamadan sonra aşağıdaki değişiklikler yapılmıştır.

-Bir tweetin içeriği, birden çok tweet de de bulunuyorsa ticari olarak nitelendirilmiştir.
-Ayrıca “coupon, discount, free trial,starter kit” gibi ticari kelimeler içeren tweetler ticari olarak nitelenmiştir.
-Kullanıcı adından açıkça bir ticari işletme olduğu belli olan(örneğin VaporGod LLC) kişilerin attığı tweetler ticari sayılmıştır.

Bu geliştirmelerin ardından yaklaşık 1500 tweetin sınıfı değişmiştir.

Son yaklaşımı test için seçilen rastgele 500 tweet incelendiğinde 0.88 oranında insan kodlayıcıların bilgileriyle örtüştüğü görülmüştür.

Sigarayı bırakmaya yönelik olan ve olmayan tweetleri sınıflandırmak için de benzer bir birleştirilmiş yaklaşım kullanılmıştır.

“Stop smoking with the electronic cigarette starter kit…”
“Need to quit smoking #ecig,”
“Give up smoking with electronic cigarettes?”

Yukarıdaki 3 tweet sigarayı bırakma ile ilgilidir.

2 insan kodlayıcının 0.90 örtüşmeyle sınıflandırdığı 3500 tweet ile eğitilen sistemin, sigarayı bırakmama ile ilgili tweetleri sigarayı bırakma ile ilgili sanma oranı tersine göre daha fazla çıkmıştır.

Yeniden bir geliştirme için inceleme yapılmıştır.
-‘quit*’ ve ‘stop sm*’ ile başlayan tweet, kullanıcı adı ve URL’ler sigarayı bırakma ile ilişkilendirilmiştir.

Makine sınıflandırıcısı ve anahtar kelime algoritmalarının uyuşmadığı yaklaşık 5000 tweet direk/gözle/manuel incelenmiş ve yaklaşık 3500’ü yeniden sınıflandırılmıştır. Son kodlama süreci insan kodlayıcıları ile 0.87 oranında tutarlı çıkmıştır.

Ticari tweetlerin içerisinde:

‘health’ kelimesi bulunanlar: Sağlıkla ilgili
‘safe’ kelimesi bulunanlar: Güvenlikle ilgili
“money, deal, %, $, save, promo, dollars, discount, coupon, code, price, cost” kelimesi bulunanlar ise Fiyat ve İndirim ile ilgili olarak belirlenmiştir.

Hesap bilgilerinin analizi

Hesap bilgilerini analiz ederken;
-Kullanıcıyı takip eden kişi sayısı
-Klout puanı

Toplam kullanıcıların %8’ine tekabül eden 1889 kullanıcı için Klout puanı yoktur. Takipçi verileri Gnip’te 28 Mayıs 2012’den itibaren kullanıma sunulduğunda tweetleri takip eden toplam kullanıcı verisi Haziran 2012’den itibaren hesaplanmıştır.

SONUÇLAR:
1 Mayıs-30 Haziran 2012 arasında e-sigara ile ilişkili Twitter Firehose üzerinden temin edilmiş 73 672 tweet üzerinde çalışma yapılmıştır.
23 700 farklı Twitter kullanıcı bu tweetleri atmıştır.
1208 : günlük atılan ortalama tweet sayısı (Standart Sapma=325).
3 : Kullanıcı başı atılan yaklaşık tweet sayısı(Standart Sapma=90.7)

14319 hesabın takipçi sayıları erişilebilir durumdadır.
845 : Ortalama takipçi sayısı (Medyan değeri 53)
Takipçi sayısı (Standart Sapma=7230) çok çeşitlilik göstermektedir.
Hesapların % 13.4’ünün 10 kişiden az takipçisi varken,
Hesapların % 11.1’i 1000’den fazla takipçiye sahiptir.

Characteristics-of-organic-and-commercial-tweets

Tabloya ek olarak;

URL analizi yapıldığında
.com adresler(85.2%)
.org (4.8%)
.net (4.6%)

vaporgod.com (13 244 kere),
purecigs.com (4546 kere)
bestcelebrex.blogspot.com (3232 kere). {Bu sitede şu anda içerik yok. O dönem reklam amaçlı kullanılmış bir hesap olabilir.}

Tweet etkinliği, en aktif kullanıcılar arasında yoğunlaşmıştır; ilk üç kullanıcı, e-sigara tweet’lerinin % 25’ini ve ilk 100 kullanıcı ise e-sigara tweet’lerinin % 48’ini araştırma süresi boyunca üretmiştir.

Distribution-of-activity-across-Twitter-accounts-who-posted

Kullanıcı sayılarının attığı tweet’e göre dağılımı yukarıda verilmiştir. Görüleceği üzere 1 kullanıcı 10000’den fazla tweet atmış, en aktif 10 kullanıcı içerisinde URL içeren ticari tweetlerin %99.6’sını atmıştır.

23700 kullanıcının 589 tanesinin isimlerinde e-sigara ile bağlantılı olan ‘vape,’ ‘vapor,’ ‘cig,’ ‘smok’ veya ‘elec.’ kelimeleri bulunmaktadır. Bu 589 kullanıcı, çalışma süresi boyunca 30 046 tweet üretti veya toplam tweetlerin % 40.7’sini üretmiş oldu. Bu tweet’lerin 29 898’i (% 99.5) ticari olarak sınıflandırılmıştır.

Health-safety-cessation-price

Ticari tweetlerin sağlık, güvenlik, sigarayı bırakma ve fiyat şeklinde alt kategorilere sınıflandırılmış hali yukarıdaki tabloda görülmektedir.

SONUÇ VE TARTIŞMA

Analizler, reklam ve tanıtımın, e-sigara ilgili Twitter içeriğinin ezici çoğunluğunu temsil ettiğini ortaya koymuştur. 2 aylık zaman dilimi içerisinde incelenen yaklaşım 74000 tweetin %90’ını bir grup aktif Twitter kullanıcısı oluşturmuştur.

İncelenen tüm tweetlerin % 25’inin sadece üç kullanıcı tarafından üretilmesi otomatik bir tweet üretme mekanizması olduğunu göstermektedir; bu kullanıcılar, toplu tweet için şirketler tarafından ayarlanmış ‘bot’lar’ olabilir.

Çalışma Twitter üzerinde ciddi bir şekilde e-sigara pazarlaması yapıldığını ortaya koymaktadır.Gençlerin yoğun olarak kullandığı bir ortamda bu şekilde e-sigara reklamının yapılmasını onlara bu kötü alışkanlığı kazandırabileceği unutulmamalıdır. Fayda ve zararı tam olarak ortaya konmamış e-sigara’nın genel sağlık riski taşıyıp taşımadığı belirlenmelidir.

Çalışmanın eksikleri ve sorular

-2 aylık bir dönemi kapsayan alan kesitsel bir çalışma olduğundan daha uzun dönemli yapılabilir.
-Çalışmanın TV’de e-sigara reklamlarının yapıldığı dönemden önceki verilerle olduğu belirtilmiştir. Bu yüzden periyot uzatılarak analiz devam ettirilebilir.
-Sektördeki yeni markaların isimleri, ‘vape’ kelimesi ve e-sigarayı niteleyen başka kelimeler ile analiz geliştirilebilir.
-Kullanıcılar arası iletişim ile ilgili elimizde veri bulunamadığından kim kimi takip etmiş, retweet ve bahsetme ile ilgili analiz yapamadık. Bu analiz yapılabilir. Ayrıca, ticari bir içeriği retweet eden bir organik kullanıcının şirket tarafından teşvik edilip edilmediğini güvenilir bir şekilde tespit edemiyoruz.
-Analiz sonuçları, Twitter arama arayüzünü kullanarak e-sigara ile ilgili anahtar kelimeleri aktif olarak araştırarak görülen içeriği hesaba katmıyor.
-Ürünlerin çekicilik, güvenlik ve sigarayı bırakma konusundaki başarılarını daha iyi anlamak için e-sigara hakkındaki organik tweet içeriği incelenebilir.

Çalışma alanında yenilikçi olması açısından önemlidir. {Aradan geçen 2 yılda yaklaşık 100 atıf alması çalışmasının ilgi çekiciliğini ortaya koymuştur.}
Makine öğrenmesi kullanarak, sigara ile ilgili big data’yı analiz etmesiyle öncüdür.
Twitter verilerini kullanarak yapılan araştırmalar nispeten yenidir ve bu verilerin sınıflandırılması ve analiz edilmesi için standartlaştırılmış metodolojilere ihtiyaç duyulmaktadır.

İndirmek için tıklayınız:
A_cross-sectional_examination_of_marketing_of_electronic_cigarettes_on_Twitter


ICAT’16 konferansında ilgimi çeken konu başlıkları

3rd International Conference on Advanced Technology & Sciences (ICAT’16) 1-3 Eylül 2016 günlerinde Konya’da düzenlenecek. Konferans programında ilgimi çeken ve çalıştığım konuları kısmetse dinlemek istiyorum. İlgilendiklerimin listesini ileride kullanmak üzere aşağıya not aldım:

Session-II : 02.09.2016 – Friday (09:00 – 10:30)
Chair : Sakir Tasdemir

0163 : A COMPARATIVE STUDY OF BINARY EVOLUTIONARY ALGORITHMS ON AUTOMATIC EVOLUTION OF CLUSTERS
EMRAH HANCER, DERVIS KARABOGA
0526 : THE EFFECTS OF NEIGHBORHOOD STRATEGIES ON THE PERFORMANCE OF ARTIFICIAL BEE COLONY ALGORITHMS
GURCAN YAVUZ, DOGAN AYDIN
0043 : TRAINING ANFIS USING GENETIC ALGORITHM FOR DYNAMIC SYSTEMS IDENTIFICATION
BULENT HAZNEDAR, ADEM KALINLI

Session-II : 02.09.2016 – Friday (09:00 – 10:30)
Chair : Kadir Sabanci

0095 : AUTOMATIC VOICE AND SPEECH RECOGNITION SYSTEM FOR THE GERMAN LANGUAGE WITH DEEP LEARNING METHODS
CIGDEM BAKIR

Session-III : 02.09.2016 – Friday (10:50 – 12:20)
Chair : Zarifa Jabrayilova

0342 : A HYBRID GENETIC ALGORITHM FOR MOBILE ROBOT PATH PLANNING PROBLEM
ESREF BOGAR, SELAMI BEYHAN

Session-III : 02.09.2016 – Friday (10:50 – 12:20)
Chair : Sakir Tasdemir

0348 : BIG BANG-BIG CRUNCH OPTIMIZATION ALGORITHM FOR SOLVING THE UNCAPACITATED FACILITY LOCATION PROBLEM
ISMAIL KOC
0036 : A COMPARATIVE STUDY OF STATISTICAL AND ARTIFICIAL INTELLIGENCE BASED CLASSIFICATION ALGORITHMS ON CENTRAL NERVOUS SYSTEM CANCER MICROARRAY GENE EXPRESSION DATA
MUSTAFA TURAN ARSLAN, ADEM KALINLI
0259 : COMPARISON OF SIMULATED ANNEALING AND GENETIC ALGORITHM APPROACHES ON INTEGRATED PROCESS ROUTING AND SCHEDULING PROBLEM
AHMET REHA BOTSALI
0024 : A MODEL OF AUTOMATIC BLOCK REALLOCATION IN THE LAND CONSOLIDATION PROJECTS USING ARTIFICIAL BEE COLONY ALGORITHM
YASAR INCEYOL, ABDURRAHMAN OZBEYAZ
0160 : DIFFERENT APPLE VARIETIES CLASSIFICATION USING KNN AND MLP ALGORITHMS
KADIR SABANCI, MUHAMMED FAHRI UNLERSEN
0527 : A DETAILED ANALYSIS OF OPTICAL CHARACTER RECOGNITION (OCR) TECHNOLOGY
KAREZ ABDULWAHHAB HAMAD, MEHMET KAYA

Session-III : 02.09.2016 – Friday (10:50 – 12:20)
Chair : Mustafa Altin

0242 : A MODIFIED CUCKOO SEARCH USING DIFFERENT SEARCH STRATEGIES
HUSEYIN HAKLI

Session-V : 02.09.2016 – Friday (15:30 – 17:00)
Chair : Ilker Ali Ozkan

0117 : A LITERATURE REVIEW OF WIND SPEED PREDICTION TECHNIQUES
MUHAMMED CIHAT ALTIN, RIDVAN SARACOGLU

Session-VI : 03.09.2016 – Saturday (09:00 – 10:30)
Chair : Ilker Ali Ozkan

0666 : DESIGNING MOBILE APPLICATIONS FOR TEACHING PHYSICS COURSE
NIGMET KOKLU

Session-VI : 03.09.2016 – Saturday (09:00 – 10:30)
Chair : Mehmet Akif Sahman

0599 : WIND POWER FORECASTING FOR THE PROVINCE OF OSMANIYE USING ARTIFICIAL NEURAL NETWORK METHOD
BULENT YANIKTEPE, SAKIR TASDEMIR, A BURAK GUHER, SULTAN AKCAN
0698 : CLASSIFICATION OF GENUINE AND COUNTERFEIT BANKNOTES BY USING DATA MINING ALGORITHMS
MUSTAFA BUBER, MUHAMMED FAHRI UNLERSEN, KADIR SABANCI
0534 : CLASSIFICATION OF CREDIT CARD CUSTOMERS PAYMENT STATUS BY USING KNN AND MLP ALGORITHMS
MURAT KOKLU, KADIR SABANCI

Session-VII : 03.09.2016 – Saturday (10:50 – 12:20)
Chair : Ilker Ali Ozkan

0359 : SECURITY EVALUATION OF IOS AND ANDROID
AHMET HAYRAN, CEMAL GEMCI, MURATCAN IGDELI, ATIF YILMAZ
0037 : ROUTE PLANNING FOR MULTIPLE UNMANNED AERIAL VEHICLES UAVS WITH PARALLEL GENETIC ALGORITHM ON GPU USING CUDA
MURAT CAKIR, GURAY YILMAZ

Session-VII : 03.09.2016 – Saturday (10:50 – 12:20)
Chair : Soner Sen

0112 : THE MINIMIZATION OF TORQUE RIPPLES OF SEGMENTAL SWITCHED RELUCTANCE MOTOR BY PARTICLE SWARM OPTIMIZATION
HAKAN TERZIOGLU, SAADETDIN HERDEM, GUNGOR BAL

Session-VII : 03.09.2016 – Saturday (10:50 – 12:20)
Chair : Murat Koklu

0213 : MOBILE APPLICATION OF DRUG FOLLOW UP INFORMATION SYSTEM WITH DATA MATRIX READER
HAMZA YARAS, KUBRA UYAR


A PSO-Based Document Classification Algorithm accelerated by the CUDA Platform

“A PSO-Based Document Classification Algorithm accelerated by the CUDA Platform” başlıklı çalışma Jan Platos, Vaclav Snasel, Tomas Jezowicz, Pavel Kromer ve Ajith Abraham tarafından hazırlanmış olup 14-17 Ekim 2012 tarihleri arasında Güney Kore’nin başkenti Seul’de düzenlenmiş olan “2012 IEEE International Conference on Systems, Man, and Cybernetics” isimli konferansta sunulmuştur.

Dokümanların belirlenmiş etiket ve kategorilere göre sınıflandırılması bilinen bir problemdir. Bu problemi çözmek için çeşitli algoritmalar önerilmiştir. Klasik yöntemlerin doküman sayısının artmasıyla bağlantılı olarak çözüm süresini uzatması sonucu sezgisel yöntemlerle bu probleme çözümler üretilmiştir. Doküman sayısının çok büyük olduğu durumlarda bu çözümünde süre olarak verimsiz olmasından dolayı GPU ile CUDA platformu kullanarak bir hızlandırma işlemi yapılmıştır.

Doküman sınıflandırma bilgi alma ve kişiselleştirilmiş öneri sistemleri gibi alanlara da uyarlanabilir.

Doküman Sınıflandırma Nedir?

Bir doküman birden fazla kategoriye ait olabilir. Bir kategoride birden çok doküman bulunabilir.

Evrimsel bir algoritmada ana görev fitness fonksiyonunu belirlemektir. Doküman sınıflandırmada ölçüm yapmak için hassasiyet(precision) ve geri çağırma(recall) metrikleri kullanılır.

pr-re

TP (true positive): Doğru tasnif edilmiş doküman sayısı
FP (false positives): Yanlış tasnif edilmiş doküman sayısı
FN (false negatives): Yanlışlıkla tasnif edilememiş doküman sayısı

f1

Amaç fonksiyonu yukarıdaki şekilde oluşturulur. Bu amaç fonksiyonu tek bir kategori için iyi çalışırken birden çok kategori için iyi çalışmamaktadır. Dolayısıyla precision ve recall değerlerinin ortalamasını alma yaklaşımı kullanılmıştır. Temelde iki ortalama yaklaşımı bulunmaktadır, Mikro ve Makro Ortalama ile nasıl hesaplama yapıldığını öğrenmek için tıklayınız..

Çalışmada doküman sayısı küçük olduğu zaman makro ortalama, büyük olduğu zaman mikro ortalama kullanılmıştır.

Çalışmada paralelleştirme süreci ile ilgili 2 farklı varyant/versiyon/yaklaşım önerilmiştir.

1.Yaklaşım:
variant1

m kategorileri n dökümanları işaret etmektedir. Her kernel k kadar karşılaştırma yapmaktadır. Bu da (MxN)/k kadar thread’in işlem yapması gerekliliği demektir.

2.Yaklaşım:
variant2

Her bir thread benzerlik vektöründeki bir elemanla karşılaştırılmaktadır. Her blokta d kadar thread çalıştırılır. MxN adet blok gerekmektedir. Bu yaklaşımda geçici benzerlik vektörü shared memory’de tutulmakta böylelikle hız kazanımı elde edilmektedir.

Çalışmada shared memory ile önerilen modelin daha yavaş çalıştığı açıklanmıştır.

Çalışmada literatürde bilinen 3 doküman sınıflandırma veri seti kullanılmıştır. Bunlar;
Reuters-21578 : http://www.daviddlewis.com/resources/testcollections/reuters21578/
Iris : http://archive.ics.uci.edu/ml/datasets/Iris
20 Newsgroup: http://people.csail.mit.edu/jrennie/20Newsgroups/

İlk ikisinde literatürdeki çalışmalarla kıyaslanabilecek sonuçlar üretilsede üçüncü set için iyi bir sonuç elde edilememiştir.

İndirmek için:
A_PSO-Based_Document_Classification_Algorithm_accelerated_by_the_CUDA_Platform


Google Akademik’ten alıntı yapmak ne kadar sağlıklıdır?

Yüksek Lisans tezimin son kontrollerini yaparken, aynı zamanda kaynakları da EndNote ile kullanılabilir hale getiriyordum. Bu süreçte hazırlamış olduğum kaynakları Google Akademik‘ten aratarak tek tıkla EndNote halini indirip, yorulmadan kullanma yolunu izlemekteydim. Fakat bir tezde Fen Bilimleri yerine Sosyal Bilimler Enstitüsü yazması bu kaynağında doğruluğunun yüzde 100 olmadığını ortaya koydu. İşin daha ilginci ise geri dönüş için bir bildirim noktası(genel bir bildirim var ama kim uğraşacak o kadar dert anlatmaya, direk kaynağın olduğu noktada referansta hata var tarzı bir uyarı noktası oluşturulmalıdır) eklememiş olmalarıdır. Oysa bilimsel çalışma için hayli önemli olan kaynak işinde çok daha hassas olunması gerekir diye düşünüyorum.

tez-yanlis-bilgi


Sayfalar:12