| dc.creator |
Yaşar, Hüseyin,
1984-
author
159600 |
|
| dc.creator |
Albayrak, Mehmet,
1974-
thesis advisor
64950 |
|
| dc.creator |
Süleyman Demirel Üniversitesi.
Fen Bilimleri Enstitüsü.
Elektronik-Bilgisayar Eğitimi Anabilim Dalı.
9114
issuing body |
|
| dc.date |
2017. |
|
| dc.identifier |
http://tez.sdu.edu.tr/Tezler/TF03526.pdf |
|
| dc.description |
Bilgisayarların hayatımıza girmesiyle beraber dijital verilerin boyutları giderek artmaktadır. Dijital dünyada üretilen bu verilerin içinde benzerlerinden farklı davranış sergileyen standart dışı değerler (aykırı değerler) bulunabilmektedir. Bu değerlerin bulunması, sahtecilik tespiti, finans, tıp ve genetik bilimi gibi alanlarda büyük önem arz etmektedir. Büyük veri setlerinde standart dışı değerlerin tespiti için daha çok veri madenciliği yöntemlerinden kümeleme teknikleri kullanılmıştır. Gürültülü ve aykırı noktalara karşı hassas olan kümeleme algoritmalarından yoğunluk tabanlı DBSCAN algoritması standart dışı değerlerin tespitinde kullanılabilmektedir. Bu çalışmada standart dışı değerlerin tespiti için C# programlama dilinde DBSCAN algoritması kullanılarak bir uygulama geliştirilmiştir. Geliştirilen uygulamada veri sayıları farklı 4 adet veri seti kullanılmış ve analiz edilmiştir. Veri setlerinin daha kısa sürede analiz edilebilmesi için .Net 4.0 ile gelen TPL (Task Parallel Library) içindeki paralel sınıf üyeleri kullanılmıştır. Veri setlerinde yapılan analizlerde DBSCAN algoritmasının standart dışı değerlerin tespiti açısından kullanılabilir olduğu görülmüştür. Performans açısından ise paralel programlamanın veri sayısı arttıkça daha kullanışlı olduğu sonucuna varılmıştır. Danışman: Yrd. Doç. Dr. Murat KORU Anahtar Kelimeler: Standart dışı veri, Kümeleme, DBSCAN, Paralel programlama. |
|
| dc.description |
The size of digital datas is increasing with the penetration of computers into our lives. Non‐standard values (outliers) which behave differently than similar ones can be found in these datas. Determination of these values has a great importance in areas such as fraud detection, finance, medicine and genetic science. Clustering techniques have been used more frequently than data mining methods for determination of the non‐standard values in large data sets. The densitybased DBSCAN algorithm, one of the clustering algorithms that are sensitive to noisy and outlier spots can be used to detect non‐standard values. In this study, for detecting nonstandard values an application was developed by using the DBSCAN algorithm in the C # programming language. In the developed application, 4 data sets with different data numbers were used and analyzed. For analyzing data sets in a shorter time, parallel class members in the TPL (Task Parallel Library) which comes with Net 4.0 were used. It has been found that DBSCAN algorithm can be used for the determination of the non‐standard values in data set analysis. From the point of performance, it was seen that usability of parallel programming increased due to the increase in the number of data. Keywords: Non standart data, Clustering, DBSCAN, Parallel programming. |
|
| dc.description |
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Elektronik ve Bilgisayar Eğitimi Anabilim Dalı, 2017. |
|
| dc.description |
Kaynakça var. |
|
| dc.description |
Bilgisayarların hayatımıza girmesiyle beraber dijital verilerin boyutları giderek artmaktadır. Dijital dünyada üretilen bu verilerin içinde benzerlerinden farklı davranış sergileyen standart dışı değerler (aykırı değerler) bulunabilmektedir. Bu değerlerin bulunması, sahtecilik tespiti, finans, tıp ve genetik bilimi gibi alanlarda büyük önem arz etmektedir. Büyük veri setlerinde standart dışı değerlerin tespiti için daha çok veri madenciliği yöntemlerinden kümeleme teknikleri kullanılmıştır. Gürültülü ve aykırı noktalara karşı hassas olan kümeleme algoritmalarından yoğunluk tabanlı DBSCAN algoritması standart dışı değerlerin tespitinde kullanılabilmektedir. Bu çalışmada standart dışı değerlerin tespiti için C# programlama dilinde DBSCAN algoritması kullanılarak bir uygulama geliştirilmiştir. Geliştirilen uygulamada veri sayıları farklı 4 adet veri seti kullanılmış ve analiz edilmiştir. Veri setlerinin daha kısa sürede analiz edilebilmesi için .Net 4.0 ile gelen TPL (Task Parallel Library) içindeki paralel sınıf üyeleri kullanılmıştır. Veri setlerinde yapılan analizlerde DBSCAN algoritmasının standart dışı değerlerin tespiti açısından kullanılabilir olduğu görülmüştür. Performans açısından ise paralel programlamanın veri sayısı arttıkça daha kullanışlı olduğu sonucuna varılmıştır. Danışman: Yrd. Doç. Dr. Murat KORU Anahtar Kelimeler: Standart dışı veri, Kümeleme, DBSCAN, Paralel programlama. |
|
| dc.description |
The size of digital datas is increasing with the penetration of computers into our lives. Non‐standard values (outliers) which behave differently than similar ones can be found in these datas. Determination of these values has a great importance in areas such as fraud detection, finance, medicine and genetic science. Clustering techniques have been used more frequently than data mining methods for determination of the non‐standard values in large data sets. The densitybased DBSCAN algorithm, one of the clustering algorithms that are sensitive to noisy and outlier spots can be used to detect non‐standard values. In this study, for detecting nonstandard values an application was developed by using the DBSCAN algorithm in the C # programming language. In the developed application, 4 data sets with different data numbers were used and analyzed. For analyzing data sets in a shorter time, parallel class members in the TPL (Task Parallel Library) which comes with Net 4.0 were used. It has been found that DBSCAN algorithm can be used for the determination of the non‐standard values in data set analysis. From the point of performance, it was seen that usability of parallel programming increased due to the increase in the number of data. Keywords: Non standart data, Clustering, DBSCAN, Parallel programming. |
|
| dc.language |
tur |
|
| dc.publisher |
Isparta : Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü, |
|
| dc.subject |
Süleyman Demirel Üniversitesi |
|
| dc.title |
Standart dışı verilerin paralel programlama ile analizi ve modellenmesi = Parallel programming with non‐standard data analysis and modelling / |
|
| dc.type |
text |
|