Günden güne sürekli artan veri miktarı ve çeşitliliği ile birlikte karmaşık veri ve büyük veri gibi kavramlar ortaya çıkmış, çözülmeye çalışılan problemler artık kodlanamayacak kadar karmaşık hale gelmiştir. Sonuçta geleneksel metotlar analiz ve çözümleme yapmak için yetersiz kaldığından makine öğrenme yöntemleri ortaya çıkmıştır. Yapay zekânın bir alt bilim dalı olarak kabul gören makine öğrenme yöntemleri, veri kümelerinden çıkarım yaparak algoritmaların kendi kendine öğrenme kabiliyetleri artırmak ve geleceğe yönelik veri odaklı öngörülerde bulunmak amacıyla kullanılmaktadır. Makine öğrenme algoritmaları böylece davranışlarını deneysel verilere dayanarak geliştirir. Yeni koşullara uyum sağlayan algoritmalar eğitimi tecrübeye dönüştürerek öğrenmeyi gerçekleştirir. Ancak probleme uygun çözüm ortamının hazırlanabilmesi için makine öğrenme algoritmaları ile ilgili yazılımların geliştirilmesi gerekmektedir. Makine öğrenme ile ilgili yapılan çalışmalar incelendiğinde yüksek performansta sonuçlar alınabildiği için danışmanlı makine öğrenmenin tercih edildiği, problemin ve veri kümesinin yapısına göre danışmanlı makine öğrenme algoritmalarının başarım performanslarının değişkenlik gösterdiği, aralarında bir üstünlük olmadığı ancak yapay sinir ağı ile genellikle daha iyi sonuçlar alındığı görülmektedir. Yapılan çalışmada geliştirilen bir uygulama yazılımı ile eğitim her seferinde rastgele örnekler üzerinden tekrarlanmış ve algoritmaların en iyi hata değerlerini elde etme olasılığı artırılarak algoritma tahmin başarımları birbirleriyle karşılaştırılmıştır. Eğitim yinelemesinin başlarında ortalama karesel hataların karekökü ve ortalama mutlak hata ölçütlerine göre algoritmaların hata değerleri yüksek iken yineleme sayısı arttıkça kullanılan algoritmalardan Naive Bayesian hariç diğer algoritmaların hata değerleri kabul edilebilir değerlere çekilerek 0,2'nin altında hata değerleri elde edilmiştir. Ayrıca yapay sinir ağı ile %0,21 ve lineer regresyon ile %0,45 gibi çok düşük oranlarda tahmin hata oranları elde edilmiş yani yüksek doğruluk oranlarına ulaşılmıştır. Anahtar Kelimeler: Makine öğrenme algoritmaları, danışmanlı makine öğrenme algoritmaları, tahmin, başarım, yineleme, eğitim, test, veri kümesi.
With the day by day increasing of amounts and diversity of the data, concepts such as complex data and big data have emerged and the problems being solved have become so complex that they can no longer be coded. As a result, machine learning methods have appeared because traditional methods are insufficient to test and analyze. Machine learning methods, which are accepted as a sub-branch of artificial intelligence, are used for the purposes of increasing the self learning capabilities of algorithms by deducing from data sets and providing data-oriented predictions for the future. Therefore, machine learning algorithms develop their behavior based on experimental data. Algorithms that adapt to the new conditions make learning by converting training into experience. However, in order to be prepared a suitable solution environment for the problem, it is necessary to develop software programs related to machine learning algorithms. When the studies on machine learning are examined, it is seen that supervised machine learning is preferred because of high performance results can be obtained, success performance of supervised machine learning algorithms varies according to the structure of the problem and data set, there is no superiority among them but generally better results are obtained with artificial neural network. With the application software developed in this study, training has been repeated every time through random samples and the algorithmic prediction performances have been compared with each other by having been increased the probability of obtaining the best error values of the algorithms. While the error values of the algorithms were high by the criteria of root mean squared error and mean absolute error at the beginning of the training iteration, when the number of iteration increased, the acceptable error values below 0.2 of the other used algorithms except Naive Bayesian have been obtained. In addition, prediction error rates have been obtained at a very low rate of 0,21% with artificial neural network and 0,45% with linear regression, that is, high accuracy rates have been achieved. Keywords: Machine learning algorithms, supervised machine learning algorithms, prediction, success, iteration, training, test, data set.
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, 2017.
Kaynakça var.
Günden güne sürekli artan veri miktarı ve çeşitliliği ile birlikte karmaşık veri ve büyük veri gibi kavramlar ortaya çıkmış, çözülmeye çalışılan problemler artık kodlanamayacak kadar karmaşık hale gelmiştir. Sonuçta geleneksel metotlar analiz ve çözümleme yapmak için yetersiz kaldığından makine öğrenme yöntemleri ortaya çıkmıştır. Yapay zekânın bir alt bilim dalı olarak kabul gören makine öğrenme yöntemleri, veri kümelerinden çıkarım yaparak algoritmaların kendi kendine öğrenme kabiliyetleri artırmak ve geleceğe yönelik veri odaklı öngörülerde bulunmak amacıyla kullanılmaktadır. Makine öğrenme algoritmaları böylece davranışlarını deneysel verilere dayanarak geliştirir. Yeni koşullara uyum sağlayan algoritmalar eğitimi tecrübeye dönüştürerek öğrenmeyi gerçekleştirir. Ancak probleme uygun çözüm ortamının hazırlanabilmesi için makine öğrenme algoritmaları ile ilgili yazılımların geliştirilmesi gerekmektedir. Makine öğrenme ile ilgili yapılan çalışmalar incelendiğinde yüksek performansta sonuçlar alınabildiği için danışmanlı makine öğrenmenin tercih edildiği, problemin ve veri kümesinin yapısına göre danışmanlı makine öğrenme algoritmalarının başarım performanslarının değişkenlik gösterdiği, aralarında bir üstünlük olmadığı ancak yapay sinir ağı ile genellikle daha iyi sonuçlar alındığı görülmektedir. Yapılan çalışmada geliştirilen bir uygulama yazılımı ile eğitim her seferinde rastgele örnekler üzerinden tekrarlanmış ve algoritmaların en iyi hata değerlerini elde etme olasılığı artırılarak algoritma tahmin başarımları birbirleriyle karşılaştırılmıştır. Eğitim yinelemesinin başlarında ortalama karesel hataların karekökü ve ortalama mutlak hata ölçütlerine göre algoritmaların hata değerleri yüksek iken yineleme sayısı arttıkça kullanılan algoritmalardan Naive Bayesian hariç diğer algoritmaların hata değerleri kabul edilebilir değerlere çekilerek 0,2'nin altında hata değerleri elde edilmiştir. Ayrıca yapay sinir ağı ile %0,21 ve lineer regresyon ile %0,45 gibi çok düşük oranlarda tahmin hata oranları elde edilmiş yani yüksek doğruluk oranlarına ulaşılmıştır. Anahtar Kelimeler: Makine öğrenme algoritmaları, danışmanlı makine öğrenme algoritmaları, tahmin, başarım, yineleme, eğitim, test, veri kümesi.
With the day by day increasing of amounts and diversity of the data, concepts such as complex data and big data have emerged and the problems being solved have become so complex that they can no longer be coded. As a result, machine learning methods have appeared because traditional methods are insufficient to test and analyze. Machine learning methods, which are accepted as a sub-branch of artificial intelligence, are used for the purposes of increasing the self learning capabilities of algorithms by deducing from data sets and providing data-oriented predictions for the future. Therefore, machine learning algorithms develop their behavior based on experimental data. Algorithms that adapt to the new conditions make learning by converting training into experience. However, in order to be prepared a suitable solution environment for the problem, it is necessary to develop software programs related to machine learning algorithms. When the studies on machine learning are examined, it is seen that supervised machine learning is preferred because of high performance results can be obtained, success performance of supervised machine learning algorithms varies according to the structure of the problem and data set, there is no superiority among them but generally better results are obtained with artificial neural network. With the application software developed in this study, training has been repeated every time through random samples and the algorithmic prediction performances have been compared with each other by having been increased the probability of obtaining the best error values of the algorithms. While the error values of the algorithms were high by the criteria of root mean squared error and mean absolute error at the beginning of the training iteration, when the number of iteration increased, the acceptable error values below 0.2 of the other used algorithms except Naive Bayesian have been obtained. In addition, prediction error rates have been obtained at a very low rate of 0,21% with artificial neural network and 0,45% with linear regression, that is, high accuracy rates have been achieved. Keywords: Machine learning algorithms, supervised machine learning algorithms, prediction, success, iteration, training, test, data set.