| dc.creator |
Karabıyık, Muhammed Abdulhamid,
1986-
author
183089 |
|
| dc.creator |
Yüksel, Asım Sinan,
1983-
thesis advisor
179876 |
|
| dc.creator |
Süleyman Demirel Üniversitesi.
Fen Bilimleri Enstitüsü.
Bilgisayar Mühendisliği Anabilim Dalı.
24579
issuing body |
|
| dc.date |
2018. |
|
| dc.identifier |
http://tez.sdu.edu.tr/Tezler/TF04089.pdf |
|
| dc.description |
Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir. Anahtar Kelimeler: Makine Öğrenmesi, Dikey Arama Motoru, Sade Bayes Sınıflandırıcı, Destek Vektör Makineleri. |
|
| dc.description |
In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied. Keywords: Machine Learning, Vertical Search Engine, Naive Bayesian Classifier, Support Vector Machines. |
|
| dc.description |
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, 2018. |
|
| dc.description |
Kaynakça var. |
|
| dc.description |
Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir. Anahtar Kelimeler: Makine Öğrenmesi, Dikey Arama Motoru, Sade Bayes Sınıflandırıcı, Destek Vektör Makineleri. |
|
| dc.description |
In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied. Keywords: Machine Learning, Vertical Search Engine, Naive Bayesian Classifier, Support Vector Machines. |
|
| dc.language |
tur |
|
| dc.publisher |
Isparta : Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü, |
|
| dc.subject |
Süleyman Demirel Üniversitesi |
|
| dc.title |
Akademik yayınlar için makine öğrenmesi tabanlı arama motoru tasarlanması ve uygulanması = Design and implementation of a machine learning based search engine for academic publications / |
|
| dc.type |
text |
|