DSpace Repository

Akademik yayınlar için makine öğrenmesi tabanlı arama motoru tasarlanması ve uygulanması = Design and implementation of a machine learning based search engine for academic publications /

Show simple item record

dc.creator Karabıyık, Muhammed Abdulhamid, 1986- author 183089
dc.creator Yüksel, Asım Sinan, 1983- thesis advisor 179876
dc.creator Süleyman Demirel Üniversitesi. Fen Bilimleri Enstitüsü. Bilgisayar Mühendisliği Anabilim Dalı. 24579 issuing body
dc.date 2018.
dc.identifier http://tez.sdu.edu.tr/Tezler/TF04089.pdf
dc.description Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir. Anahtar Kelimeler: Makine Öğrenmesi, Dikey Arama Motoru, Sade Bayes Sınıflandırıcı, Destek Vektör Makineleri.
dc.description In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied. Keywords: Machine Learning, Vertical Search Engine, Naive Bayesian Classifier, Support Vector Machines.
dc.description Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, 2018.
dc.description Kaynakça var.
dc.description Dikey arama motoru üzerine hazırlanan bu tez çalışmasında, makine öğrenmesi metotları ile metin sınıflandırma işlemi yapılmıştır. Arama motorunun sadece akademik yayınları bulması için kısıtlayıcı bir ağ örümceği tasarlanmıştır. Yapılan uygulamada arama sonuçlarının en doğru şekilde bulunabilmesi için metin sınıflandırma işlemi gerçekleştirilmiştir. Bu alanda en çok kullanılan sınıflandırıcılardan olan Sade Bayes ve Destek Vektör Makineleri sınıflandırıcıları uygulanarak elde edilen sonuçlar karşılaştırılmıştır. Geliştirilen uygulamada akademik yayınlar 14 ana konu başlığı, 450 adet metin özeti ile eğitilerek makine öğrenmesi sınıfları için kullanılmıştır. Yapılan deneylerde metin sınıflandırma için eğitim setinin ve konu başlıklarının kesin değerler içermesi gerektiği ve sınıflandırma sonuçlarını doğrudan etkilediği görülmüştür. Birden çok bilim dalıyla ilişkili olan veya başka bilim dalı terimlerine hitap eden çalışmalarda sınıflandırmanın daha zor olduğu sonucuna varılmıştır. Aynı test verisi uygulandığında Sade Bayes sınıflandırıcıda %80, Destek Vektör Makineleri sınıflandırıcısında ise %70 başarı oranı elde edilmiştir. Anahtar Kelimeler: Makine Öğrenmesi, Dikey Arama Motoru, Sade Bayes Sınıflandırıcı, Destek Vektör Makineleri.
dc.description In this thesis study on vertical search engine, text classification was performed with machine learning methods. A restrictive web crawler was designed for the search engine to find only academic publications. The text classification was performed in order to find the most accurate search results. The results that are obtained by applying Naive Bayesian and Support Vector Machine classifiers, which are the most used classifiers, are compared. In the developed application, academic publications were used for machine learning classification and application was trained with 450 text summaries 14 scientific fields. It was observed that the training set for the text classification and the scientific fields should contain precise values and the classification results have a direct effect on the experiments performed. It was concluded that it was more difficult to classify the studies involving more than one science discipline or addressing other scientific disciplines. Naive Bayesian classifier achieved 80% success rate and Support Vector machine classifier achieved 70% succes rate when the same test data were applied. Keywords: Machine Learning, Vertical Search Engine, Naive Bayesian Classifier, Support Vector Machines.
dc.language tur
dc.publisher Isparta : Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü,
dc.subject Süleyman Demirel Üniversitesi
dc.title Akademik yayınlar için makine öğrenmesi tabanlı arama motoru tasarlanması ve uygulanması = Design and implementation of a machine learning based search engine for academic publications /
dc.type text


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account