İnternet kullanımındaki artışla birlikte sosyal medya ortamlarındaki yorumlar dolayısıyla veri akışı da artmıştır. Veri miktarının artmasına paralel olarak verilerden anlam çıkarabilme ihtimali de azalmıştır. Eldeki verinin artması, işlenmesini zor hale getirmiş, dolayısıyla veriden anlam çıkarabilme yeteneği olan, insanların görüşlerini, duygularını otomatik olarak analiz ederek yorumlayabilen akıllı sistemlerin, karar destek mekanizmalarının önemi artmıştır. Duygu analizi kişinin sahip olduğu duyguların, düşüncelerin sınıflandırılarak belirlenmesi işlemidir ve bir konu hakkındaki görüşlerin olumlu mu yoksa olumsuz mu olduğu bulunmaya çalışılır. Bu tez çalışmasında sosyal ağlardan daha yararlı ve net bilgilere ulaşmak, kişilerin bulundukları çevrede gitmeyi planladıkları mekânlar hakkındaki görüşlerini otomatik olarak yorumlamak amacıyla metin madenciliği ve duygu analizi teknikleri uygulanarak bir karar destek sistemi geliştirilmiştir. Metin madenciliği tekniklerinin uygulanması için gerekli olan veri setleri insanların dünya üzerinde herhangi bir şehirde yemek, içmek, alışveriş yapmak veya ziyaret etmek için mekânları bulmalarını sağlayan Foursquare sosyal paylaşım platformunda bulunan yorumlardan toplanmıştır. Foursquare'den elde edilen veriler üzerinde doğal dil işleme ve metin madenciliği teknikleri uygulanarak o mekân hakkında genel olarak belirtilen duygu ve düşüncenin bulunması hedeflenmiştir. Geliştirilen karar destek sistemi ile olumlu ve olumsuz görüşler gerçek zamanlı olarak belirlenmekte ve duygu analizleri otomatik bir şekilde yapılmaktadır. Bu sayede sosyal medya kullanıcılarının binlerce yorumu okumadan gitmeyi planladıkları mekânlar hakkında karar vermelerine katkı sağlanmıştır. Aynı zamanda elde edilen olumlu ve olumsuz görüşlere göre mekân sahiplerinin eksikliklerini gidermeleri ve hizmet kalitelerini arttırmaları yönünde adım atmaları amaçlanmıştır. Duygu analizi ve doğal dil işleme çalışmaları yoğunlukla İngilizce dili için geliştirilmiştir. Türkçe dilinin biçim farklılığından dolayı bu kuralların Türkçede uygulanması daha zordur. Tez kapsamında İngilizce için kullanılan duygu analizi yöntemlerinin Türkçede göstereceği tepkiler incelenmiş ve Türkçeye özel yeni bir yöntem geliştirilerek duygu analizi metotları ile birleştirilmiştir. Geliştirilen yöntem Türkçe için uygulanan diğer sınıflandırma algoritmaları ile karşılaştırılmıştır. Karşılaştırma sonucunda yeni metodun diğer yöntemlere göre daha iyi bir başarı oranı elde ettiği görülmüştür. Geliştirilen bu yöntem Türkçe dili için yapılacak olan diğer duygu analizi çalışmalarına da referans olacaktır. Anahtar Kelimeler: Metin Madenciliği, Bilgi Keşfi, Veri Madenciliği, Duygu Analizi, Sosyal Ağlar, Öznitelik Seçimi, Sade Bayes, Doğal Dil İşleme
Along with the increase in Internet usage, data flow has increased due to the comments in social media environments. Parallel to this, possibility of deriving meaning from data has decreased. The increase in the amount of data has made it difficult to be process and has led to the development of intelligent systems, decision support mechanisms which have the ability to extract meaning from the data, interpreting people's opinions, emotions automatically. Sentiment analysis is the process of determining the feelings that a person possesses by categorizing the opinions and finding out whether the opinions about a subject are positive or negative. In this thesis study, a decision support system was developed by applying text mining and sentiment analysis techniques in order to reach more useful and clear information from social networks and automatically interpret the opinions of the people about the places they plan to go. The data set that is needed to implement text mining techniques was collected from comments on the Foursquare social sharing platform, which allows people to find places to eat, drink, shop or visit in any city in the world. It is aimed to find the general feeling and thought about the place by applying natural language processing and text mining techniques on the data obtained from Foursquare. Positive and negative opinions are determined in real time with the developed decision support system and sentiment analysis is done automatically. In this way, social media users have contributed to making decisions about the places they plan to go to without reading thousands of comments. At the same time, it was aimed to help venue owners to take steps in order to improve their service quality according to the positive and negative opinions. Sentiment analysis and natural language processing techniques have been intensively developed for the English language. Due to the difference in form of Turkish language, it is more difficult to apply them in Turkish. Within the scope of the thesis, the reactions of the sentiment analysis methods used in English were examined for Turkish and a new method specific to Turkish was developed and combined with sentiment analysis methods. The developed method is compared with other classification algorithms applied for Turkish. As a result of the comparison, it was seen that the new method achieved a better success rate than the other methods. This method will also be reference for other sentiment analysis studies for Turkish language. Keywords: Text Mining, Knowledge Discovery, Data Mining, Sentiment Analysis, Social Networks, Feature Selection, Sade Bayes, Natural Language Processing
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, 2018.
Kaynakça var.
İnternet kullanımındaki artışla birlikte sosyal medya ortamlarındaki yorumlar dolayısıyla veri akışı da artmıştır. Veri miktarının artmasına paralel olarak verilerden anlam çıkarabilme ihtimali de azalmıştır. Eldeki verinin artması, işlenmesini zor hale getirmiş, dolayısıyla veriden anlam çıkarabilme yeteneği olan, insanların görüşlerini, duygularını otomatik olarak analiz ederek yorumlayabilen akıllı sistemlerin, karar destek mekanizmalarının önemi artmıştır. Duygu analizi kişinin sahip olduğu duyguların, düşüncelerin sınıflandırılarak belirlenmesi işlemidir ve bir konu hakkındaki görüşlerin olumlu mu yoksa olumsuz mu olduğu bulunmaya çalışılır. Bu tez çalışmasında sosyal ağlardan daha yararlı ve net bilgilere ulaşmak, kişilerin bulundukları çevrede gitmeyi planladıkları mekânlar hakkındaki görüşlerini otomatik olarak yorumlamak amacıyla metin madenciliği ve duygu analizi teknikleri uygulanarak bir karar destek sistemi geliştirilmiştir. Metin madenciliği tekniklerinin uygulanması için gerekli olan veri setleri insanların dünya üzerinde herhangi bir şehirde yemek, içmek, alışveriş yapmak veya ziyaret etmek için mekânları bulmalarını sağlayan Foursquare sosyal paylaşım platformunda bulunan yorumlardan toplanmıştır. Foursquare'den elde edilen veriler üzerinde doğal dil işleme ve metin madenciliği teknikleri uygulanarak o mekân hakkında genel olarak belirtilen duygu ve düşüncenin bulunması hedeflenmiştir. Geliştirilen karar destek sistemi ile olumlu ve olumsuz görüşler gerçek zamanlı olarak belirlenmekte ve duygu analizleri otomatik bir şekilde yapılmaktadır. Bu sayede sosyal medya kullanıcılarının binlerce yorumu okumadan gitmeyi planladıkları mekânlar hakkında karar vermelerine katkı sağlanmıştır. Aynı zamanda elde edilen olumlu ve olumsuz görüşlere göre mekân sahiplerinin eksikliklerini gidermeleri ve hizmet kalitelerini arttırmaları yönünde adım atmaları amaçlanmıştır. Duygu analizi ve doğal dil işleme çalışmaları yoğunlukla İngilizce dili için geliştirilmiştir. Türkçe dilinin biçim farklılığından dolayı bu kuralların Türkçede uygulanması daha zordur. Tez kapsamında İngilizce için kullanılan duygu analizi yöntemlerinin Türkçede göstereceği tepkiler incelenmiş ve Türkçeye özel yeni bir yöntem geliştirilerek duygu analizi metotları ile birleştirilmiştir. Geliştirilen yöntem Türkçe için uygulanan diğer sınıflandırma algoritmaları ile karşılaştırılmıştır. Karşılaştırma sonucunda yeni metodun diğer yöntemlere göre daha iyi bir başarı oranı elde ettiği görülmüştür. Geliştirilen bu yöntem Türkçe dili için yapılacak olan diğer duygu analizi çalışmalarına da referans olacaktır. Anahtar Kelimeler: Metin Madenciliği, Bilgi Keşfi, Veri Madenciliği, Duygu Analizi, Sosyal Ağlar, Öznitelik Seçimi, Sade Bayes, Doğal Dil İşleme
Along with the increase in Internet usage, data flow has increased due to the comments in social media environments. Parallel to this, possibility of deriving meaning from data has decreased. The increase in the amount of data has made it difficult to be process and has led to the development of intelligent systems, decision support mechanisms which have the ability to extract meaning from the data, interpreting people's opinions, emotions automatically. Sentiment analysis is the process of determining the feelings that a person possesses by categorizing the opinions and finding out whether the opinions about a subject are positive or negative. In this thesis study, a decision support system was developed by applying text mining and sentiment analysis techniques in order to reach more useful and clear information from social networks and automatically interpret the opinions of the people about the places they plan to go. The data set that is needed to implement text mining techniques was collected from comments on the Foursquare social sharing platform, which allows people to find places to eat, drink, shop or visit in any city in the world. It is aimed to find the general feeling and thought about the place by applying natural language processing and text mining techniques on the data obtained from Foursquare. Positive and negative opinions are determined in real time with the developed decision support system and sentiment analysis is done automatically. In this way, social media users have contributed to making decisions about the places they plan to go to without reading thousands of comments. At the same time, it was aimed to help venue owners to take steps in order to improve their service quality according to the positive and negative opinions. Sentiment analysis and natural language processing techniques have been intensively developed for the English language. Due to the difference in form of Turkish language, it is more difficult to apply them in Turkish. Within the scope of the thesis, the reactions of the sentiment analysis methods used in English were examined for Turkish and a new method specific to Turkish was developed and combined with sentiment analysis methods. The developed method is compared with other classification algorithms applied for Turkish. As a result of the comparison, it was seen that the new method achieved a better success rate than the other methods. This method will also be reference for other sentiment analysis studies for Turkish language. Keywords: Text Mining, Knowledge Discovery, Data Mining, Sentiment Analysis, Social Networks, Feature Selection, Sade Bayes, Natural Language Processing