Veri madenciliği bir veri ambarında, veriler üzerindeki gizli bağlantıları ortaya çıkarmak için kullanılmaktadır. Verinin bulunduğu her ortamda ham veriler anlamlı hale getirilerek bilgi keşfi işlemine veri madenciliği denir. Türkiye istatistik kurumu, ülke bazında istatistiki araştırmalar yapan bir kurumdur. Kurumun bilgi edinme kanunu kapsamında herkes tarafından kullanıma açılmış veri tabanları mevcuttur. Bu veri tabanlarında halkın yaşam istatistikleri tutulmaktadır. Bu çalışmada Türkiye İstatistik Kurumu verileri üzerine uygun bir veri ambarı kurulmuştur. Veri ambarına kurumun kullanıma sunduğu veriler alınmış ve bu veriler üzerine veri madenciliği çalışması yapılmıştır. Veri ambarı çalışması Oracle 11g veri tabanı üzerinde oluşturulmuştur. Veri madenciliği çalışmaları bu veri tabanına bütünleşik olarak gelen Oracle Data Miner aracı üzerinde gerçekleştirilmiştir. Kümeleme ve sınıflandırma metotları ile Türkiye genelinde il ve yıl bazında vatandaşların evlenme, boşanma, intihar, sinema izleme ve tiyatro izleme yoğunluklarının birbirine etkisi gözlemlenmiştir. Yapılan çalışmalar göstermiştir ki, bir bölgedeki yaşam istatistiklerin tümü birbirini pozitif veya negatif yönde etkilemektedir. Çalışma göstermiştir ki bir şehirdeki intiharın çok az olmasını en fazla etkileyen faktör o şehirdeki evlenmenin fazla olmasıdır. Aynı zamanda boşanmanın çok az olmasını en fazla etkileyen faktör evlenmenin çok fazla olmasıdır. Aynı zamanda intihar çok fazla olmasının en fazla etkileyen faktör o şehirde sinemanın olmamasıdır. Anahtar Kelimeler: Veri ambarı, Veri madenciliği, Kümeleme, K-means, SVM, Sınıflandırma, Türkiye İstatistik Kurumu, Oracle , Oracle Data Miner.
Data mining is used to find hidden connections on the data via data warehouse. Knowledge discovery means gathering meaningful data, on any environment where the data is found, the process is called data mining. Turkish Statistical Institure is an institute that makes statistical research beyond the country. Database are available for use by everyone within the scope of the law to obtain information. Citizens vital statistics are kept in this database. In this study a proper data warehouse built on datas of Turkish Statistical Institute. Institute datas has been imported to data warehouse and data mining processes made on that data. Data warehouse build on Oracle companies Oracle 11g data base.The data warehouse is built on the Oracle 11g database. Data mining study has been made on Oracle Data Miner tool which is integrated on database. Clustering and classification methods operated and observed effects of eachother via marriage, divorce, suicide, movie and theater watching intensity on whole country by year and city. Studies have shown that, all vital statistics on an area effects eachother positively or negatively. Study have shown that most effective factor on very few degree of suicide in a city is much degree of marriage. At the same time most effective factor on very less degree of divorcing is very much degree of marriage. At the same time most effective factor on very much degree of suicide is have no cinema in city. Keywords: Data warehouse, Data mining, Clustering, Classification, K-means, SVM, Turkish Statistical Institute, Oracle, Oracle Data Miner
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, 2015.
Kaynakça var.
Veri madenciliği bir veri ambarında, veriler üzerindeki gizli bağlantıları ortaya çıkarmak için kullanılmaktadır. Verinin bulunduğu her ortamda ham veriler anlamlı hale getirilerek bilgi keşfi işlemine veri madenciliği denir. Türkiye istatistik kurumu, ülke bazında istatistiki araştırmalar yapan bir kurumdur. Kurumun bilgi edinme kanunu kapsamında herkes tarafından kullanıma açılmış veri tabanları mevcuttur. Bu veri tabanlarında halkın yaşam istatistikleri tutulmaktadır. Bu çalışmada Türkiye İstatistik Kurumu verileri üzerine uygun bir veri ambarı kurulmuştur. Veri ambarına kurumun kullanıma sunduğu veriler alınmış ve bu veriler üzerine veri madenciliği çalışması yapılmıştır. Veri ambarı çalışması Oracle 11g veri tabanı üzerinde oluşturulmuştur. Veri madenciliği çalışmaları bu veri tabanına bütünleşik olarak gelen Oracle Data Miner aracı üzerinde gerçekleştirilmiştir. Kümeleme ve sınıflandırma metotları ile Türkiye genelinde il ve yıl bazında vatandaşların evlenme, boşanma, intihar, sinema izleme ve tiyatro izleme yoğunluklarının birbirine etkisi gözlemlenmiştir. Yapılan çalışmalar göstermiştir ki, bir bölgedeki yaşam istatistiklerin tümü birbirini pozitif veya negatif yönde etkilemektedir. Çalışma göstermiştir ki bir şehirdeki intiharın çok az olmasını en fazla etkileyen faktör o şehirdeki evlenmenin fazla olmasıdır. Aynı zamanda boşanmanın çok az olmasını en fazla etkileyen faktör evlenmenin çok fazla olmasıdır. Aynı zamanda intihar çok fazla olmasının en fazla etkileyen faktör o şehirde sinemanın olmamasıdır. Anahtar Kelimeler: Veri ambarı, Veri madenciliği, Kümeleme, K-means, SVM, Sınıflandırma, Türkiye İstatistik Kurumu, Oracle , Oracle Data Miner.
Data mining is used to find hidden connections on the data via data warehouse. Knowledge discovery means gathering meaningful data, on any environment where the data is found, the process is called data mining. Turkish Statistical Institure is an institute that makes statistical research beyond the country. Database are available for use by everyone within the scope of the law to obtain information. Citizens vital statistics are kept in this database. In this study a proper data warehouse built on datas of Turkish Statistical Institute. Institute datas has been imported to data warehouse and data mining processes made on that data. Data warehouse build on Oracle companies Oracle 11g data base.The data warehouse is built on the Oracle 11g database. Data mining study has been made on Oracle Data Miner tool which is integrated on database. Clustering and classification methods operated and observed effects of eachother via marriage, divorce, suicide, movie and theater watching intensity on whole country by year and city. Studies have shown that, all vital statistics on an area effects eachother positively or negatively. Study have shown that most effective factor on very few degree of suicide in a city is much degree of marriage. At the same time most effective factor on very less degree of divorcing is very much degree of marriage. At the same time most effective factor on very much degree of suicide is have no cinema in city. Keywords: Data warehouse, Data mining, Clustering, Classification, K-means, SVM, Turkish Statistical Institute, Oracle, Oracle Data Miner