Bu çalışmada bağımlı değişkenin sürekli veya kategorik olduğu durumlarda kullanabilecek lojistik regresyon analizi incelenmiştir. Kullanıma açık verilerden yararlanılarak lojistik regresyon analizinin iki ve çok kategorili modellerinin teorisi ve analizlerinin ayrıntılı bir şekilde anlatılması amaçlanmıştır. Yöntem: Retrospektif olarak yapılan bu araştırmada iki kategorili lojistik regresyon analizi için kalp krizi riski verisi ve çok kategorili lojistik regresyon analizi için sağlık sigortası harcaması verileri kullanılmıştır. Verilerin normal dağılım gösterip varyanslarının homojen olması durumunda Bağımsız Grup Student t-testi ve üç veya daha fazla çoklu grupların karşılaştırılmalarında ise Tek Yönlü Varyans Analizi yapılmıştır. Verilerin normal dağılım göstermediği veya kategorik verilerin analizleri için parametrik olmayan Mann-Whitney U testi ve üç veya daha fazla gruplara göre karşılaştırmaların yapıldığı Kruskal-Wallis H testi kullanılmıştır. Bulgular: Hastaların yaşı, dinlenme anı kan basıncı, maksimum nabız sayısı, ST segmenti çökme değeri ve görüntülenen damar sayısı, düşük ve yüksek MI risk sınıfları arasında anlamlı farklılık göstermiştir. Dinlenme anı EKG bulgularında ST-T dalga anormalliği yüksek risk grubunda bulunan hastalarda daha yüksek oranda gözlenmiştir. Egzersiz anında anjina görülme oranı düşük risk grubundaki hastalarda daha yüksek oranda izlenmiştir. Çok kategorili lojistik regresyon analizinde müşterilerin VKİ değerleri (p<0,001) ve ödediği sağlık sigorta miktarı (p=0,010) Güneydoğu Bölgesi'nde yaşayanlar için anlamlı düzeyde yüksektir Müşterilerin ödediği sağlık sigorta miktarı da Güneydoğu Bölgesi müşterilerinde anlamlı düzeyde yüksek bulunmuştur (p=0,010). Sonuç: İki kategorili lojistik regresyon analizinde kullanılan kalp krizi verisinde hastaların yaşı, dinlenme anı kan basıncı, maksimum nabız sayısı, ST segmenti çökme değeri ve görüntülenen damar sayısı, düşük ve yüksek MI risk sınıfları arasında anlamlı farklılık göstermiştir (p<0,001). Müşterilere ait VKİ, sigorta ücreti ve sigara kullanımı modelde anlamlı katkı yapmaktadır. Anahtar Kelimeler : Lojistik regresyon analizi, iki kategorili, çok kategorili.
The increase in the risk of heart attack and the rising health insurance costs in different regions of the States were examined due to different parameters implementing logistic regression. It was aimed to explain the theory and analyses of the dichotomous and multinominal models of the regression in details through publicly available data. Method: In this retrospective study, the heart attack risk datasets for binary logistic regression and the health insurance expenditure datasets for multi-category logistic regression analysis were used. If the data were normally distributed and the variances were homogeneous, independent groups t-test was executed, and one-way analysis of variance (ANOVA) was implemented for the comparison of three or more multiple groups. The non-parametric of Mann-Whitney U test was employed for the analysis of the dataset where there was non-normal distribution, or it was a categorical dataset. When there were three or more groups' comparisons of non-normal or qualitative datasets, the Kruskal-Wallis H test was carried out for the analysis. Results: The patients' age, resting blood pressure, maximum heart rate, ST segment depression value, and the number of vessels displayed significantly between low and high MI risk classes. In the resting ECG findings, ST-T wave abnormality was observed at a higher rate in patients for the high-risk group. The incidence of angina during exercise was higher in patients for the low-risk group. In the multinominal logistic regression analysis, the BMI values of the customers were significantly higher for those living in the Southeast region (p<0.001). Thus, the amount of health insurance paid by the customers was also observed to be notably higher in the Southeast region customers (p=0.010). Conclusion: In this work, it is presented that the patients' age, resting blood pressure, maximum heart rate, ST segment depression value and the number of displayed vessels show significant differences between low and high MI risk classes (p<0.001). In the second example, the customers who have higher BMI and smoking status that contribute to the insurance cost substantially in the model. Keywords : Logistic regression analysis, binary, multinominal.
Tez (Yüksek Lisans) - Süleyman Demirel Üniversitesi, Sağlık Bilimleri Enstitüsü, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, 2021.
Kaynakça var.
Bu çalışmada bağımlı değişkenin sürekli veya kategorik olduğu durumlarda kullanabilecek lojistik regresyon analizi incelenmiştir. Kullanıma açık verilerden yararlanılarak lojistik regresyon analizinin iki ve çok kategorili modellerinin teorisi ve analizlerinin ayrıntılı bir şekilde anlatılması amaçlanmıştır. Yöntem: Retrospektif olarak yapılan bu araştırmada iki kategorili lojistik regresyon analizi için kalp krizi riski verisi ve çok kategorili lojistik regresyon analizi için sağlık sigortası harcaması verileri kullanılmıştır. Verilerin normal dağılım gösterip varyanslarının homojen olması durumunda Bağımsız Grup Student t-testi ve üç veya daha fazla çoklu grupların karşılaştırılmalarında ise Tek Yönlü Varyans Analizi yapılmıştır. Verilerin normal dağılım göstermediği veya kategorik verilerin analizleri için parametrik olmayan Mann-Whitney U testi ve üç veya daha fazla gruplara göre karşılaştırmaların yapıldığı Kruskal-Wallis H testi kullanılmıştır. Bulgular: Hastaların yaşı, dinlenme anı kan basıncı, maksimum nabız sayısı, ST segmenti çökme değeri ve görüntülenen damar sayısı, düşük ve yüksek MI risk sınıfları arasında anlamlı farklılık göstermiştir. Dinlenme anı EKG bulgularında ST-T dalga anormalliği yüksek risk grubunda bulunan hastalarda daha yüksek oranda gözlenmiştir. Egzersiz anında anjina görülme oranı düşük risk grubundaki hastalarda daha yüksek oranda izlenmiştir. Çok kategorili lojistik regresyon analizinde müşterilerin VKİ değerleri (p<0,001) ve ödediği sağlık sigorta miktarı (p=0,010) Güneydoğu Bölgesi'nde yaşayanlar için anlamlı düzeyde yüksektir Müşterilerin ödediği sağlık sigorta miktarı da Güneydoğu Bölgesi müşterilerinde anlamlı düzeyde yüksek bulunmuştur (p=0,010). Sonuç: İki kategorili lojistik regresyon analizinde kullanılan kalp krizi verisinde hastaların yaşı, dinlenme anı kan basıncı, maksimum nabız sayısı, ST segmenti çökme değeri ve görüntülenen damar sayısı, düşük ve yüksek MI risk sınıfları arasında anlamlı farklılık göstermiştir (p<0,001). Müşterilere ait VKİ, sigorta ücreti ve sigara kullanımı modelde anlamlı katkı yapmaktadır. Anahtar Kelimeler : Lojistik regresyon analizi, iki kategorili, çok kategorili.
The increase in the risk of heart attack and the rising health insurance costs in different regions of the States were examined due to different parameters implementing logistic regression. It was aimed to explain the theory and analyses of the dichotomous and multinominal models of the regression in details through publicly available data. Method: In this retrospective study, the heart attack risk datasets for binary logistic regression and the health insurance expenditure datasets for multi-category logistic regression analysis were used. If the data were normally distributed and the variances were homogeneous, independent groups t-test was executed, and one-way analysis of variance (ANOVA) was implemented for the comparison of three or more multiple groups. The non-parametric of Mann-Whitney U test was employed for the analysis of the dataset where there was non-normal distribution, or it was a categorical dataset. When there were three or more groups' comparisons of non-normal or qualitative datasets, the Kruskal-Wallis H test was carried out for the analysis. Results: The patients' age, resting blood pressure, maximum heart rate, ST segment depression value, and the number of vessels displayed significantly between low and high MI risk classes. In the resting ECG findings, ST-T wave abnormality was observed at a higher rate in patients for the high-risk group. The incidence of angina during exercise was higher in patients for the low-risk group. In the multinominal logistic regression analysis, the BMI values of the customers were significantly higher for those living in the Southeast region (p<0.001). Thus, the amount of health insurance paid by the customers was also observed to be notably higher in the Southeast region customers (p=0.010). Conclusion: In this work, it is presented that the patients' age, resting blood pressure, maximum heart rate, ST segment depression value and the number of displayed vessels show significant differences between low and high MI risk classes (p<0.001). In the second example, the customers who have higher BMI and smoking status that contribute to the insurance cost substantially in the model. Keywords : Logistic regression analysis, binary, multinominal.