Journal List > J Korean Acad Oral Health > v.47(1) > 1516082128

머신러닝 기반 의사결정 나무를 활용한 성인의 잔존 치아 수 요인 분석

Abstract

Objectives

This study aims to investigate the effect of determinants on the number of remaining teeth in Korean adults using a machine learning-based decision tree analysis.

Methods

The study used data from the Korea National Health and Nutrition Examination Survey (KNHANES) VII (2016-2018) and a decision-tree analysis to explain the causes for the number of remaining teeth in adults. The determinants for the study are sex, age, house income, education level, diabetes, BMI, smoking, alcohol drinking, tooth brushing per day, and periodontitis.

Results

Age had the most significant effect on the number of remaining teeth, followed by house income.

Conclusions

This research is meaningful as it provides a systematic index in the number of remaining teeth in Korean adults based on a combination of numerous variables. These variables have already been validated against the results of previous studies that have attempted to elucidate new variables affecting the number of remaining teeth.

서 론

치아의 수는 건강한 삶을 유지하는데 있어 필수적이다. 치아가 상실되면 저작능력이 감소하여 음식물 섭취에 영향을 미치며, 음식물 선택의 범위가 한정되어 영양섭취가 불량해진다1). 또한 치아상실로 인해 발음 및 심미기능에 영향을 미쳐 대인관계 및 사회생활에 삶의 질이 감소하며 정신건강에도 영향을 미친다2-4).
치아 수에 영향을 미치는 요인을 살펴본 연구들은 인구사회학적 특성인 소득수준, 교육수준, 당뇨, 체질량지수, 건강상태요인, 칫솔질횟수가 영향을 미친다고 보고하였다5-10). 한 연구에 따르면 40세 이상 성인을 대상으로 상실치아 수와 관련요인을 분석한 결과 20개 이상의 치아를 가진 군에서 소득과 교육수준이 높았다고 보고하였다5). 65세 이상 노인을 대상으로 상실치아 수와 관련 요인을 분석한 결과 교육수준, 흡연여부, 주관적 구강건강상태, 당뇨, 체질량지수(BMI)가 상실치아 수와 관련이 있다고 보고하였다6). 소도시지역보다 대도시 지역에 거주하는 대상자에서 잔존치아 수가 높았으며, 여성 및 1일 칫솔질횟수가 많은 대상자, 비흡연자에서 잔존치아 수가 유의하게 높다고 보고하였다7). 또 다른 연구에서는 현재 치아의 수와 관련된 인종, 가구 소득, 교육 수준과 같은 개인 및 사회 경제적 요인을 확인하여 구강 예방 및 공공 구강 건강 프로그램을 제안하였다8-10). 또한 치아 상실은 대표적인 구강건강 문제인 치아우식증과 치주질환 등의 결과로 나타나며11,12), 40대 이상 성인에서는 치아상실의 원인 중 대부분이 치주질환으로 인한 발치 비율이 높았다고 보고하여13) 치아 상실에 원인에 치주질환이 기인한다는 점을 확인할 수 있다. 이러한 선행연구를 통해 치아 수에 영향을 미치는 요인들은 인구사회학적 요인과 비침습적인 요인들을 활용한 것을 확인할 수 있다. 하지만, 치아 수에 우선적으로 영향을 미치는 요인에 대해 머신러닝 기반의 의사결정나무 분석을 활용한 연구는 없었다.
최근 머신러닝 및 데이터 마이닝은 의학 및 보건분야에서 질병 예측 및 식별을 위해 활용되고 있다14). 한 연구에서는 노인을 대상으로 비만 고위험군을 규명하기 위해 의사결정 나무 분석을 적용하였으며15), 다른 연구에서는 약물복용 중인 고혈압 환자를 대상으로 혈압관리 적절군과 취약군을 구분하고, 혈압관리에 총 콜레스테롤, 고혈압 유병기간, 동거상태 등의 요인들을 고려해야 하는 필요성을 제시하였다14,15). 다양한 요인들을 동시에 고려하는 의사결정 나무 분석은 머신러닝의 지도학습에 해당되는 알고리즘 중 하나로 의사결정규칙(decision rule)을 나무구조로 표현하며, 전체 집단을 여러 개의 소집단으로 분류(classification)한다. 분류 후 예측을 진행하여 분석하는 과정이다. 이러한 과정으로 나무구조에 의한 추론규칙(induction rule)이 시각적으로 표현된다. 이에 연구자가 예측 과정을 쉽게 이해하고, 설명이 가능하다. 또한 어떤 요인이 특정 상태의 분류에 영향을 많은 영향을 미치는지 파악하기 용이하다는 점과 고위험군 예측에도 유용한 이점을 가지고 있다16,17). 그러므로 의사결정나무 분석을 활용하여 치아 수에 우선적으로 영향을 미치는 요인을 예측하는 연구가 필요하다.
따라서 본 연구는 잔존 치아 수에 영향을 미치는 새로운 변수를 찾아내려는 기존의 연구들과 달리 요인으로 보고된 인구사회학적 요인을 활용하였으며, 의사결정나무 기법을 통해 잔존치아 수에 우선적으로 영향을 미치는 요인들 간의 관계를 구조화했다는 차별화된 점을 제시하고자 한다.

연구대상 및 방법

1. 연구대상

본 연구는 2016년부터 2018년까지 질병관리청에서 제공하는 제7기 국민건강영양조사(Korea National Health and Nutrition Examination Survey, KNHANES)를 이용하였다. 국민건강영양조사데이터는 연구윤리심의위원회의 승인을 받아 수집되었으며(IRB No. 2018-01-03-P-A), 연구대상자는 총 16,489명 중 만 19세 이상 성인을 대상으로 13,199명을 추출하였다.

2. 연구도구

본 연구에서 사용한 독립변수는 다음과 같이 재분류 하였다. 연령은 19-29세, 30-39세, 40-49세, 50-59세 및 60세 이상으로 범주화하였으며, 가구소득은 상, 중(중상, 중하), 하로 분류하였으며, 교육수준은 초졸 이하, 중졸, 고졸 및 대졸 이상으로 범주화하였다. 당뇨병은 공복혈당이 ≥126 mg/dl 또는 의사의 진단을 받았거나 혈당조절 약물복용 또는 인슐린 주사 여부로 분류하였다18). BMI는 저체중(<18.5 kg/m2), 정상체중(18.5-22.9 kg/m2). 과체중(23-24.9 kg/m2) 및 비만(>25 kg/m2)으로 구분하였다. 흡연상태는 현재 흡연상태에 따라 5갑 미만 흡연자를 비흡연과 그 이상을 흡연으로 범주화하였으며19), 음주는 월간 음주율로 평생 비음주 또는 최근 1년간 월 1잔 미만 음주의 경우를 비음주, 최근 1년간 월 1잔 이상 음주할 경우를 음주상태로 구분하였다. 하루 칫솔질횟수는 1회 이하, 2회 및 3회 이상으로 구분하였다20). 치주염 유무에 대한 검사는 세계보건기구(WHO)에서 제시한 지역사회치주지수(Community Periodontal Index, CPI) 검사 기준에 따른 검진조사를 통해 결정되었다. 치주낭 깊이에 따라 4 mm 미만을 정상(CPI 0-2), 4 mm 이상을 치주염(CPI 3, 4)으로 정의하였다21). 종속변수인 잔존치아 수는 제 3대 구치를 제외한 후 선행연구를 참고하여 대상자의 남아있는 치아 분류하였으며 15개 이하, 16-20개, 21-28개의 세 집단으로 범주화하였다22).

3. 통계분석

본 연구의 복합표본 분석과 머신러닝 기반 의사결정 나무 분석의 흐름도는 Fig. 1과 같다. 1단계 분석인 국민건강영양조사는 복합표본설계방법으로 수집된 자료이며, 통합가중치, 층화변수, 집락변수를 적용하여 모든 국민의 일반화한 추정빈도 값이 산출되는 복합표본 분석을 실시하였다. 연구대상자의 일반적 특성에 따른 잔존 치아수를 파악하기 위해 교차분석을 실시하였다. 통계적 분석은 IBM SPSS Statistics for Windows, Version 23.0 (IBM Corp., Armonk, NY, USA)을 이용하였으며, 유의수준은 α=0.05를 기준으로 하였다.
2단계 분석은 머신러닝 기법에 해당하는 의사결정 나무 분석법을 실시하였다. 국민건강영양조사 자료를 SPSS 상에서 데이터 식별과정을 통해 데이터 전처리를 실시하였다. 이후 데이터 탐색을 통해 결측치 처리, 이상 데이터 처리 및 피처 엔지니어링의 바이닝을 통해 앞서 언급한 독립변수 및 종속변수를 범주형으로 분류하였다. 의사결정 나무는 C50 알고리즘을 이용하였으며, 모델 적합성 비교를 위해 검증용(validation) 데이터로 ROC 지수를 산출하였다. 의사결정 나무 분석을 통해 독립변수와 종속변수 간의 관계뿐 아니라 독립변수들 간의 복합적인 연관 관계를 탐색하였고, 다양한 변수를 활용하여 확인하였다23). 이에 대한 통계적 분석은 R program version 3.5.3을 이용하였다.

연구 성적

1. 일반적 특성에 따른 잔존 치아 수

일반적 특성에 따른 치아 수는 Table 1과 같다. 잔존 치아의 수 0-15개의 집단에서 남성보다 여성이, 연령이 증가할수록, 가구소득 수준과 학력이 낮을수록 빈도가 높게 나타났다(P<0.001). 또한 당뇨병이 없는 집단이 77.4%로 높았다(P<0.001). BMI가 정상과 비만일 때 36.2%로 동일하게 높게 나타났다(P<0.001). 흡연과 음주를 하지 않는 집단에서 각각 80.7% (P=0.198), 62.9% (P<0.001)로 높았다. 하루 칫솔질 횟수가 2회에서 44.3%로 높게 나타났으며(P<0.001), 치주염이 없는 군에서 높게 나타났다(P<0.001).

2. 잔존 치아 수 영향요인에 대한 의사결정나무 모형

모형의 검증력은 ROC 곡선을 활용하였으며, ROC 곡선의 아래의 면적(AUC: area under the ROC curve) 값이 0.9-1.0일 때 매우 정확한 모형으로 판단한다. 본 연구의 의사결정나무 모형의 AUC 값은 0.70으로 비교적 양호한 것으로 판단된다. 잔존치아에 영향을 미치는 요인에 대한 의사결정 나무 모형 결과는 Fig. 2와 같다. 잔존치아 수에 영향을 미치는 가장 중요한 요인은 연령집단으로 나타났다. 그 다음 소득수준, 흡연여부, 치주염 여부, 교육수준, BMI 및 성별 순으로 나타났다. 특히 연령은 20-50대일 경우 잔존치아가 21-28개로 예측되었으며, 60세 이상일 경우 가구소득이 치아 수 0-15개에 영향을 미치는 것을 예측되었다. 그 중 가구소득 ‘상, 중’에 해당할 경우 흡연 여부가 치아 수에 영향을 미쳤으며, ‘하’에 해당할 경우 치주염 여부가 치아 수에 영향을 미쳤다. 또한 가구소득이 ‘하’에 속하는 집단에서는 치주염이 있을 경우, 교육수준이 치아 수에 영향을 미쳤으며, 치주질환이 없을 경우 BMI 수준에 따라 영향을 미쳤다.

고 안

본 연구는 대표성이 있는 제7기 국민건강영양조사(Korea National Health and Nutrition Examination Survey, KNHANES) 데이터를 바탕으로 머신러닝 기법 중 의사결정나무 분석모형을 활용하여 잔존 치아에 영향을 미치는 요인을 파악하고자 시도하였다. 본 연구에서 제 7기(2016-2018)자료를 분석한 이유는 제 8기(2019-2021)의 구강검사 영역의 자료에 대한 공개 방안 연구수행, 전문가 의견을 반영하여 원자료가 비공개됨에 따라 제7기 자료를 활용하였다.
의사결정 나무 분석은 각 데이터 내에 존재하는 관계 및 규칙을 탐색하여 나뭇가지 모양의 도형으로 시각화하여 분류모형을 제공한다. 이렇게 다양한 데이터의 기준으로 새로운 패턴, 관계 및 규칙 등을 찾아내어 모형화하기 때문에, 정보를 추출하는데 유용한 분석 방법으로 거론되고 있다24).
치아 상실을 일으키는 우리나라 중대 구강질환은 치주질환과 치아우식증으로 세균성 요인에 의해 발생하는 것 뿐만 아니라 영양소 섭취, 흡연 및 전신질환 등의 위험요인에 따라서 유발될 수 있어 다각적인 접근이 필요하다25,26). 이렇게 치아 상실을 일으키는 요인은 구강 내·외 요인으로 매우 다양하다. 그러나 본 연구에서는 일반적이며 활용성이 높은 예측을 수행하고자 치아 상실과 관련된 요인들 중 인구사회학적 요인을 중심으로 분석하였다. 머신러닝을 기반으로 한 고혈압 예측모델 연구에서는 신체계측 요인을 이용한 예측모델은 나이, 성별, 인종, 국가 및 지역 등에 따라 다르게 나타나는 경향과 침습적 방식, 변수 측정에서의 시간 소모 등을 지적하였다27). 따라서 본 연구에서도 인구사회학적 요인을 우선적으로 분석하고자 하였다. 또한 우리가 아는 한 잔존 치아 수의 요인을 분석한 의사결정 나무 분석 연구는 현재까지 발표되지 않았으며, 본 연구를 기반으로 향후 다양한 변수를 활용한 발전된 연구가 이루어질 것으로 예상한다.
본 연구의 의사결정 나무 분석 결과, 잔존치아에 영향을 미치는 가장 중요한 결정요인은 연령으로 나타났다. 20-50대에는 21-28개의 잔존치아 수를 예측했으며, 60세 이상 연령에서는 0-15개의 잔존치아 수를 예측하였다. 잔존치아 수에 가장 중요한 요인이 연령으로 나타난 것은 기존 선행연구들의 근거를 바탕으로 동일한 결과로 보인다28). Green과 Suomi 등28)의 연구에 따르면, 연령이 증가할수록 치조골 소실의 빈도와 치주변화의 심도는 증가하며, 연령이 증가할수록 구강은 여러 위험요인들에 노출될 확률이 높아지므로, 치아 상실률에도 영향을 미친다고 보고하였다29). 이에 연령별 잔존 치아 수 관리를 위해 구체적 방안 및 체계를 확립하는 것이 필요하다.
또한 가구수준, 흡연여부, 치주질환, 교육수준, BMI 및 성별 순으로 잔존치아 수에 영향을 미치는 요인으로 나타났다. 본 연구와 선행연구의 통계적 분석에 대한 차이가 있지만5-7,30) 선행연구에서도 가구소득 수준은 치아우식증, 치주질환, 치아 소실에 영향을 미친다고 보고하였으며30), 교육수준6), 흡연여부7), 성별8)이 치아 수와 관련이 있다는 점에서 본 연구결과와 일치하였다. 하지만 잔존치아 수에 우선적으로 영향을 미치는 연구들은 부족하기 때문에 후속연구가 필요할 것으로 보인다.
본 연구에서 적용한 의사결정나무 분석 방법은 기존의 로지스틱 회귀분석과는 달리 잔존 치아 수에 영향을 미치는 여러 요인들 중 우선적으로 영향을 미치는 요인에 대한 순위를 파악할 수 있었다.
그러나 본 연구는 한국 성인의 잔존치아 수의 결정요인을 파악하는데 있어 다음과 같은 한계점이 있었다. 첫째, 본 연구에서 사용한 잔존치아 수는 실제 잔존 치아 수와 차이가 있을 수 있다. 둘째, 의사결정 나무 분석의 한계점인 연속형 변수 값의 측정은 어려워 변수를 지나치게 명목형 척도로 구성하였다. 따라서 변수가 지닌 정보를 활용하기 위한 추가적인 분석이 어려워 상세한 예측에 한계가 있다. 셋째, 본 연구에서 치주염으로 분류한 CPI 검사는 평생 누적된 치주부착 실패율을 추정할 수 있는 부착소실을 평가하지 않았다. 넷째, 본 연구에서는 잔존치아 수에 영향을 미치는 새로운 변수를 찾아내려는 기존 연구들과 달리 이미 확인된 요인을 활용하여 ‘연령’ 요인이 가장 영향을 미친다고 제시하였다. 이는 이미 학술적으로 밝혀져 있으며 이에 연령을 제외한 다른 요인들을 활용한 추가적인 연구가 필요하다.
이러한 한계점에도 불구하고, 본 연구는 잔존치아 수에 영향을 미치는 결정요인에 관한 선행연구에 비해 발전된 분석방법을 활용하였으며 보다 세밀하게 확인할 수 있었다. 본 연구를 통해 치과의료 분야에서도 기계학습 및 데이터 마이닝 분석을 보다 널리 활용할 수 있도록 다양한 접근을 해보고자 하였다.

결 론

본 연구는 제7기(2016-2018) 국민건강영양조사 원시 자료를 이용하여 성인의 잔존 치아 수에 영향을 미치는 요인을 파악하고자 의사결정 나무 분석을 실시하였다. 주요결과는 다음과 같다.
1. 일반적 특성에 따른 잔존 치아 수를 분석한 결과 잔존 치아의 수가 0-15개 남아있는 집단에서 남성보다 여성, 연령의 증가, 낮은 가구소득과 학력에서 빈도가 높게 나타났으며, 당뇨병이 없는 집단, BMI의 정상과 비만, 비음주 그리고 하루 칫솔질 횟수가 2회, 치주염이 없는 군에서 높게 나타났다(P<0.001).
2. 잔존 치아 수에 영향을 미치는 가장 주된 요인은 연령으로 나타났으며, 소득수준, 흡연여부, 치주질환, 교육수준, BMI 및 성별 순으로 영향을 미치는 것으로 확인되었다.
이상의 결과를 통해 본 연구는 선행연구들을 통해 보고된 요인을 바탕으로 머신러닝 기반의 의사결정 나무 분석을 확인했다는 점에 의의가 있다.

References

1. Castrejón-Pérez RC, Borges-Yáñez SA, Gutiérrez-Robledo LM, Ávila-Funes JA. 2012; Oral health conditions and frailty in Mexican community-dwelling elderly: a cross sectional analysis. BMC Public Health. 12:773. https://doi.org/10.1186/1471-2458-12-773. DOI: 10.1186/1471-2458-12-773. PMID: 22971075. PMCID: PMC3490998. PMID: 0a8becb6688149a3934a7650929e8a13.
crossref
2. Lee GR, Yoo WK. 2010; A study on denture satisfaction in rural elderly people. J Agric Med Community Health. 35:56–66. https://doi.org/10.5393/JAMCH.2010.35.1.056. DOI: 10.5393/JAMCH.2010.35.1.056.
crossref
3. Petersen PE, Kandelman D, Arpin S, Ogawa H. 2010; Global oral health of older people-call for public health action. Community Dent Health. 27:257–267. PMID: 21313969.
4. Petersen PE, Yamamoto T. 2005; Improving the oral health of older people: the approach of the WHO Global Oral Health Programme. Community Dent Oral Epidemiol. 33:81–92. https://doi.org/10.1111/j.1600-0528.2004.00219.x. DOI: 10.1111/j.1600-0528.2004.00219.x. PMID: 15725170.
crossref
5. Kim YH, Han K, Vu D, Cho KH, Lee SH. 2018; Number of remaining teeth and its association with socioeconomic status in South Korean adults: data from the Korean national health and nutrition examination survey 2012-2013. PLoS One. 13:e0196594. https://doi.org/10.1371/journal.pone.0196594. DOI: 10.1371/journal.pone.0196594. PMID: 29746489. PMCID: PMC5945020. PMID: a5b8970ece3945dfbbdc33657bafbc6e.
crossref
6. Jung SH, Ryu JI, Jung DB. 2011; Association of total tooth loss with socio-behavioural health indicators in Korean elderly. J Oral Rehabil. 38:517–524. https://doi.org/10.1111/j.1365-2842.2010.02178.x. DOI: 10.1111/j.1365-2842.2010.02178.x. PMID: 21118289.
crossref
7. Kim HN, Ha TG, Kim MJ, Jun EJ, Jeong SH, Kim JB. 2016; Factors related to number of present teeth in Korean elderly adults aged 55-84 years. Int J Dent Hyg. 14:151–158. https://doi.org/10.1111/idh.12151. DOI: 10.1111/idh.12151. PMID: 26074207.
crossref
8. Avlund K, Schultz-Larsen K, Christiansen N, Holm-Pedersen P. 2011; Number of teeth and fatigue in older adults. J Am Geriatr Soc. 59:1459–1464. 03502.x. DOI: 10.1111/j.1532-5415.2011.03502.x. PMID: 21797832.
crossref
9. Goodman AH, Pelto GH, Allen LH, Chavez A. 1992; Socioeconomic and Anthropometric Correlates of Linear Enamel Hypoplasia Children from Solis, Mexic. Int J Paleopathol. 2:373–380.
10. Jimenez M, Dietrich T, Shih MC, Li Y, Joshipura KJ. 2009; Racial/ethnic variations in associations between socioeconomic factors and tooth loss. Community Dent Oral Epidemiol. 37:267–275. https://doi.org/10.1111/j.1600-0528.2009.00466.x. DOI: 10.1111/j.1600-0528.2009.00466.x. PMID: 19302573. PMCID: PMC2758161.
crossref
11. Aida J, Ando Y, Akhter R, Aoyama H, Masui M, Morita M. 2006; Reasons for permanent tooth extractions in Japan. J Epidemiol. 16:214–219. https://doi.org/10.2188/jea.16.214. DOI: 10.2188/jea.16.214. PMID: 16951541. PMCID: PMC7683702.
crossref
12. Lee CH, Lee SK, Chang KY. 2002; The profile of age for the tooth extraction in permanent teeth of Koreans. J Korean Acad Dent Health. 26:209–218.
13. Lim KJ, Han KY. 1990; A study on the rate of each tooth Loss due to periodontal disease during surgical periodontal treatment. J Periodontal Implant Sci. 20:413–426.
14. Han MH. 2022; Identification of high-risk group for obesity in the elderly: Decision tree analysis. Journal of the Korean Data and Information Science Society. 33:629–643. DOI: 10.7465/jkdi.2022.33.4.629.
crossref
15. Kim HS, Jeong SH, Park SK. 2019; Decision-Tree Analysis to Predict Blood Pressure Control Status Among Hypertension Patients Taking Antihypertensive Medications. J Korean Biol Nurs Sci. 21:85–97. DOI: 10.7586/jkbns.2019.21.1.85.
crossref
16. Lee KJ, Lee HY, Oh KJ. 2015; Using fuzzy-neural network to predict hedge fund survival. J Korean Data and Information Science Society. 26:1189–1198. https://doi.org/10.7465/jkdi.2015.26.6.1189. DOI: 10.7465/jkdi.2015.26.6.1189.
crossref
17. Yoo SH, Park IS, Kim YM. 2018; A decision-tree analysis of influential factors and reasons for unmet dental care in Korean adults. Health and Social Welfare Review. 37:294–335. https://doi.org/10.15709/hswr.2017.37.4.294. DOI: 10.15709/hswr.2017.37.4.294.
crossref
18. World Health Organization(WHO). 2006 Definition and diagnosis of diabetes mellitus and intermediate hyperglycemia: report of a WHO/IDF consultation. [Internet]. Available from: https://apps.who.int/iris/handle/10665/43588?search-result=true&query=Definition+and+diagnosis+of+diabetes+mellitus&scope=&rpp=10&sort_by=score&order=desc. Cited 2023 March 13.
19. Park SW, Kim BG, Kim JW, Park JW, Kim JI. 2018; A cross-sectional study on the pulmonary function of residents in two urban areas with different PM 10 concentrations: Data from the fourth Korea national health and nutrition examination survey (KNHANES) 2007-2009. Ann Occup Environ Med. 30:1–12. https://doi.org/10.1186/s40557-018-0258-4. DOI: 10.1186/s40557-018-0258-4. PMID: 30026954. PMCID: PMC6048902. PMID: 79ff9ae22b6b4d648bfc1bc7718d2de6.
crossref
20. Kim SO, Bae EM, Lee YN, Son JS. 2021; Association between consumption of sugar-sweetened beverages and risk of cardiovascular disease in Korean men: Analysis Based on the Korea National Health and Nutrition Examination Survey 2014-2016. Korean J Fam Med. 42:212–218. https://doi.org/10.4082/kjfm.20.0114. DOI: 10.4082/kjfm.20.0114. PMID: 34038989. PMCID: PMC8164932.
crossref
21. World Health Organization(WHO). Oral health surveys: basic methods. 4th ed. [Internet]. Available from: https://apps.who.int/iris/handle/10665/41905. Cited 2023 March 13.
22. Park HE, Song HY, Han K, Cho KH, Kim YH. 2019; Number of remaining teeth and health-related quality of life: The Korean National Health and Nutrition Examination Survey 2010-2012. Health Qual Life Outcomes. 17:1–10. https://doi.org/10.1186/s12955-019-1078-0. DOI: 10.1186/s12955-019-1078-0. PMID: 30626402. PMCID: PMC6327472. PMID: 977974d998a04977a5cc89f7af8d5a0f.
crossref
23. Lee JH, Kim GY, Choi KH. 2020; The Relationship between Childbirth, Housing and Socio-Economic Factors: The Pattern Analysis using Decision Tree. Digital Contents Society. 21:327–336. https://doi.org/10.9728/dcs.2020.21.2.327. DOI: 10.9728/dcs.2020.21.2.327.
crossref
24. Jin HJ. 2010; Analysis for consumer groups using decision tree model: focused on tangerine consumption. The Korean Journal of Agricultural Economics. 50:19–40.
25. Hancock S, Zinn C, Schofield G. 2020; The consumption of processed sugar- and starch-containing foods, and dental caries: a systematic review. Eur J Oral Sci. 128:467–475. https://doi.org/10.1111/eos.12743. DOI: 10.1111/eos.12743. PMID: 33156952.
crossref
26. Nazir MA. 2017; Prevalence of periodontal disease, its association with systemic diseases and prevention. Int J Health Sci. 11:72–80.
27. Lee BJ. 2021; Prediction Model of Hypertension Using Sociodemographic Characteristics Based on Machine Learning. KIPS Trans Softw and Data Eng. 10:541–546. https://doi.org/10.3745/KTSD2E.2021.10.11.541.
crossref
28. Greene JC, Suomi JD. 1977; Epidemiology and public health aspects of caries and periodontal disease. J Dent Res. 56(3_suppl):20–26. https://doi.org/10.1177/002203457705600312011. DOI: 10.1177/002203457705600312011. PMID: 416057.
crossref
29. Papapanou PN, Lindhe J, Sterrett JD, Eneroth L. 1991; Considerations on the contribution of ageing to loss of periodontal tissue support. J Clin Periodontol. 18:611–615. https://doi.org/10.1111/j.1600-051x.1991.tb00098.x. DOI: 10.1111/j.1600-051X.1991.tb00098.x. PMID: 1795058.
crossref
30. Lopez B, Pardinas AF, Garcia-Vazquez E, Dopico E. 2012; Socio-cultural factors in dental diseases in the Medieval and early Modern Age of northern Spain. Homo. 63:21–42. https://doi.org/10.1016/j.jchb.2011.12.001. DOI: 10.1016/j.jchb.2011.12.001. PMID: 22265008.
crossref

Fig. 1
Flow chart of data analysis.
jkaoh-47-1-26-f1.tif
Fig. 2
Results of decision tree analysis on influencing factor on the number of teeth.
jkaoh-47-1-26-f2.tif
Table 1
Characteristics of the study population stratified by number of teeth
Characteristics Number of teeth P-value**
0-15 16-20 21-28
N (%)* N (%)* N (%)*
Sex (n=13,199)
Man 774 (47.6) 341 (44.8) 4,678 (41.5) <0.001
Woman 858 (52.4) 414 (55.2) 6,134 (58.5)
Age (n=13,199)
19-29 1 (0.0) 2 (0.2) 1,559 (15.1) <0.001
30-39 4 (0.3) 11 (1.6) 2,087 (18.7)
40-49 19 (1.2) 32 (4.0) 2,368 (21.1)
50-59 126 (8.2) 145 (20.2) 2,222 (21.6)
≥60 1,482 (90.4) 565 (74.0) 2,576 (23.6)
House income (n=13,161)
Lower 872 (51.9) 285 (35.9) 1,484 (13.8) <0.001
Median 628 (39.9) 349 (47.9) 5,834 (53.4)
Upper 122 (8.1) 120 (16.2) 3,467 (32.9)
Education (n=12,566)
Primary school 936 (60.4) 326 (43.0) 1,367 (12.9) <0.001
Middle school 217 (15.0) 121 (17.2) 895 (8.8)
High school 253 (18.1) 167 (25.9) 3,608 (35.3)
College 96 (6.5) 91 (13.9) 4,489 (43.0)
Diabetes (n=13,199)
Absence 1,242 (77.4) 609 (81.6) 10,042 (93.1) <0.001
Presence 390 (22.6) 146 (18.4) 770 (6.9)
Body mass index (n=12,880)
Underweight 60 (4.2) 19 (2.4) 421 (4.0) <0.001
Normal 558 (36.2) 202 (28.2) 4,161 (40.2)
Overweight 387 (23.5) 214 (28.9) 2,299 (21.9)
Obesity 565 (36.2) 297 (40.5) 3,697 (33.9)
Smoking (n=13,061)
Non-smoker 1,300 (80.7) 619 (83.3) 8,795 (82.7) 0.198
Smoker 292 (19.3) 121 (16.7) 1,934 (17.3)
Alcohol drinking (n=13,069)
Non-drinker 1,015 (62.9) 409 (54.7) 4,658 (43.6) <0.001
Drinker 579 (37.1) 333 (45.3) 6,075 (56.4)
Tooth brushing/day (n=12,759)
≤1 325 (23.0) 89 (10.6) 778 (6.8) <0.001
2 619 (44.3) 313 (42.4) 4,067 (38.1)
≥3 455 (32.8) 316 (47.1) 5,797 (55.0)
Periodontitis (n=12,689)
No 894 (53.3) 3,469 (62.9) 4,345 (81.0) <0.001
Yes 781 (46.7) 2,123 (37.1) 1,077 (19.0)

*Weighted %; **P-value was calculated by complex sample chi-square test.

TOOLS
Similar articles