Skip Navigation
Skip to contents

Ann Occup Environ Med : Annals of Occupational and Environmental Medicine

OPEN ACCESS
SEARCH
Search

Author index

Page Path
HOME > Browse articles > Author index
Search
Juho Sim 2 Articles
Occupation classification model based on DistilKoBERT: using the 5th and 6th Korean Working Condition Surveys
Tae-Yeon Kim, Seong-Uk Baek, Myeong-Hun Lim, Byungyoon Yun, Domyung Paek, Kyung Ehi Zoh, Kanwoo Youn, Yun Keun Lee, Yangho Kim, Jungwon Kim, Eunsuk Choi, Mo-Yeol Kang, YoonHo Cho, Kyung-Eun Lee, Juho Sim, Juyeon Oh, Heejoo Park, Jian Lee, Jong-Uk Won, Yu-Min Lee, Jin-Ha Yoon
Ann Occup Environ Med 2024;36:e19.   Published online August 6, 2024
DOI: https://doi.org/10.35371/aoem.2024.36.e19
AbstractAbstract AbstractAbstract in Korean PDFSupplementary MaterialPubReaderePub
Background

Accurate occupation classification is essential in various fields, including policy development and epidemiological studies. This study aims to develop an occupation classification model based on DistilKoBERT.

Methods

This study used data from the 5th and 6th Korean Working Conditions Surveys conducted in 2017 and 2020, respectively. A total of 99,665 survey participants, who were nationally representative of Korean workers, were included. We used natural language responses regarding their job responsibilities and occupational codes based on the Korean Standard Classification of Occupations (7th version, 3-digit codes). The dataset was randomly split into training and test datasets in a ratio of 7:3. The occupation classification model based on DistilKoBERT was fine-tuned using the training dataset, and the model was evaluated using the test dataset. The accuracy, precision, recall, and F1 score were calculated as evaluation metrics.

Results

The final model, which classified 28,996 survey participants in the test dataset into 142 occupational codes, exhibited an accuracy of 84.44%. For the evaluation metrics, the precision, recall, and F1 score of the model, calculated by weighting based on the sample size, were 0.83, 0.84, and 0.83, respectively. The model demonstrated high precision in the classification of service and sales workers yet exhibited low precision in the classification of managers. In addition, it displayed high precision in classifying occupations prominently represented in the training dataset.

Conclusions

This study developed an occupation classification system based on DistilKoBERT, which demonstrated reasonable performance. Despite further efforts to enhance the classification accuracy, this automated occupation classification model holds promise for advancing epidemiological studies in the fields of occupational safety and health.

DistilKOBERT를 기반으로 한 직업 분류 모델 개발: 제5차, 6차 한국근로실태조사를 이용하여
목적
정확한 직업분류는 정책 개발 및 역학 연구를 포함한 다양한 분야에서 중요하다. 본 연구는 자연어처리모델인 DistilKoBERT를 기반으로 한 직업 분류 모델을 개발하는 것을 목표로 한다.
방법
본 연구는 2017년과 2020년에 실시된 제5차와 제6차 근로환경조사 (KWCS)의 데이터를 활용하였다. 대한민국 근로자를 국가적으로 대표하는 총 99,665명의 참가자가 포함되었고, 직무 내용과 관련된 자연어 응답과 그에 맞는 대한민국 표준직업 분류코드(7차 개정, 3자리 코드)를 연구에 사용하였다. 데이터셋은 7:3의 비율로 훈련 및 테스트 데이터셋으로 무작위로 분할되었고, 사전 학습된 DistilKoBERT을 훈련 데이터셋을 통해 파인튜닝하여 모델을 학습시키고, 테스트 데이터셋을 사용하여 그 기능을 평가하였다. 정확도, 정밀도, 재현율 및 F1 점수가 평가 지표로 계산되었다.
결과
테스트 데이터셋의 28,996명의 참가자를 142개의 직업 코드로 분류한 최종 모델은 84.44%의 정확도를 보였다. 샘플 크기를 기준으로 가중치를 적용하여 계산한 모델의 정밀도, 재현율 및 F1 점수는 각각 0.83, 0.84 및 0.83 이었다. 최종 모델은 서비스, 판매 종사자 그룹에서 높은 정밀도를 보여주었지만 관리자 그룹에서는 낮은 정밀도를 보였다. 또한 훈련 데이터셋에서 표본의 수가 많았던 직업에서 대체로 높은 정밀도를 보였다.
결론
본 연구는 DistilKoBERT를 기반으로 합리적인 성능을 보이는 직업 분류 모델을 개발하였다. 분류의 정확성을 향상시키기 위한 추가적인 노력이 필요하지만, 자동화된 직업 분류 모델은 직업 안전 및 보건 분야의 유행병 연구를 발전시키는 데 기여할 것이라 기대된다.
  • 211 View
  • 17 Download
Close layer
Association between exposure to violence, job stress and depressive symptoms among gig economy workers in Korea
Min-Seok Kim, Juyeon Oh, Juho Sim, Byung-Yoon Yun, Jin-Ha Yoon
Ann Occup Environ Med 2023;35:e43.   Published online October 30, 2023
DOI: https://doi.org/10.35371/aoem.2023.35.e43
AbstractAbstract AbstractAbstract in Korean PDFPubReaderePub
Background

Gig workers, also known as platform workers, are independent workers who are not employed by any particular company. The number of gig economy workers has rapidly increased worldwide in the past decade. There is a dearth of occupational health studies among gig economy workers. We aimed to investigate the association between exposure to violence and job stress in gig economy workers and depressive symptoms.

Methods

A total of 955 individuals (521 gig workers and 434 general workers) participated in this study and variables were measured through self-report questionnaires. Depressive symptoms were evaluated by the Patient Health Questionnaire-9 when the score was greater than or equal to 10 points. The odds ratio with 95% confidence interval was calculated using multivariable logistic regression adjusted for age, sex, working hours, education level, exposure to violence and job stress.

Results

19% of gig economy workers reported depressive symptoms, while only 11% of general workers reported the depressive symptoms. In association to depressive symptoms among gig economy workers, the mainly result of odds ratios for depressive symptoms were as follows: 1.81 for workers type, 3.53 for humiliating treatment, 2.65 for sexual harassment, 3.55 for less than three meals per day, 3.69 for feeling too tired to do housework after leaving work.

Conclusions

Gig economic workers are exposed to violence and job stress in the workplace more than general workers, and the proportion of workers reporting depressive symptoms is also high. These factors are associated to depressive symptoms. Furthermore, the gig workers associated between depressive symptoms and exposure to violence, job stress.

한국 긱경제 근로자에서 폭력 및 직무 스트레스 노출과 우울 증상관의 연관성
목적
긱경제 근로자 또는 플랫폼 근로자는 특정 회사에 고용되지 않은 독립적인 근로자들을 말한다. 긱경제는 그 규모가 커지고 있고, 종사하는 근로자들도 많아지고 있으나, 긱경제 노동자들의 산업 보건 연구가 부족한 실정이다. 우리는 긱경제 근로자에서 폭력 노출과 직무 스트레스에 노출되는 것이 우울 증상과 연관성이 있는지 조사하는 것을 목표로 했다.
방법
총 955명(긱 근로자 521명, 일반 근로자 434명)이 본 연구에 참여하였으며, 우울 증상은 PHQ-9(Patient Health Questionnaire-9) 점수가 10점 이상일 때로 평가하였다. 폭력 노출과 직무 스트레스는 자기보고식 설문지를 이용하여 측정하였다. 연령, 성별, 근무시간, 교육수준을 보정한 다변량 로지스틱 회귀분석을 이용하여 Odds Ratio, 95% Confidence Interval를 산출했다.
결과
긱 근로자의 19%가 우울 증상을 보고한 반면, 일반 근로자의 11%만이 우울 증상을 보고했습니다. 긱경제 근로자의 우울상과 관련하여 우울상 Odds ratio의 주요 결과는표3에서 ‘긱경제 근로자’ 1.89, ‘굴욕적 처우 경험’ 3.53, ‘성희롱 경험’ 2.65, ‘하루 세 끼 미만의 식사’ 3.55, ‘퇴근 후 집안일을 하기엔 너무 피곤함’ 3.69로 나타났다.
결론
긱경제 근로자는 일반 근로자에 비해 직장 내 폭력과 직무스트레스에 더 많이 노출되고, 우울 증상을 호소하는 근로자의 비율도 높다. 이러한 요인은 우울 증상과 관련이 있다. 더욱이, 긱경제 근로자들은 우울 증상과 폭력 노출, 직업 스트레스와 관련이 있다.

Citations

Citations to this article as recorded by  
  • Higher anxiety level and associated work-related factors of delivery workers in South Korea: from the 6th Korean working conditions survey
    Sungjin Park, June-Hee Lee
    International Archives of Occupational and Environmental Health.2024;[Epub]     CrossRef
  • Association between precarious employment and the onset of depressive symptoms in men and women: a 13-year longitudinal analysis in Korea (2009–2022)
    Seong-Uk Baek, Jong-Uk Won, Yu-Min Lee, Jin-Ha Yoon
    Epidemiology and Psychiatric Sciences.2024;[Epub]     CrossRef
  • 128 View
  • 1 Download
  • 2 Web of Science
  • 2 Crossref
Close layer

Ann Occup Environ Med : Annals of Occupational and Environmental Medicine
Close layer
TOP