Skip Navigation
Skip to contents

Ann Occup Environ Med : Annals of Occupational and Environmental Medicine

OPEN ACCESS
SEARCH
Search

Search

Page Path
HOME > Search
2 "Kyung-Eun Lee"
Filter
Filter
Article category
Keywords
Publication year
Authors
Original Article
Occupation classification model based on DistilKoBERT: using the 5th and 6th Korean Working Condition Surveys
Tae-Yeon Kim, Seong-Uk Baek, Myeong-Hun Lim, Byungyoon Yun, Domyung Paek, Kyung Ehi Zoh, Kanwoo Youn, Yun Keun Lee, Yangho Kim, Jungwon Kim, Eunsuk Choi, Mo-Yeol Kang, YoonHo Cho, Kyung-Eun Lee, Juho Sim, Juyeon Oh, Heejoo Park, Jian Lee, Jong-Uk Won, Yu-Min Lee, Jin-Ha Yoon
Ann Occup Environ Med 2024;36:e19.   Published online August 6, 2024
DOI: https://doi.org/10.35371/aoem.2024.36.e19
AbstractAbstract AbstractAbstract in Korean PDFSupplementary MaterialPubReaderePub
Background

Accurate occupation classification is essential in various fields, including policy development and epidemiological studies. This study aims to develop an occupation classification model based on DistilKoBERT.

Methods

This study used data from the 5th and 6th Korean Working Conditions Surveys conducted in 2017 and 2020, respectively. A total of 99,665 survey participants, who were nationally representative of Korean workers, were included. We used natural language responses regarding their job responsibilities and occupational codes based on the Korean Standard Classification of Occupations (7th version, 3-digit codes). The dataset was randomly split into training and test datasets in a ratio of 7:3. The occupation classification model based on DistilKoBERT was fine-tuned using the training dataset, and the model was evaluated using the test dataset. The accuracy, precision, recall, and F1 score were calculated as evaluation metrics.

Results

The final model, which classified 28,996 survey participants in the test dataset into 142 occupational codes, exhibited an accuracy of 84.44%. For the evaluation metrics, the precision, recall, and F1 score of the model, calculated by weighting based on the sample size, were 0.83, 0.84, and 0.83, respectively. The model demonstrated high precision in the classification of service and sales workers yet exhibited low precision in the classification of managers. In addition, it displayed high precision in classifying occupations prominently represented in the training dataset.

Conclusions

This study developed an occupation classification system based on DistilKoBERT, which demonstrated reasonable performance. Despite further efforts to enhance the classification accuracy, this automated occupation classification model holds promise for advancing epidemiological studies in the fields of occupational safety and health.

DistilKOBERT를 기반으로 한 직업 분류 모델 개발: 제5차, 6차 한국근로실태조사를 이용하여
목적
정확한 직업분류는 정책 개발 및 역학 연구를 포함한 다양한 분야에서 중요하다. 본 연구는 자연어처리모델인 DistilKoBERT를 기반으로 한 직업 분류 모델을 개발하는 것을 목표로 한다.
방법
본 연구는 2017년과 2020년에 실시된 제5차와 제6차 근로환경조사 (KWCS)의 데이터를 활용하였다. 대한민국 근로자를 국가적으로 대표하는 총 99,665명의 참가자가 포함되었고, 직무 내용과 관련된 자연어 응답과 그에 맞는 대한민국 표준직업 분류코드(7차 개정, 3자리 코드)를 연구에 사용하였다. 데이터셋은 7:3의 비율로 훈련 및 테스트 데이터셋으로 무작위로 분할되었고, 사전 학습된 DistilKoBERT을 훈련 데이터셋을 통해 파인튜닝하여 모델을 학습시키고, 테스트 데이터셋을 사용하여 그 기능을 평가하였다. 정확도, 정밀도, 재현율 및 F1 점수가 평가 지표로 계산되었다.
결과
테스트 데이터셋의 28,996명의 참가자를 142개의 직업 코드로 분류한 최종 모델은 84.44%의 정확도를 보였다. 샘플 크기를 기준으로 가중치를 적용하여 계산한 모델의 정밀도, 재현율 및 F1 점수는 각각 0.83, 0.84 및 0.83 이었다. 최종 모델은 서비스, 판매 종사자 그룹에서 높은 정밀도를 보여주었지만 관리자 그룹에서는 낮은 정밀도를 보였다. 또한 훈련 데이터셋에서 표본의 수가 많았던 직업에서 대체로 높은 정밀도를 보였다.
결론
본 연구는 DistilKoBERT를 기반으로 합리적인 성능을 보이는 직업 분류 모델을 개발하였다. 분류의 정확성을 향상시키기 위한 추가적인 노력이 필요하지만, 자동화된 직업 분류 모델은 직업 안전 및 보건 분야의 유행병 연구를 발전시키는 데 기여할 것이라 기대된다.
  • 221 View
  • 18 Download
Close layer
Case Report
Assessment of risks for breast cancer in a flight attendant exposed to night shift work and cosmic ionizing radiation: a case report
Dong Joon Park, Sungkyun Park, Seong Won Ma, Hoekyeong Seo, Sang Gil Lee, Kyung-Eun Lee
Ann Occup Environ Med 2022;34:e5.   Published online March 22, 2022
DOI: https://doi.org/10.35371/aoem.2022.34.e5
AbstractAbstract AbstractAbstract in Korean PDFSupplementary MaterialPubReaderePub
Background

Some epidemiological studies have estimated exposure among flight attendants with and without breast cancer. However, it is difficult to find a quantitative evaluation of occupational exposure factors related to cancer development individually in the case of breast cancer in flight attendants. That is, most, if not all, epidemiological studies of breast cancer in flight attendants with quantitative exposure estimates have estimated exposure in the absence of individual flight history data.

Case presentation

A 41-year-old woman visited the hospital due to a left breast mass after a regular check-up. Breast cancer was suspected on ultrasonography. Following core biopsy, she underwent various imaging modalities. She was diagnosed invasive ductal carcinoma of no special type (estrogen receptor positive in 90%, progesterone receptor positive in 3%, human epidermal growth factor receptor 2/neu equivocal) with histologic grade 3 and nuclear grade 3 in the left breast. Neoadjuvant chemotherapy was administered to reduce the tumor size before surgery. However, due to serious chemotherapy side effects, the patient opted for alternative and integrative therapies. She joined the airline in January, 1996. Out of all flights, international flights and night flights accounted for 94.9% and 26.2, respectively. Night flights were conducted at least four times per month. Moreover, based on the virtual computer program CARI-6M, the estimated dose of cosmic radiation exposure was 78.81 mSv. There were no other personal triggers or family history of breast cancer.

Conclusions

This case report shows that the potentially causal relationship between occupational harmful factors and the incidence of breast cancer may become more pronounced when night shift workers who work continuously are exposed to cosmic ionizing radiation. Therefore, close attention and efforts are needed to adjust night shift work schedules and regulate cosmic ionizing radiation exposure.

국제항공 승무원에서 발생한 유방암 사례와 업무관련성 평가
배경
유방암은 여성에게 가장 흔하게 진단되는 암으로, 전리방사선과 야간교대근무와 같은 직업환경적 위험을 포함한 다양한 요인에 의해 영향을 받는다. 항공승무원은 우주 전리 방사사선과 야간교대근무 환경에 노출되는 대표적인 직업군으로 일반인구집단 대비 유방암의 발병 위험이 높다고 몇몇 역학연구에서는 보고되고 있다. 그러나 항공승무원의 유방암 사례에서 암 발병과 관련된 직업적 노출요인에 대하여 정량적으로 평가한 사례는 찾기 어렵다. 본 연구에서는 질환발병의 업무관련성을 인정받은 항공승무원 종사자의 유방암 사례에서 질환 발병과 관련된 직업적 요인들의 노출 수준을 정량적인 평가하였다.
증례
41세의 여성 환자는 항공승무원 재직 중 정기건강검진에서 우연히 발견된 좌측 유방종괴를 주소로 병원에 내원하였다. 초음파 검사 및 조직생검 등의 검사결과 유방의 침습암종(조직 및 핵분화도 3기), 을 진단 받았다. 환자는 유방 보존술을 위한 선행화학요법 시행 중에 부작용이 발생하여 수술적 치료를 시행하지 못하고 보존적 치료를 유지중이다. 환자는 1996년 1월 항공사에 입사하여, 20년 2개월간 항공승무원으로 종사하였다. 총 비행기 탑승 이력 중 94.9%는 국제선에 탑승하였고 총 비행시간의 26.2%는 야간 비행으로 한 달에 네 번 이상 야간 비행업무를 수행하였다. 컴퓨터 시뮬레이션 프로그램인 CARI-6M을 이용하여 추정한 근로자의 우주 방사선 누적노출 추정량은 78.81 mSv였다. 유방암에 대한 개인적 유발 요인 및 가족력은 없었다. 역학조사평가위원회는 이 여성 승무원에서 발생한 유방암은 20년 2개월 간의 야간교대근무와 78.81 mSv의 우주 방사선 노출을 근거로 업무관련성이 상당하다고 평가하였다.
고찰
이번 사례는 항공 승무원 집단에서의 높은 유방암 발병률은 야간교대근무와 함께 기체 탑승 중 우주 전리방사선의 복합적 노출에 의해 기인될 수 있음을 보여준다. 항공 승무원 집단에서의 야간교대근무와 우주 전리방사선 복합노출에 따른 건강영향을 최소화하기 위해서는 더많은 노출평가 사례 및 집단 역학조사를 통한 비행일정 관리기준의 근거마련이 필요하다.

Citations

Citations to this article as recorded by  
  • Influence of occupational factors on the development of gynecologic pathology in flight attendants in civil aviation
    Nailya I. Nasyrova, Artem Y. Yurovskiy, Aleksei V. Overko, Lyudmila A. Ozolinya
    V.F.Snegirev Archives of Obstetrics and Gynecology.2024; 11(2): 137.     CrossRef
  • 70 View
  • 0 Download
  • 1 Crossref
Close layer

Ann Occup Environ Med : Annals of Occupational and Environmental Medicine
Close layer
TOP