Glossary

자기 지도 학습이란?

자기 지도 학습은 레이블이 없는 데이터를 활용하여 모델을 훈련시켜 유용한 특성 표현을 생성하는 기계 학습 접근 방식입니다. 이 방법은 최근 몇 년 동안 이미지 및 자연어 처리 작업에서 상당한 주목을 받았습니다.


자기 지도 학습의 배경은 라벨이 있는 데이터가 많이 필요한 감독 학습의 한계에서 비롯됩니다. 실제 애플리케이션에서는 이러한 데이터를 얻기 어려운 경우가 많습니다. 자기 지도 학습을 통해 모델은 레이블이 없는 데이터에서 정보를 추출하여 특성 표현을 구축할 수 있습니다.


작동 방식에 있어 자기 지도 학습은 일반적으로 훈련 중 예측 작업을 설정하는 방식으로 진행됩니다. 예를 들어, 이미지 처리에서 모델은 이미지의 일부를 예측하거나 가려진 이미지를 재구성해야 할 수 있습니다. 자연어 처리 분야에서는 BERT와 같은 모델이 마스크된 언어 모델링을 사용하여 자기 지도 학습을 수행하여 하위 작업에서의 성능을 향상시킵니다.


자기 지도 학습의 장점은 대량의 레이블이 없는 데이터를 효과적으로 활용하여 모델의 성능을 향상시킬 수 있다는 것입니다. 그러나 단점으로는 모델이 불필요한 잡음을 학습하여 성능이 저하될 수 있다는 점이 있습니다. 또한, 이론적으로 자기 지도 학습은 넓은 응용 전망을 가지고 있지만, 실제 응용에서는 모델 설계와 훈련 과정에 신중하게 접근해야 합니다.


앞으로 자기 지도 학습은 데이터가 부족한 상황에서 더 많은 분야에 적용될 가능성이 있으며, 비지도 학습과 지도 학습을 연결하는 다리 역할을 하여 인공 지능 기술의 발전을 이끌 수 있습니다.