0. 비지도학습이란 비지도학습 뜻 종류 활용

비지도학습
 

 

비지도학습이란 ?

비지도학습(Unsupervised Learning)은 기계 학습의 한 분야로, 입력 데이터에 대한 명시적인 레이블이나 정답이 없는 상황에서 데이터의 숨겨진 구조나 패턴을 탐색하거나 데이터를 그룹화하는 데 사용됩니다. 데이터로부터 스스로 학습하는 능력을 갖추고, 데이터의 내재된 특징을 이해하고 발견하는 데 중점을 둡니다. 비지도학습은 레이블이 없거나 사전 정보가 제한적인 상황에서 유용하게 활용됩니다. 데이터의 내부 구조를 파악하고 패턴을 발견하는 데에 큰 도움을 주므로, 지도학습의 전처리 과정이나 데이터 탐색 등 다른 학습 방법과 함께 종종 사용됩니다.

 

 

비지도학습의 종류

 

1. 군집화(Clustering):

군집화는 데이터를 유사한 특성을 가진 그룹으로 자동으로 나누는 작업입니다. 이를 통해 데이터의 내부 구조를 파악하고 비슷한 특징을 가진 데이터를 함께 묶을 수 있습니다.

군집화 알고리즘은 데이터 간의 거리나 유사도를 기준으로 클러스터를 형성합니다.

대표적인 군집화 알고리즘으로는 K-평균(K-Means)과 계층적 군집화(Hierarchical Clustering) 등이 있습니다.

k-평균 군집화의 예시자료 (출처:wikipedia)

2. 차원 축소(Dimensionality Reduction):

차원 축소는 고차원 데이터를 저차원으로 압축하면서 데이터의 구조와 특징을 최대한 유지하는 작업입니다.

고차원 데이터는 특징의 수가 많아 복잡한 모델을 만들고 데이터 처리를 어렵게 만들 수 있습니다. 따라서 차원 축소를 통해 데이터의 차원을 줄이면서 중요한 정보를 보존하면 더 효율적인 학습과 예측이 가능해집니다.

대표적인 차원 축소 알고리즘으로는 주성분 분석(Principal Component Analysis, PCA)와 특이값 분해(Singular Value Decomposition, SVD) 등이 있습니다.

차원 축소의 예시 (출처: 네이버)

 

3. 연관 규칙 학습(Association Rule Learning):

연관 규칙 학습은 데이터 안에 존재하는 항목 간의 연관 관계를 탐색하는 작업입니다.

연관 규칙 학습은 상품 추천, 마케팅 전략 개발 등에 활용됩니다. Apriori 알고리즘, FP-Growth 알고리즘 등이 사용됩니다.

그림 출처: 네이버 블로그

지도학습에 비해서 알고리즘의 종류가 다양하진 않지만, 다음 포스팅부터 비지도학습 알고리즘의 종류에 대해서 알아보는 시간을 가져보도록 하겠습니다.

함께 보면 좋은 글들

Leave a Comment