0. 지도학습이란? 지도학습 의미 종류 특징



안녕하세요! 워드프레스 개설 이후 첫 번째 포스팅이네요. 저는 통계학을 전공하고 있는 대학생입니다. 통계와 관련된 여러 가지 정보들에 대해 글을 적어보려고 합니다. 첫 번째 포스팅으로는 지도학습의 의미와 알고리즘 종류에 대해 알아보려고 합니다.

지도학습

지도학습이란?

지도학습(Supervised Learning)은 기계 학습의 한 분야로, 레이블이 지정된 훈련 데이터를 사용하여 모델을 학습시키고, 새로운 입력에 대한 예측을 수행하는 방법입니다.

현재까지 다양한 지도학습 알고리즘이 개발된 상태이고 오늘은 간략하게 그 알고리즘에 대해 개요 정도만 설명하고 이후의 포스팅에서 각각의 알고리즘을 자세하게 다뤄보려고 합니다.

출처: 한국정보통신기술협회: 지도형 기계 학습

 

알고리즘 종류

1. 선형회귀(Linear Regression):

선형회귀는 주어진 입력과 출력 데이터 사이의 선형 관계를 모델링하는 알고리즘입니다. 주로 연속적인 값을 예측하는데 사용됩니다. 통계학에서는 R이라는 통계 프로그램을 사용하여 모형을 모델링합니다.

선형회귀 모형 예시

2. 로지스틱 회귀(Logistic Regression):

로지스틱 회귀는 이진 분류 문제에서 사용되는 알고리즘으로, 입력 데이터를 기반으로 해당 데이터가 어떤 클래스에 속하는지 예측합니다.

로지스틱 회귀 모형 예시

 

3. 결정 트리(Decision Trees):

결정 트리는 트리 구조로 표현되는 분류 모델입니다. 각 노드에서는 특정 특성을 기준으로 데이터를 분할하여 예측을 수행합니다.

엔트로피를 이용한 결정 트리 예시

4. 랜덤 포레스트(Random Forests):

랜덤 포레스트는 여러 개의 결정 트리를 조합하여 더 강력한 앙상블 모델을 형성합니다. 예측 결과를 집계하여 안정적이고 정확한 예측을 수행할 수 있습니다.

랜덤 포레스트 앙상블 기법 예시

5. 서포트 벡터 머신(Support Vector Machines, SVM):

서포트 벡터 머신은 데이터를 고차원 공간으로 매핑하여 클래스를 분리하는 초평면을 찾는 알고리즘입니다. 이진 분류 및 다중 클래스 분류에 사용됩니다.

서포트 벡터 머신 알고리즘 예시

6. K-최근접 이웃(K-Nearest Neighbors, KNN):

K-최근접 이웃은 새로운 데이터를 분류할 때, 가장 가까운 이웃들의 레이블을 참고하여 예측하는 알고리즘입니다.

KNN 알고리즘 예시

7. 나이브 베이즈(Naive Bayes):

나이브 베이즈는 베이즈 이론을 기반으로 하는 확률적 분류 지도학습 알고리즘으로, 입력 특성들이 서로 독립이라는 가정을 가지고 있습니다.

나이브 베이즈 알고리즘 예시

8. 인공 신경망(Artificial Neural Networks):

인공 신경망은 뉴런과 같은 구조를 갖는 신경망 모델로, 은닉층을 거쳐 복잡한 패턴을 학습하여 예측을 수행합니다.

인공신경망 알고리즘 예시

이 외에도 다양한 지도학습 알고리즘이 있으며, 각 알고리즘은 특정 문제에 적합한 경우가 있습니다.

다음 포스팅에는 위의 8가지 알고리즘에 대해 구체적인 설명으로 찾아뵙겠습니다.

 

함께 보면 좋은 글들

Leave a Comment