비지도학습 -5. 연관 규칙 지지도 신뢰도 향상도

연관 규칙이란? 연관 규칙(association rules)은 비지도학습 중 하나로, 데이터 집합에서 특정 항목들 간의 관계나 규칙을 찾아내는 분석 방법입니다. 대표적인 연관 규칙의 사례로 해외의 한 마트에서 여고생의 임신을 부모보다 먼저 알게 되어 육아 관련 상품에 대한 쿠폰들을 집에 보낸 사건입니다. 이처럼 …

Read more

비지도학습 – 4.2 고유값 분해 계산

안녕하세요 ! 오늘 포스팅에서는 앞선 비지도 학습의 종류 중에서 주성분 분석(PCA)와 특이값 분해(SVD) 계산에서 이용되었던 고유값 분해에 대해서 포스팅 해보려고 합니다. 주성분 분석과 특이값 분해 뿐만 아니라 다양한 분야에서 활용되는 개념이라 포스팅을 따로 해서 조금 더 자세히 다뤄보려고 합니다. 고유값 …

Read more

비지도학습 – 4.1 특이값 분해

특이값 분해란? 특이값 분해(Singular Value Decomposition, SVD)는 선형 대수학의 중요한 개념으로, 임의의 m x n 행렬을 세 개의 행렬로 분해하는 방법입니다. 주로 대칭 행렬이 아닌 임의의 행렬에 대해 수행되며, 행렬 분해에 대한 다양한 알고리즘이 존재합니다. 아래 사진과 함께 좀 더 …

Read more

비지도학습 – 3. 주성분 분석 PCA

  주성분 분석이란? 주성분 분석(Principal Component Analysis, PCA)은 다변량 데이터의 차원을 축소하고, 데이터의 주요한 변동성을 설명하는 데 사용되는 통계적인 방법입니다. 다차원 데이터의 변수들 사이의 상관관계를 고려하여 데이터를 새로운 변수들의 집합으로 변환하게 됩니다. 이때, 변환된 변수들은 원본 데이터의 주요한 변동성을 설명하는 …

Read more

비지도학습 – 2. 계층적 군집화

계층적 군집화란? 계층적 군집화(Hierarchical Clustering)는 비지도학습의 한 종류로, 데이터를 계층적으로 그룹화하는 알고리즘입니다. 이 알고리즘은 데이터 포인트들을 트리 구조로 표현하며, 유사한 데이터가 서로 가깝게 위치하고 서로 다른 클러스터가 계층적으로 형성됩니다. 또한 이 알고리즘은 데이터 포인트들을 계층적인 트리 구조로 표현하는 특징을 가지고 …

Read more

비지도학습 – 1. K-평균 군집화

  K-평균 군집화란? K-평균 군집화(K-Means Clustering)는 비지도학습 중 군집화의 일종으로, 입력 데이터를 K개의 클러스터로 그룹화하는 알고리즘입니다. 각 클러스터는 중심점인 센트로이드(Centroid)를 가지며, 데이터들은 가장 가까운 센트로이드에 할당됩니다.   알고리즘 과정 첫째로, 초기에 K개의 센트로이드를 랜덤하게 선택하고, 각 데이터를 가장 가까운 centroid(도심)에 …

Read more

0. 비지도학습이란 비지도학습 뜻 종류 활용

  비지도학습이란 ? 비지도학습(Unsupervised Learning)은 기계 학습의 한 분야로, 입력 데이터에 대한 명시적인 레이블이나 정답이 없는 상황에서 데이터의 숨겨진 구조나 패턴을 탐색하거나 데이터를 그룹화하는 데 사용됩니다. 데이터로부터 스스로 학습하는 능력을 갖추고, 데이터의 내재된 특징을 이해하고 발견하는 데 중점을 둡니다. 비지도학습은 …

Read more

지도학습 – 8. 인공신경망

  인공신경망이란? 인공신경망(Artificial Neural Network, ANN)은 인간의 뇌의 동작 원리를 모방한 기계 학습 알고리즘입니다. ANN은 다수의 뉴런이 연결된 구조로 이루어져 있으며, 데이터를 입력받아 처리하고 예측을 수행하는 능력을 갖추고 있습니다. 구성, 알고리즘 과정 구성 ANN은 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 …

Read more

지도학습 – 7. 나이브 베이즈와 베이즈 이론

나이브 베이즈란? 나이브 베이즈(Naive Bayes)는 기계 학습 알고리즘 중 하나로, 분류(Classification) 문제를 해결하는데 사용되는 확률적인 예측 모델입니다. 나이브 베이즈는 베이즈 이론(Bayes’ theorem)을 기반으로 하며, 각 특성들이 서로 독립적이라는 가정을 가지고 있습니다. 이 가정으로 인해 “나이브”(Naive)하다고 불리며, 간단하고 빠른 분류 모델로 …

Read more

지도학습 – 6. K-최근접 이웃

  K-최근접 이웃이란? K-최근접 이웃(K-Nearest Neighbors, K-NN)는 기계 학습 알고리즘 중 하나로, 분류(Classification)와 회귀(Regression) 문제를 해결하는 데 사용되는 비모수적인 예측 모델입니다. K-NN은 주어진 데이터 포인트의 주변에 위치한 K개의 가까운 이웃들을 기반으로 예측을 수행합니다.   알고리즘의 과정 먼저, K-최근접 이웃은 주변 …

Read more