빅데이터 공모전 – 2023 춘천시 빅데이터 공모전 예선 정보 후기

지난 6월 13일(화)부터 7월 7일(금)까지 춘천시와 강원도민일보가 주최하는 빅데이터 공모전이 있었습니다! 통계학과를 재학 중인 저는 대학교 친구들과 함께 우연히 이 공모전을 보고 참여하게 되었습니다. 춘천시 빅데이터 공모전 설명 이번 2023 춘천시 빅데이터 분석 경진대회에 대해 간략하게 요약하자면 아래와 같습니다. 신청기간 …

Read more

확률표본추출 – 4. 군집 표본 추출 과정 특징

군집 표본 추출이란? 군집 표본 추출(Cluster Sampling)은 통계학에서 사용되는 표본 추출 방법 중 하나로, 모집단을 작은 그룹 또는 군집(cluster)으로 나눈 뒤, 일부 군집을 선택하여 표본을 추출하는 방법입니다. 군집 표본 추출은 모집단을 전체적으로 조사하는 것이 어려운 경우에 유용합니다. 예를 들어, 전국의 …

Read more

확률표본추출 – 3. 층화 표본 추출 과정 특징

층화 표본 추출이란? 층화 표본 추출(Stratified Sampling)은 통계학에서 사용되는 표본 추출 방법 중 하나로, 모집단을 특정 특성이나 속성에 따라 구분된 여러 층으로 나눈 뒤, 각 층에서 표본을 추출하는 방법입니다. 층화 표본 추출은 모집단의 다양한 특성을 고려하여 표본을 구성할 수 있다는 …

Read more

확률표본추출 – 2. 체계적 표본 추출 과정 특징

  체계적 표본 추출이란? 체계적 표본 추출(Systematic Sampling)은 통계학에서 사용되는 표본 추출 방법 중 하나로, 모집단의 개체들을 일정한 간격으로 선택하는 방법입니다. 이 표본 추출 방법은 무작위성을 보장하면서도 구현이 비교적 간단하고 효율적인 방법입니다. 체계적 표본 추출은 계통적 표본 추출이라고 더 많이 …

Read more

확률표본추출 – 1. 단순 무작위 표본 추출

  단순 무작위 표본 추출이란? 단순 무작위 표본 추출(Simple Random Sampling)은 통계학에서 가장 기본적이고 일반적으로 사용되는 표본 추출 방법 중 하나입니다. 이 방법은 모집단 내의 모든 개체들이 동일한 확률로 표본에 포함될 수 있도록 하는 방법입니다. 간단하게 말해, 모집단에서 개체를 임의로 …

Read more

0. 표본 추출이란? 표본 추출 방법 종류 과정 특징

표본 추출은 통계학에서 중요한 개념이며, 통계적 추론과 데이터 분석에서 사용됩니다. 이번 포스팅에서는 표본 추출의 정의와 방법, 종류에 알아보도록 하겠습니다. 표본 추출이란? 연구자가 관심을 갖고 연구하고자 하는 전체 대상 또는 집단을 모집단(population, 母集團)이라고 합니다. 모집단 전체를 대상으로 조사하는 것을 전수조사 또는 …

Read more

비지도학습 -5. 연관 규칙 지지도 신뢰도 향상도

연관 규칙이란? 연관 규칙(association rules)은 비지도학습 중 하나로, 데이터 집합에서 특정 항목들 간의 관계나 규칙을 찾아내는 분석 방법입니다. 대표적인 연관 규칙의 사례로 해외의 한 마트에서 여고생의 임신을 부모보다 먼저 알게 되어 육아 관련 상품에 대한 쿠폰들을 집에 보낸 사건입니다. 이처럼 …

Read more

비지도학습 – 4.2 고유값 분해 계산

안녕하세요 ! 오늘 포스팅에서는 앞선 비지도 학습의 종류 중에서 주성분 분석(PCA)와 특이값 분해(SVD) 계산에서 이용되었던 고유값 분해에 대해서 포스팅 해보려고 합니다. 주성분 분석과 특이값 분해 뿐만 아니라 다양한 분야에서 활용되는 개념이라 포스팅을 따로 해서 조금 더 자세히 다뤄보려고 합니다. 고유값 …

Read more

비지도학습 – 4.1 특이값 분해

특이값 분해란? 특이값 분해(Singular Value Decomposition, SVD)는 선형 대수학의 중요한 개념으로, 임의의 m x n 행렬을 세 개의 행렬로 분해하는 방법입니다. 주로 대칭 행렬이 아닌 임의의 행렬에 대해 수행되며, 행렬 분해에 대한 다양한 알고리즘이 존재합니다. 아래 사진과 함께 좀 더 …

Read more

비지도학습 – 3. 주성분 분석 PCA

  주성분 분석이란? 주성분 분석(Principal Component Analysis, PCA)은 다변량 데이터의 차원을 축소하고, 데이터의 주요한 변동성을 설명하는 데 사용되는 통계적인 방법입니다. 다차원 데이터의 변수들 사이의 상관관계를 고려하여 데이터를 새로운 변수들의 집합으로 변환하게 됩니다. 이때, 변환된 변수들은 원본 데이터의 주요한 변동성을 설명하는 …

Read more