본문 바로가기
728x90
반응형

분류 전체보기31

ADP 통계 문제 및 연습(제 22회차) 22회차 통계 문제 문제1. 금속 성분 함유량 데이터(변수 1개) 제품에 금속 재질 함유량의 분산이 1.3을 넘으면 불량이라고 보고 있는데 제조사별로 차이가 난다고 제보를 받았으며, 분산에 대해 검정을 수행하시오. (유의확률 0.05) 데이처 출처 : https://raw.githubusercontent.com/Datamanim/datarepo/main/adp/22/content.csv 1) 연구가설과 귀무가설 작성 연구 가설 : 서로 다른 제조업체의 제품 간 금속 함량의 분산이 1.3과 같다 귀무 가설 : 서로 다른 제조업체의 제품 간 금속 함량의 분산이 1.3과 유의미하게 다르다 2) 양측 검정 시행 library(dplyr) library(data.table) #데이터 불러오기 data 2023. 2. 5.
지도학습 > 의사결정나무 : CART, C5.0, C4.5, CHAID - R code 데이터 마이닝 파트 중 지도학습의 한 분야인 의사결정 나무에 대해 CART, C5.0, C4.5, CHAID, 분리기준 (카이 제곱 통계량 p값, 지니 지수, 엔트로피 지수, F통계량, 분산의 감소량), 가지치기(pruning)에 대해 알아보자. 의사결정나무는 분류 및 회귀 문제 모두에 사용되는 기계 학습 알고리즘의 한 유형이다. 의사결정나무는 간단히 말해 가장 중요한 변수를 기반으로 데이터를 더 작은 하위 집합으로 재귀적으로(Recursive하게) 분할하고 결국 클래스 레이블 또는 예측 값을 나타내는 터미널 노드(terminal node, 리프)에 도달하는 방식으로 작동한다. 또한 의사결정나무는 그래픽으로 표현할 수 있어 모델 뒤에 숨겨진 논리를 쉽게 이해할 수 있다. R에서는 의사결정 트리를 구현하기.. 2023. 2. 1.
2023년 군인 월급(장교, 준사관, 부사관, 병/ 사관학교, ROTC, 공군항공과학고등학교 등) 오늘은 직업상 군인이라는 사람들이 받는 월급에 대해 확인해보자 1. 장교 장교로 처음 군대에 입대하게 되면, 법무관, 군의관 등 특이 직렬이 아닌 이상 대부분 소위로 임관하게 된다. 소위 임관 루트에 따라 호봉이 달라지기는 하지만, 가장 기본적인 소위 1호봉의 월급은 약 175만 원 정도이다. 2022년 기준 약 175만 원, 2021년 기준 172만 원에서 상승하고 있기는 하나, 정말 조금씩 올라가고 있는 상황이다. 최근 ROTC 지원률이 날이 갈수록 떨어지고 있는 상황도 이와 무관하지 않을 것 같다(참고: [유용원의 밀리터리 시크릿] : ROTC 모집 연기와 초급간부 지원률 급락 / https://www.chosun.com/politics/politics_general/2022/05/10/GPESQG.. 2023. 1. 25.
차원 분석 - 주성분 분석, 요인 분석, 다차원 척도법 차원 분석이란 기본적으로 다수의 데이터로 인해 의미 있는 무언가를 뽑아내기 어려운 경우 데이터의 차원을 축소하는 방식으로 사용하게 된다. 데이터의 차원을 축소하는 이유는 데이터셋에 많은 변수가 포함되는 경우 분석의 복잡성이 증가하고, 이로부터 의미있는 정보를 찾기에 어려움이 생기 때문이다. 이런 경우 데이터셋에 포함된 여러 변수를 소수의 해석 가능한 변수로 축소할 필요가 있다. 주성분분석(Principal Component Analysis), 요인분석(Factor Analysis), 다차원 척도법(Multidimensional Scaling) 등은 데이터의 차원을 줄여주어 데이터의 복잡성을 감소시킨다. 1. 주성분 분석 - 서로 상관관계를 갖는 많은 변수를 상관관계가 없는 소수의 변수로 변환하는 차원축소.. 2023. 1. 15.
728x90
반응형