ADP 실기 준비 - 머신러닝 (1) 회귀분석 패키지/함수 정리
1. 단순회귀분석, 다항회귀분석 (polynomial analysis) , 다중회귀분석 # lm은 선형 모형을 적합시키는 데 사용됩니다. 회귀 분석, 분산의 단일 층 분석 및 # 공분산 분석을 수행하는 데 사용할 수 있습니다 # (aov가 이러한 인터페이스를 더 편리하게 제공할 수도 있음). result 컬럼의 평균값 weights, na.action, method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, contrasts = NULL, offset, …) # 고려사항 formula에 넣을 때 심볼의 의미는 R을 이용한 통계데이터분석 책 p.152 참고 # formula에 제곱, 세제곱을 넣으며, 분석해볼 수 있..
2023. 6. 1.
지도학습 > 의사결정나무 : CART, C5.0, C4.5, CHAID - R code
데이터 마이닝 파트 중 지도학습의 한 분야인 의사결정 나무에 대해 CART, C5.0, C4.5, CHAID, 분리기준 (카이 제곱 통계량 p값, 지니 지수, 엔트로피 지수, F통계량, 분산의 감소량), 가지치기(pruning)에 대해 알아보자. 의사결정나무는 분류 및 회귀 문제 모두에 사용되는 기계 학습 알고리즘의 한 유형이다. 의사결정나무는 간단히 말해 가장 중요한 변수를 기반으로 데이터를 더 작은 하위 집합으로 재귀적으로(Recursive하게) 분할하고 결국 클래스 레이블 또는 예측 값을 나타내는 터미널 노드(terminal node, 리프)에 도달하는 방식으로 작동한다. 또한 의사결정나무는 그래픽으로 표현할 수 있어 모델 뒤에 숨겨진 논리를 쉽게 이해할 수 있다. R에서는 의사결정 트리를 구현하기..
2023. 2. 1.