본문 바로가기
728x90
반응형

ADP4

ADP 실기 준비 - 머신러닝 (1) 회귀분석 패키지/함수 정리 1. 단순회귀분석, 다항회귀분석 (polynomial analysis) , 다중회귀분석 # lm은 선형 모형을 적합시키는 데 사용됩니다. 회귀 분석, 분산의 단일 층 분석 및 # 공분산 분석을 수행하는 데 사용할 수 있습니다 # (aov가 이러한 인터페이스를 더 편리하게 제공할 수도 있음). result 컬럼의 평균값 weights, na.action, method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, contrasts = NULL, offset, …) # 고려사항 formula에 넣을 때 심볼의 의미는 R을 이용한 통계데이터분석 책 p.152 참고 # formula에 제곱, 세제곱을 넣으며, 분석해볼 수 있.. 2023. 6. 1.
ADP 20회 실기_ 머신러닝 파트 1. 기계학습 (날씨 데이터 최고 온도 예측) 활용 데이터 : https://drive.google.com/file/d/1pko9oRmCllAxipZoa3aoztGZfPAD2iwj/view *데이터에 대한 간략한 설명 temp_1 : 전날 최고온도 temp_2 : 전전날 최고온도 friend : 친구의 예측온도 데이터 확인 및 전처리 데이터 EDA 수행 library(data.table) library(dlookr) library(tidyverse) data 2023. 5. 19.
ADP 통계 문제 및 연습(제 22회차) 22회차 통계 문제 문제1. 금속 성분 함유량 데이터(변수 1개) 제품에 금속 재질 함유량의 분산이 1.3을 넘으면 불량이라고 보고 있는데 제조사별로 차이가 난다고 제보를 받았으며, 분산에 대해 검정을 수행하시오. (유의확률 0.05) 데이처 출처 : https://raw.githubusercontent.com/Datamanim/datarepo/main/adp/22/content.csv 1) 연구가설과 귀무가설 작성 연구 가설 : 서로 다른 제조업체의 제품 간 금속 함량의 분산이 1.3과 같다 귀무 가설 : 서로 다른 제조업체의 제품 간 금속 함량의 분산이 1.3과 유의미하게 다르다 2) 양측 검정 시행 library(dplyr) library(data.table) #데이터 불러오기 data 2023. 2. 5.
[R로 하는 데이터 분석] 기초 데이터 확인하기 (데이터 EDA) R로 데이터 분석을 진행할 때는 기본적으로 데이터에 대한 진단을 진행해야 합니다. 데이터 진단의 방법은 아래와 같습니다. 1. 데이터 확인하기 데이터는 기본적으로 연속형 데이터거나 범주형 데이터입니다. dlookr 패키지의 diagnose 계열 함수들을 활용하면, 데이터에 대한 진단값을 확인해볼 수 있습니다. dlookr 패키지의 활용 방안은 아래와 같습니다. 1. 데이터 진단(EDA 차원) 2. 결측치 확인 3. 수치형 데이터에 대해 좀 더 명확히 파악하기 4. 범주형 데이터에 대해 좀 더 명확히 파악하기 5. 아웃라이어에 대해 명확히 파악하기 6. 기술통계량 확인하기 7. 상관관계표 생성하기 #패키지 불러오기 library(dlookr) library(tidyverse) # 데이터 진단하기 # 데이터.. 2022. 11. 19.
728x90
반응형