R에서 데이터 분석을 하기 위해서는 우선 기본적으로 외부에 저장되어 있는 데이터를 R로 불러와야 한다.
데이터를 R로 불러오기 위한 방법에는 여러가지가 있는데, 우선 가장 선행되어 해야하는 것은 working directory을 설정해주는 것이다.
getwd() # 이릍 통해 현재 어떤 working directory에서 작업중인지 확인한다.
setwd("working directory의 파일 경로") #자신만의 working directory을 세팅해준다.
setwd()을 수행할 때 이를 쉽게 하기 위해서는 해당 파일을 켜고 검색창을 클릭하는 방법을 추천한다. 이것이 가장 쉽게 working directory을 설정하는 방법이기 때문이다.
예를 들어 iloveyou라는 폴더를 working directory로 지정해준다고 하면 해당 과정을 통해
"C:\Users\ghd45\Desktop\iloveyou"을 추출해낼 수 있다.
이를 r이 인식하지 못하는 경우가 있는데, 이 경우 \를 한 번씩 더 넣어주자
해당 예에서는
setwd("C:\\Users\\ghd45\\Desktop\\iloveyou")
이런 식으로 해주면 된다.
이렇게 setwd() 과정이 완료되었다면, 이후에 다시 getwd()함수를 통해 자신의 작업이 제대로 되었는지 확인해본다.
이후에는 데이터를 불러오는 작업이다. 타이핑을 해서 불러올 수도 있지만, 더 쉬운 방법으로 아래 사진의 검은색 네모 박스 안에 있는 import dataset을 클릭해주어도 된다.
이를 클릭해보면 이런 식으로 어떤 형태의 데이터를 불러올 것인지에 대해 선택해서 불러올 수 있다.
여기서 엑셀 파일에서 불러오게 되어 From Excel을 선택했다고 생각해보자
이 경우 아래 그림을 통해
1번 네모칸에 browse을 클릭하는 경우 파일을 클릭으로 불러올 수 있다.
2번 네모 칸은 import dataset의 내장 함수로서 어떠한 코드를 쳐서 데이터를 불러올 것인지 정해준다.
3번 네모 칸은 import option으로 불러오는 데이터의 이름을 무엇으로 정해줄 것인지, NA값을 어떻게 해줄 것인지, 첫번째 행을 이름으로 지정할 것인지 정할 수 있다. 또한 이러한 옵션의 선택에 따라 code preview가 바뀌는 것을 볼 수 있다.
데이터 분석을 위해서 어떻게 보면 가장 중요한 데이터 불러오기에 대한 설명이다.
데이터를 불러와야 어떻게든 분석을 할 수 있으니 r을 통한 데이터 분석의 첫걸음을 내딛었다고 생각해보자!
'Business Analytics > R로 기본내용 공부하기' 카테고리의 다른 글
[R로 하는 데이터 분석] 기초 데이터 확인하기 (데이터 EDA) (0) | 2022.11.19 |
---|---|
머신러닝 알고리즘 공부하기 (1) - R을 통한 knn(K nearest neighbor) (0) | 2021.01.05 |
데이터를 얻을 수 있는 장소 (0) | 2020.12.28 |
R 시작하기: R 설치하기 (0) | 2020.12.26 |
우리는 왜 R을 배워야 할까? (0) | 2020.12.25 |
댓글