본문 바로가기
728x90
반응형

Business Analytics11

R로 하는 비모수검정(Non parametric Statistics) (1) 독립표본 평균검정(윌콕슨 순위합 검정, 크러스칼-왈리스 검정, 프리드만 검정) 추론통계는 모수통계(Parametric Statistics)와 비모수통계(Non parametric Statistics)로 나누어지게 된다. 모수통계는 모집단의 분포를 알고 있다고 가정하고 여기에 맞추어 추론을 진행하게 되는데, 간혹 1) 모집단의 분포에 대해 제대로 알지 못하는 경우, 2) 표본의 크기가 너무 작은 경우(표본 크기가 충분히 큰 경우 중심극한정리를 통해 정규분포를 가정할 수 있음) 3) outlier의 문제가 있는 경우에는 비모수통계를 사용하게 된다. 비모수검정을 진행하는 경우 우선적으로 해당 데이터가 정규성검정을 만족하는지 여부를 파악하게 된다. R에서 데이터의 정규성 검정은 Shapiro-Wilk's Test를 통해 진행하게 된다. x 윌콕슨 순위합 검정(Wilcoxon rank su.. 2022. 9. 12.
머신러닝 알고리즘 공부하기 (1) - R을 통한 knn(K nearest neighbor) 머신러닝 방법 중에는 KNN(K Nearest Neighbor) 기법이 있다. 이는 쉽게 생각해서 K번째 최근접 이웃이라는 뜻이다. 여기서 근접의 개념을 이해하기 위해서는 거기를 어떻게 구할 것이냐의 이해가 있어야 하는데, 여기에서는 유클리디언 거리를 사용한다. 유클리디언 거리공식은 아래와 같다. 그림을 통해 생각해보자 이미 파란색, 빨간색, 초록색 그룹으로 구별되어 있는 집단이 있다고 생각해보자. 여기서 새로운 노란색 점이 생기면, 이를 어떤 집단으로 구별해야 하는지를 정해야 한다. 이때 가장 가까운 k개의 점을 봐서 노란점은 무슨 집단에 들어가야 한다고 정해주는 것이 knn 방법이다. 위의 그림의 경우 파란색 집단과는 3개, 노란색과는 2개, 초록색과는 1개의 최근접 점이 있으므로 파란색으로 분류가 .. 2021. 1. 5.
경영학 시작하기 - business keyword 101 책 리뷰 고려대 김상용 교수님이 쓰신 'Business Keywords 101'은 경영학 비전공자인 나에게 경영학에 대한 용어적 이해를 도와준 책이다. Business Keywords 101의 책 목차는 경영일반 경영관리 경영운영 경영전략 마케팅 재무, 회계 경영 에피소드 경영어록 으로 구성되어 있다. 책은 각각의 항목별로 기초적으로 알아야 하는 키워드들에 대한 정리가 되어 있다. 요즘 공부를 하다보면 문득 학문별로 용어의 사용이 조금씩 다르다는 생각을 할 때가 있다. 따라서 경영학 공부를 처음 시작할 때 이에 대해 인지한 상태로 경영학 공부를 하다가 햇갈리는 용어나, 왜 이 문단에서 이러한 용어가 나왔는지에 대해 생각해볼 때 경영학을 좀 더 상세히 공부해볼 수 있다. 또한 책의 후반부에는 재미있는 경영 에피소드.. 2021. 1. 3.
데이터를 얻을 수 있는 장소 세상에는 다양한 데이터들이 있다. 단순히 공부용으로 정제되어 있는 데이터 뿐만 아니라 세상에 실제로 존재하는 데이터들, 즉 우리가 향후 데이터와 관련된 업무를 실제로 하게 되었을 때 마주하게 될 데이터에 대해 공부할 때도 맛보기 차원에서 확인해보는 것도 좋은 공부이다. 공공데이터 포털 https://www.data.go.kr/index.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 공공 데이터 포털은 우리나라 정부에서 공적으로 사용가능한 데이터를 모아둔 포털 사이트로 공공기관이 생성 또는 취득하여 관리하고 있는.. 2020. 12. 28.
728x90
반응형