RM 블로그 이전
좀 더 많은 사람들과 소통 하기 위해 네이버 블로그로 이동합니다. http://blog.naver.com/areumict1
RM 분류 알고리즘(2) - Naive Bayes
이는 분류 알고리즘 중에 가장 확률적이고 심플한 방법입니다. (심플한지는 좀 더 보겠습니다. ^^;) 모든 속성들간의 관계를 독립이라는 가장 순수한 가정을 가진 베이즈 정리를 기반으로 하여 조건부 확률 계산을 하고 이를 기반으로 값을 예측하게 ...
RM 분류 알고리즘 (1) - Default & k-NN
RapidMiner에는 굉장히 많은 분류 알고리즘들이 기본적으로 내장 되어 있습니다. 모든 알고리즘을 설명하기는 힘들겠지만 하나하나 포스팅 해보려 합니다. ^^; 이번 포스팅에는 Default Model 과 k-NN (k-Nearest...
데이터 전처리와 모델 검증의 오류
좋은 성능의 모델이 실제 적용 데이터에는 좋은 성능을 내지 못하는 경우들을 볼 수 있습니다. 이유는 다양하게 존재 할 수 있습니다. 분석 데이터가 충분하지 못하든지, 적용 데이터가 분석때와는 다르다던지, 단순 프로세스 상의 에러 발생 등 예상하지...
The Forrester Wave™ : Predictive Analytics And Machine Learning Solutions, Q1 2017
Gartner에 이어서 미국에 유명 시장 조사 전문 기관인 Forrester에서 발표한 리포트 입니다. Predictive Analytics and Machine Learning 분야에서 RapidMiner가 Leader Group에 포함되어...
RapidMiner chart - 고차원 데이터
우리가 데이터를 시각화 하기 위해서 다양한 차트를 사용하게 됩니다. - 하나의 데이터 칼럼에 대한 1차원 차트 (Histogram, Line) - X-Y 형태의 좌표로 보여지게 되는 2차원 차트 (Scatter plot) - X-Y-Z 형태의...