2017-06-07

자유게시판

Re:Logistic regression - level 인식 에러

작성자
Keith
작성일
2017-11-29 09:08
조회
197
안녕하세요,

 

좋은 질문 감사합니다. Regression이 돌아갈 때 데이터 프레임의 Level들을 원래 데이터 형태로 인식하기 때문에 생기는 문제입니다.

기존 데이터는 Species 항목 안에 Level 3개가 있었는데, 지금 일부러 2개만 고르시는 작업을 하다보니 level 3개인데 데이터는 2 level에 대한 값 밖에 없어서, 일종의 missing data로 인식해서 발생하는 문제입니다.

아래의 코드를 활용해주시면 됩니다.

더불어, Species 0/1 값이 아니라 categorical 변수로 되어 있으니 0/1로 바꾸시거나, 내부적으로 이런 작업을 해주는 caret 라이브러리의 함수들을 활용하시는 것을 추천합니다.

 

아래는 제가 친 코드와 스크린 샷입니다.

 

library(caret)

 

data(iris)

 

iris2<-iris[iris$Species %in% c("setosa","versicolor"),]

unique(iris2$Species)

 

iris2$Species <- levels(droplevels(iris2$Species))

unique(iris2$Species)

 

model <- train(Species ~., data = iris2, preProcess = c('scale', 'center'), method="glm", family="binomial")

summary(model)
전체 0

전체 32
번호 제목 작성자 작성일 추천 조회
공지사항
향후 강의 계획 및 웹페이지 운영 방안 (1)
Keith | 2018.07.04 | 추천 7 | 조회 117
Keith 2018.07.04 7 117
공지사항
강의에 대해 궁금한 내용, 강의 중 궁금한 내용이 있으면 여기에 글 올려주세요
Keith | 2017.06.07 | 추천 0 | 조회 393
Keith 2017.06.07 0 393
23
실험계획법 (DOE)와 데이터 사이언스에 대한 질문이 있습니다.
Keith | 2018.07.11 | 추천 0 | 조회 84
Keith 2018.07.11 0 84
22
복습용 강의동영상이 실제 강의와 동일한것인가요? (2)
rbgml2100 | 2018.07.10 | 추천 0 | 조회 104
rbgml2100 2018.07.10 0 104
21
C 언어 기반의 데이터 분석
Keith | 2018.07.09 | 추천 0 | 조회 84
Keith 2018.07.09 0 84
20
수학 & 통계 수업 전에 미리 학습해야할 내용이 있을까요?
Keith | 2018.07.09 | 추천 1 | 조회 94
Keith 2018.07.09 1 94
19
강의 스케쥴 관련 (1)
hochi | 2018.07.03 | 추천 0 | 조회 91
hochi 2018.07.03 0 91
18
데이터 사이언스 기초 by Excel (1)
mhkang | 2018.06.14 | 추천 0 | 조회 174
mhkang 2018.06.14 0 174
17
강의 수준 좀 문의드립니다
Keith | 2018.05.14 | 추천 6 | 조회 310
Keith 2018.05.14 6 310
16
학부 졸업을 앞두고 고민이 많아서 연락드립니다 (3)
Keith | 2018.05.11 | 추천 5 | 조회 313
Keith 2018.05.11 5 313
15
[수학&통계학] 강의 문의드립니다 (1)
Keith | 2018.05.11 | 추천 5 | 조회 209
Keith 2018.05.11 5 209
14
향후 강의 계획은 어떻게 되나요?
Keith | 2018.05.04 | 추천 10 | 조회 226
Keith 2018.05.04 10 226
X