a<-iris[iris$Species =='setosa' : iris$Species =='versicolor',]
b<-glm(Species ~ Sepal.Length, data = a, family = binomial)
>summary(b)
Call:
glm(formula = Species ~ Sepal.Length, family = bibnomial, data = a )
Deviance Residuals :
Min 1Q Median 3Q Max
-2.05501 -0.47395 -0.02829 0.39788 2.32915
Coefficients :
Estimate std. Error z value Pr(> :z:)
(Intercept) -27.831 5.434 -5.122 3.02e-07 ***
Sepal.Length 5.140 1.007 5.107 3.28e-07 ***
---
signif. codes : 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance : 138.629 on 99 degres of freedom
Residual deviance : 64.211 on 98 degress of freedom
AIC : 68.211
Number of Fisher Scoring iterations : 6
해석
. Sepal.Length가 한 단위 증가함에 따라 Species(Y)가 1에서 2로 바뀔 때 오즈(Odds)가 exp(5.140) ~ 170배 증가한다
. Null deviance는 절편만 포함하는 모형의 완전모형으로부터의 이탈도(deviance)를 나타내며 p-값 = P(x²(99) > 138.629 ) ~ 0.005으로 통계적으로 유의하므로 적합결여를 나타낸다
. Residual deviance 는 예측변수 Sepal.Length가 추가된 적합 모형의 이탈도를 나타낸다. Null deviance에 비해 자유도 1기준에 이탈도의 감소가 74.4정도의 큰 감소를 보이며, p-값=P(P(x²(98) > 64.211) ~ 0.997으로 통계적으로 유의하지 못해 귀무가설을 기각하지 못한다
.따라서 적합값이 관측된 자료를 잘 적합 한다고 말할수 있다
'데이터마이닝.기계학습' 카테고리의 다른 글
데이터마이닝이란 (0) | 2021.03.12 |
---|---|
예측모델 평가척도 (0) | 2021.03.12 |
연관규칙 (0) | 2021.03.11 |
이익도표(Lift chart) (0) | 2021.03.11 |
정오행렬(Confusion Matrix) (0) | 2021.03.05 |