데이터마이닝.기계학습

로지스틱 회귀분석 : glm summary 결과 해석

Nova 2021. 3. 11. 20:31

a<-iris[iris$Species =='setosa' : iris$Species =='versicolor',]

b<-glm(Species ~ Sepal.Length, data = a, family = binomial)

>summary(b)

 

Call:

glm(formula = Species ~ Sepal.Length, family = bibnomial, data = a )

 

Deviance Residuals :

      Min        1Q     Median    3Q      Max

-2.05501 -0.47395 -0.02829 0.39788 2.32915

 

Coefficients :

               Estimate     std. Error   z value   Pr(> :z:)

(Intercept)      -27.831      5.434    -5.122   3.02e-07 ***

Sepal.Length     5.140       1.007    5.107   3.28e-07 ***

---

signif. codes : 0 '***'  0.001 '**'  0.01 '*' 0.05 '.' 0.1 ' ' 1

 

(Dispersion parameter for binomial family taken to be 1)  

 

Null deviance : 138.629 on 99 degres of freedom

Residual deviance : 64.211 on 98 degress of freedom

AIC : 68.211

 

Number of Fisher Scoring iterations : 6

 

 

해석

. Sepal.Length가 한 단위 증가함에 따라 Species(Y)가 1에서 2로 바뀔 때 오즈(Odds)가 exp(5.140) ~ 170배 증가한다

. Null deviance는 절편만 포함하는 모형의 완전모형으로부터의 이탈도(deviance)를 나타내며 p-값 = P(x²(99) > 138.629 ) ~ 0.005으로 통계적으로 유의하므로 적합결여를 나타낸다

. Residual deviance 는 예측변수 Sepal.Length가 추가된 적합 모형의 이탈도를 나타낸다. Null deviance에 비해 자유도 1기준에 이탈도의 감소가 74.4정도의 큰 감소를 보이며, p-값=P(P(x²(98) > 64.211) ~ 0.997으로 통계적으로 유의하지 못해 귀무가설을 기각하지 못한다

.따라서 적합값이 관측된 자료를 잘 적합 한다고 말할수 있다

 

'데이터마이닝.기계학습' 카테고리의 다른 글

데이터마이닝이란  (0) 2021.03.12
예측모델 평가척도  (0) 2021.03.12
연관규칙  (0) 2021.03.11
이익도표(Lift chart)  (0) 2021.03.11
정오행렬(Confusion Matrix)  (0) 2021.03.05