r 44

17_R(jupyter notebook) 가설검정(카이제곱,피셔검정,t-검정,shapiro-wilk검정,상관관계)

17_R(jupyter notebook) 가설검정(카에제곱,피셔검정,t-검정,shapiro-wilk검정,상관관계) * 카에제곱 검정 두 범주형 변수가 서로 상관이 있는지 판단하는 통계적 방법 *피셔검정 . 표본수가 작거나 데이터의 분포가 치운 경우 피셔검정을 실시한다 카이제곱의 근사값이 정확하지 않을수도 있다, (데이터양이 적은 경우 발생) 이때 피셔검정을 한다 (cf. 통계학에서 제일작은 데이터수는 15개) * Shapiro-Wilk 검정 데이터의 분포가 정규분포인지 확인 * t -검정 . mu : 비교하는 대상의 평균 . alternative two.sided : 데이터가 평균이 다르다 greater : 데이터가 평균보다 크다 less : 데이터가 평균보다 적다

R 2021.02.04

12_R(jupyter notebook) (1)시각화(꺽은선그래프,선그래프,막대그래프)

12_jupyter notebook(R) (1)시각화(꺽은선그래프,선그래프,막대그래프) www.endmemo.com/r/line.php R Abline Function Draw Line -- EndMemo R Draw Lines abline() function adds a line to plot. It's expression is: abline(a = NULL, b = NULL, h = NULL, v = NULL, reg = NULL, coef = NULL, untf = FALSE, ...) lines(x, y = NULL, type = "l", ...) a,b: intercept and slope h: for horizontal line v: for ve www.endmemo.com www.endmem..

R 2021.01.30

09_R(jupyter notebook) 데이터정제,막대그래프,데이터처리(orderBy,sampling,subset,aggregate)

09_jupyter notebook(R) 데이터정제,막대그래프,데이터처리(orderBy,sampling,subset,aggregate) *데이터 처리 함수들 orderBy(~기준값(X), data) - 오름차순 정렬 orderBy(~-기준값(X), data) - 내림차순 정렬 sample(범위, 추출%) sampling subset(data, 조건) 데이터 프레임에서 필요한 테이터만 찾아서 데이터프레임 만들기 aggregate( A ~ 기준점, data, 연산) 기준점 별로 각각A에 대한 연산을 구해라 *세계 GDP순위 데이터 정제및 차트 그리기

R 2021.01.28

python_03: (1)기본자료구조(Data Structure) -List

python_03:기본자료구조(Data Structure) -List python 기본자료구조(Data Structure) .List(Mutalbel Arrays) .Tuple(Immutable Arrays) .Dictionary(Hashtables) .Sets and Frozen Sets *List .데이터를 여러개 저장하는데 사용한다 .순서가 있다 즉, 인덱스를 가지고 있다 .값을 바꿀수 있다 즉,Mutable 이라고 한다. *파이썬에서 리스트 만들기(python list생성) 파이썬 리스트에서 비어 있는 리스트, 즉 아무것도 없는 리스트는 아래처럼 두가지 방법으로 생성할수 있다 (1) 대괄호를 사용하는 방법:[] (2) list()함수르르 사용하는 방법 *mixed datatype, nested l..

Python 2021.01.28

08_R(jupyter notebook) 기본통계처리함수(3),결측치,메모리관리

08_jupyter notebook(R) 기본통계처리함수(3),결측치,메모리관리 *table() 빈도수 구하는 함수 *각 컬럼별 빈도수 구하기 *빈도구 구하기와 최대값, 최소값 구하는 함수 *분산과 표준편차를 구하는 함수 * 결측치(NA) .특정한 데이터가 없다는 뜻 .R은 NA가 있으면 계산이 불가능하다 .NA데이터가 20%넘으면 해당 데이터는 쓸수 없다 .결측치를 무조건 제거하면 통계량을 얻을 수 없으며 데이터 손실이 크다 평균,중앙값등으로 대체시켜야 한다 *결측치가 있는 데이터를 다른값으로 대체하는 함수 * Is() 메모리에 있는 변수 데이터 확인 * rm() 메모리에 있는 변수 데이터 지우기 . 메모리용량 부족때문에 작업 중간마다 지워줘야한다 * save() 메모리에 있는 데이터 그대로 저장 * ..

R 2021.01.27

07_R(jupyter notebook) 반복문2(for,while),구구단,사용자정의함수

07_jupyter notebook(R) 반복문2(for,while),구구단,사용자정의함수 *반복문 for() *1~100까지의 수중 5의 배수만 출력 * 구구단 2단 출력하기 * 사용자로부터 구구단 수를 입력받아 구구단수를 출력 * 사용자 정의 함수 function() -인수가 없는 경우 -인수가 있는 경우 # column이 여러개일 경우 for문 사용 * 구구단(2-9)에서 짝수 단, 짝수 곱하는 값의 결과를 출력 * vector값을 10배 증가하여 새로운 벡터 만들기 # 구구단(2-9)에서 짝수 단, 짝수 곱하는 값의 결과를 출력 *반복문 while() *무한루프 while(T) *반복문 repeat() # for 반복문 사용 해서 각 컬럼 빈도수의 최대값 구하기

R 2021.01.26

06_R(jupyter notebook) 제어문,조건문,반복문,ifelse

05_jupyter notebook(R) 제어문,조건문,반복문,ifelse * 제어문, 조건문 - 경우의 수를 만드는것 - 홀수인지, 짝수인지 * readline() : 화면에서 입력받음, 전부 문자처리 숫자로 바꿔줄 경우 as.numeric(readline()) * 사용자가 입력한 수를 확인하여 홀수인지 짝수인지 판단 * ifelse( 조건, True, False ) : 벡터로 쓸수 있는 함수 *q1컬럼에서 Data가 3보다 크거나 같으면 data의 제곱근을 구하고 아니면 원래 Data로 출력하기 * 반복문 * 1에서 10까지의 합계 구하기 * 1에서 100까지의 합계 구하기

R 2021.01.25