R

05_R(jupyter notebook) 데이터프레임,apply,subset,list,unlist,문자열처리,stringr,문자열처리

Nova 2021. 1. 23. 22:23

04_jupyter notebook(R) 데이터프레임,apply,subset,list,unlist, 문자열처리,stringr,문자열처리

 

* txt 파일 불러오기

read.table()

 

* csv 파일 불러오기

read.csv()

* 회전시키는 함수

t() - dataframe에서 matrix로 자동 변경됨, dataframe으로 다시 변경필요

 

 

* 데이터 프레임에 함수 적용

 apply(데이터범위, 1(행) or 2(열), 함수)

 

* 부분집합

subset() 전체데이터에서 내가 필요한 부분만 가져올때

 

* 병합함수

merge( x, y, 기준점)

 

* 행렬

matrix()

 

* list() : {key : value}

* 문자열 처리

수집한 데이터의 필요한 문자열을 자르고, 교체하고, 추출하는 작업

 

*stringr package사용

str_length(): 문자열 길이

str_c() : 문자열 연결

str_sub() : 범위에 해당하는 문자열 생성

str_split() : 구분자를 기준으로 문자열을 분리하여 부분생성

str_replace(): 기존 문자열을 특정 문자열로 변환

str_extract(): 문자열에서 특정 문자열 패턴의 첫번째 문자열 추출

str_extract_all(): 문자열에서 모든 문자열 추출

str_locate(): 문자열에서 특정 문자열 패턴의 위치 하나만 찾기

str_locate_all(): 문자열에서 특정 문자열 패턴의 위치모두 찾기

 

#패키지 설치

install.package('stringr')

#패키지 사용학;

library(sringr)

 

* 문자열 위치 구하기/부분 문자 구하기

* 천단위 문자열 교체하기

 

* 문자열 교체/결합/분리하기

 

* unlist() : list를 vector로 분리