이것 저것 공부와 후기
[R언어] R언어 기초 본문
R언어의 기초 및 예시
기본 데이터 프레임 읽어내기
DF <- read.csv("example_studentlist.csv")
- RPRO 파일에 example_studentlist.csv 파일이 기본적으로 있어야 한다.
1. 변수의 선택
DF[[7]] : 벡터 형태로 출력
ex) [1] 1 2 3 4 5 6
DF[7] : 데이터 프레임 형태로 출력
ex) [1] 1
[2] 2
[3] 3
DF[c(6,7)] : 변수 위치 값으로 여러 변수 선택
DF[c("bloodtype","name")] : 변수명으로 여러 변수 선택
DF[6,] / DF[,7] : 행렬 방식으로 선택
2. subset 함수의 활용
1) 조건을 통해 170 cm 이상의 사람들 출력하기
a <- subset(DF, subset = (height>= 170))
2) 조건 + 뽑아내고 싶은 데이터(키,이름) 만 출력하기
a <- subset(DF, select = (height,name), subset = (height>=170))
3) 조건을 통해 변수 빼기
a <- subset(DF, select = -height)
a <- subset(DF, select = (-height, -name) // 여러 변수 생략할 때
3. 변수명 바꾸기
1) 하나만 변경할 때
rownames(DF)[1] <- "Hello"
2) 모든 변수 변경할 때
rownames(DF) <- c("na","se","ag" 등등 모든 변수 변경 값 기입)
// rownames -> 행이름 변경
// colnames -> 열이름 변경
4. 새로운 변수 붙이기 (열으로 된) - merge 함수
Omit <- read.csv("Omit.csv")
a <- merge(DF,Omit, by = "name")
-> by 인자를 통해 어떤 것을 기준으로 할 것인지 정해준다.
5. 객체 만들어서 행으로 된 데이터 추가하기
Addcol <- data.frame(name = "홍길동", sex = "남", 등등 )
a <- rbind(DF,Addcol)
// rbind - 행으로 추가
// cbind - 열으로 추가
6. 리스트 만들어서 list에 담기
a <- 1:5
b<- 2:5
c<- 3:5
List <- list(a,b,c) //리스트 만들기
1) 이름 넣기
List <- list( "aa" = a, "bb" = b, "cc" = c)
// 바꾸고 싶은 변수 이름을 앞으로, 뒤에는 원래의 변수를 넣기
2) 항목 삭제하기
List[1] = NULL
//첫번째 리스트 null로 지정
3) 항목 선택하기
- List["aa"]
- List$aa
- List[1]
4) 항목 이름 바꾸기
- names(List)[1] <- "Number"
7. split 함수로 데이터 나누기
a <- 1:5
b <- c("합격","불합격","합격","불합격","합격")
c <- split(a, b)
// split ( 나누고싶은 변수, 기준 )
8. 도수분포표 만들기
a <- table(DF$bloodtype)
b <- prop.table(a) // 상대도수
c <- rbind(a,b)
--> 도수분포표 완성
* addmargins 함수
d <- addmargins(c , margin = 2)
행으로 합계 구할 수 있다.
// margin = : 전체의 합계
margin = 1 : 열의 합계
margin = 2 : 행의 합계