데이터분석/Preprocessing

R - reshape를 이용한 데이터 핸들링

늘근이 2017. 8. 9. 15:51

가끔가다, 앞에 id값을 넣고싶을때가 있다. 1부터 넣고 싶다면 아래와같이 한다. 아 물론 data에는 no라는 컬럼을 추가하고 싶은 상태

> data$no <- 1:nrow(data)

예를들어 다음과 같이 물고기 시세의 행렬이 정해져 있다고 한다.

 date place price type

 2017.04 노량진 27000 광어

 2017.05 가락시장 35000 돌돔

 2017.06 노량진 35000 참돔

...


그런데 이중에 date와 플레이스 제외한 데이터를 그냥 variable과 value로 만들고싶다.

즉,


date place variable value

2017.04 노량진 price 27000

2017.04 가락시장 type 광어



뭐 이런식으로 잔뜩 쪼개고 싶으면 멜트를 시키면 된다.

> melt_result <- melt(data, id = c("date","place"), na.rm=TRUE)


결국 이렇게 계산해야 편리하게 계산을 할수있는 경우가 많은데, melt를 이용해 필요한 컬럼을 다 몽땅 녹여내면 되는것이다.


이 쪼개진 variable에 대한 정보를 알고싶으면 table(result$variable)로 알수있으며, 이를 분석하고 싶으면  cast()함수를 이용해서 가능하다.


>cast(data, date~variable, c(mean, length))

이런식으로 하면될듯하다.





'데이터분석 > Preprocessing' 카테고리의 다른 글

[링크] lag spark scala  (0) 2018.05.05
R에서의 NA처리 na.approx 주의와 NA채우는 꼼수  (0) 2018.04.21
R eval parse 예  (0) 2018.04.13
결측치 제거를 위한 몇가지 팁  (0) 2017.08.13
%in% 연산자..  (0) 2017.08.10