데이터 전처리 1. filter()

# 데이터 전처리 (Data Transformation, Data Wrangling)
# Raw Data, 약간은 정리되지 않은 데이터

library(tidyverse)
install.packages("nycflights13") ## data (sample 예제 데이터)
# 여기서 왜 영어로 진행을 하는 이유는 <- 한글 맥북이나 윈도우 한글깨짐과
library(nycflights13)

data(flights)
glimpse(flights)

# int ==> 숫자형
# dbl ==> real numbers
# chr ==> 문자열
# date ==> stands for dates # GA ==> date

# Filter() 필터, 조건
# 2018, 3, 25

# 방법 1
march_25 <- filter(flights, month == 3, day == 25)
#                   data, 조건1 == 원하는 값, 조건2 == 원하는 값

year_month_day <- select(march_25, year, month, day)

# 방법 2
year_month_day2 <- flights %>% 
  filter(month == 3, day == 25) %>% 
  select(year, month, day)

# %>% # Chain, Pipe
  
# data %>% (연결고리) filter(조건 == 원하는 값, 조건 2 == 원하는 값)

# Christmas 12월 25일 

# 데이터 갯수가 몇개인지 확인 부탁드립니다. (관측치가 몇개인지 )
# 방법1 & 방법2 
christmas <- flights %>% 
  filter(month == 12, day == 25) %>% 
  select(year, month, day)

 

  • 커리큘럼
  • 질문 및 토론
  • 참고자료

커리큘럼

  • [Educast] 1. R이란 무엇인가요?

    0:08:52

  • 데이터 전처리 (Data Transformation)
  • 데이터 전처리 1. filter()

    0:12:52 맛보기

  • 데이터 전처리 2. select()

    0:07:43

  • 데이터전처리 3. mutate()

    0:07:46

  • 데이터전처리 4. arrange()

    0:07:28

  • 데이터 전처리 5. summarise

    0:08:38

  • 데이터 시각화 (Data Visualization)
  • [Educast] 데이터 시각화 - 기본 이론

    0:12:36

  • [Educast] 데이터 시각화 수량변수 1개일 때

    0:15:50

  • [Educast] 데이터 시각화 수량변수 2개일 때

    0:16:58

  • [Educast] 데이터 시각화 범주형 변수 1개일 때

    0:17:18

  • [Educast] 데이터 시각화 범주형 변수 2개일 때

    0:13:28

  • [Educast]데이터 시각화 범주형_수량형 변수 1개

    0:22:01

  • 데이터 시각화 - facet_grid() & shape

    0:17:20

  • ggplot_theme 알아보기

    0:17:49

수강 신청 후에 확인하실 수 있습니다.