Language/R

[R] 데이터 분석 기초

Jonnie 2021. 10. 5. 07:45

Excel 파일 불러오기 & 데이터프레임 내보내기

1. Excel 파일 불러오기

  • 기본 명령문: df <- read_excel("파일명.xlsx", sheet=???)

→ data sheet가 여러 개일 때는 지정 필요

→ readxl 패키지의 함수

2. DataFrame 내보내기

csv 형식

  • write.csv(df, file="파일명.csv")

→ 내장 함수 이용

excel 형식

  • wwrite_xlsx(df, path="파일명.xlsx")

→ writexl 패키지의 함수


연산자

1. 비교 연산자

  1. 같다: ==
  2. 같지 않다: !=
  3. 크다: <
  4. 작다: >
  5. 이상: <=
  6. 이하: >=

2. 논리 연산자

  1. 그리고: &
  2. 또는: |
  • 매치 연산자(%in%)와 c()를 함께 사용하면 간단하게 표현 가능
    • table(exam$address == "효창동" | exam$address == "청파동" | exam$address == "서계동")
      
      #간단하게 표현하기
      table(exam$address %in% c("효창동", "청파동", "서계동"))

변수명 바꾸기

mpg 데이터

  • ggplot2 패키지에 내장된 데이터 (miles per gallon, 부피단위)
  • head(mpg)를 통해 데이터 탐색
  • mpg라는 이름의 데이터 프레임 만들기
  • mg에 대한 탐색적 데이터 분석: str(), summary(), table() 사용

변수명 바꾸기

  • dplyr 패키지에 있는 rename()을 이용하여 바꾸기
    • 기본 명령문: df <- rename(df, var(new) = var(existing))
      • #mpg의 fl(연료)을 fuel로 바꾸기
        mpg <- rename(mpg, fuel = fl)
    • 변수명 변경 후, 바뀐 변수명을 데이터 프레임에 저장할 것
  • mpg 원본을 가져오는 명령어: mpg <-ggplot2::mpg

측정값 바꾸기

조건문 함수(ifelse)

  • 기본 명령문: ifelse(조건, 부합할 경우 값, 아닐 경우 값)
  • ifelse를 통해 변수의 측정값을 바꾼 경우, 그 결과를 해당 변수에 반드시 저장해야 함