Programming Language/R

R 기초 명령어(excel, ggplot2, rm)

chaerlo127 2022. 4. 8. 00:46
728x90

✨ excel

excel을 읽을 수 있는 package를 다운 받아 excel 내부의 값을 r project로 불러볼 것이다.

install.package("readxl") # readxl package download
library(readxl) # readxl package 불러오기

# xlsx 인 경우-----------------------------------------------------------
excel_file <- read_excel("file.xlsx") # 큰 따옴표 부분은 path 적으면 됨.

# sheet 번호 몇 번째로 불러올 것인지, 이름으로 불러오고 싶으면 sheet="abc" 
excel_file2 <- read_excel("file.xlsx", sheet=1)
excel_file3 <- read_excel("file.xlsx", col_names = F)


# csv 인 경우-----------------------------------------------------------
csv_file <- read.csv("file.csv")
  • read_excel("file.xlsx", sheet=1) : sheet 첫 번째
  • read_excel("file.xlsx", sheet="abc"): sheet name abc로
  • read_excel("file.xlsx", col_names = F): column 타이틀 없이 tuple로 작성되는 것
  • read.csv("file.csv")
  • read.csv("file.csv", header = F) : column 타이틀 없이 tuple로 작성되는 것

 

✨ Data Frame

행과 열로 이루어진 데이터를 저장하는 구조

열: 속성, 행: tuple

korean <- c(100, 99, 89)
math <- c(80, 90, 99)

score <- data.frame(korean, math)

# 한줄로 작성하기
score <- data.frame(korean <- c(100, 99, 89),
                    math <- c(80, 90, 99))

 

 

✨ ggplot2

ggplot2 package 에 내장되어 있는 샘플 데이터 mpg로 data frame을 연습해보고자 한다.

 

install.packages("ggplot2")
library(ggplot2)

# ggplot2의 mpg sample data를 data frame으로 복사한다.
mpg <- as.data.frame(ggplot2::mpg)

# data frame 내부 정보 확인하는 함수----------------------------------------
View(mpg) # 표
head(mpg) # 앞에서 6개
head(mpg, 10) # 앞에서 10개
tail(mpg)  # 뒤에서 6개
tail(mpg, 10) # 뒤에서 10개
dim(mpg) # 행, 열
str(mpg) # 데이터 구조, 변수 개수, 변수 명, 관찰치 개수, 관찰치
summary(mpg) # 기술 통계, mean, midean, min, max etc. 값 나타냄
class(mpg) # data type

#-------------------------------------------------------------------------
mean(mpg$year) # 평균
median(mpg$year) # 중위값

#-------------------------------------------------------------------------
mpg$drv <- as.factor(mpg$drv) # factor, categorical variable로 변경
levels(mpg$drv) # factor이므로 levels 사용 가능
  • View(mpg) # 표
  • head(mpg) # 앞에서 6개
  • head(mpg, 10) # 앞에서 10개
  • tail(mpg)  # 뒤에서 6개
  • tail(mpg, 10) # 뒤에서 10개
  • dim(mpg) # 행, 열
  • str(mpg) # 데이터 구조, 변수 개수, 변수 명, 관찰치 개수, 관찰치
  • summary(mpg) # 기술 통계, mean, midean, min, max etc. 값 나타냄
  • class(mpg) # data type

 

 

✨ Data Frame 내부 변수 지칭 명령어

frame 내부의 변수를 지칭하는 명령어는 $로 나타낸다

mpg$drv

 

 

✨ rm

변수를 생성했는데, 마음에 들지 않아서 데이터를 지우고 싶다면?

rm을 사용하여 데이터를 지울 수 있다.

rm(mpg)
rm(a)
rm(list=ls()) # 모든 데이터 삭제

 

 

728x90