2  Introduction

2.1 R / RStudio Introduction

R은 통계학, 생물통계학, 유전학 등의 연구 분야에서 널리 사용되는 오픈소스 프로그래밍 언어입니다. S 언어에서 파생되었고, 데이터 분석 및 가시화 패키지들이 강점입니다. 최근 인공지능의 관심이 크게 증가하면서 python 언어의 수요가 더 증가하긴 했으나 특히 중,소규모의 데이터 전처리와 가시화, 통계분석 측면에서 여전히 많은 사용자를 확보하고 있는 언어입니다.

R언어가 주목을 받고 두터운 사용자 층을 확보할 수 있게된 핵심 동력이 Rstudio 입니다. Rstudio를 개발한 Posit은 자체적으로 최고수준의 오픈소스 개발팀이 있으며 tidyverse, tidymodel, shiny 등의 데이터 분석 및 가시화 관련 주요 패키지를 개발하였고 정기적으로 conference 개최를 하면서 기술 보급의 핵심 역할을 하고 있습니다. R을 활용한 데이터 분석은 tidyverse 가 나오기 이전과 이후로 분리될 수 있을 정도로 tidyverse는 많은 변화와 효율향상을 이뤄냈습니다.

2.2 Installing R / RStudio

R 사용을 위해서는 R 언어의 코어 프로그램을 먼저 설치하고 그 다음 R 언어용 IDE(Integrated Development Environment)인 RStudio 설치가 필요합니다. Rstudio는 R 언어를 위한 오픈소스 기반 통합개발환경(IDE)으로 R 프로그래밍을 위한 편리한 기능들을 제공해 줍니다.

2.2.1 Installing R

  • R 공식 웹사이트 [https://www.r-project.org/]를 방문하세요. 왼쪽 메뉴 상단에 위치한 CRAN을 클릭합니다.
  • 목록에서 한국 미러 사이트 중 하나를 선택합니다.
  • ‘Windows용 R 다운로드’를 클릭한 다음 ’base’ 링크로 들어갑니다.
  • ’Windows용 R x.x.x 다운로드’를 클릭하여 실행 가능한 프로그램을 다운로드합니다.
  • 다운로드된 R-x.x.x-win.exe 파일을 로컬 컴퓨터에서 실행합니다 (2023년 11월 현재, R의 최신 버전은 4.3.2입니다).
  • 설치 프로그램의 지시에 따라 R 언어 소프트웨어 설치를 완료합니다.

2.2.2 Installing RStudio

  • Posit의 Rstudio 공식 [https://posit.co/] 웹사이트를 방문한 다음, 페이지 상단의 ’Products > RStudio IDE’를 클릭합니다.
  • ‘Open Source Edition’ Free의 ’Download Rstudio Desktop’을 클릭합니다.
  • ’Download Rstudio’의 ’Download Rstudio desktop for windows’를 클릭하여 다운로드를 시작합니다.
  • 다운로드된 RStudio-x.x.x.exe 파일을 로컬 컴퓨터에서 실행합니다 (2023년 11월 현재, RStudio 데스크톱의 최신 버전은 2023.09입니다).
  • 설치 가이드를 따라 설치를 완료합니다.

2.2.3 Posit Cloud

Posit Cloud는 클라우드에서 RStudio를 제공하여 사용자가 설치 및 설정 없이 브라우저에서 직접 RStudio를 사용할 수 있게 합니다.

  • posit.cloud에 방문하여 사용자로 등록합니다 (Google 계정을 사용할 수 있습니다).
  • 로그인하고 ’Cloud Free’를 선택하여 시작합니다.
  • 이 환경에서는 1GB의 RAM과 1 CPU를 무료로 제공합니다.

2.3 RStudio Interface and Keyboard Shortcuts

RStudio는 코드 편집 창, 콘솔 창, 환경 및 파일 패널을 제공합니다.

주요 키보드 단축키

  • 코드 실행: Ctrl + Enter
  • 콘솔 창으로 이동: Ctrl + 2
  • 코드 편집 창으로 이동: Ctrl + 1
  • 저장: Ctrl + S
  • 코드 주석 처리: Ctrl + Shift + C

2.4 Starting a Project

’RStudio’에서 ’파일 > 새 프로젝트’로 가서 새 프로젝트를 시작할 수 있습니다.

  • Hello World Example
  • Create a new R file and execute the following code:
mystring <- "Hello \n world!"
cat(mystring)
print(mystring)

2.5 Getting Help

R은 방대한 도움말 데이터를 제공하며, 다음과 같은 명령어로 특정 함수의 도움말과 예제를 찾아볼 수 있습니다.

help("mean")
?mean
example("mean")
help.search("mean")
??mean
help(package="MASS")

RStudio 치트시트는 다양한 R 기능을 한눈에 알아볼 수 있게 만든 cheatsheet 형태의 문서를 참고할 수 있습니다. 자세한 내용은 Posit Cheatsheets를 참조하세요.

2.6 R 패키지와 데이터셋

R 패키지는 함수와 데이터셋의 묶음으로, 다른 사람들이 만들어 놓은 코드나 기능을 가져와 사용함으로써 코드 작성의 수고로움을 줄이고, 편리하고 검증된 함수(기능)를 빠르게 도입하여 사용할 수 있습니다. 예를 들어 sd() 함수는 stats 패키지에서 제공하는 함수로, 표준편차 계산을 위한 별도의 함수를 만들어서 사용할 필요가 없습니다.

library(UsingR)

2.6.1 패키지 설치 및 로드

패키지는 CRAN 또는 Bioconductor와 같은 저장소에서 구할 수 있으며, 아래와 같이 RStudio를 이용하거나 콘솔창에서 install.packages() 함수를 이용할 수 있습니다.

install.packages("UsingR")

2.6.2 설치 디렉토리 확인하기

R 및 패키지의 설치 디렉토리는 다음 명령어로 확인할 수 있습니다.

.libPaths()
path.package()

2.6.3 패키지 데이터 사용하기

패키지 안에 포함된 데이터도 사용할 수 있으며 data() 함수를 이용해서 패키지 데이터를 사용자 작업공간에 복사해서 사용할 수 있습니다.

data(rivers)
length(rivers)
class(rivers)
data(package="UsingR")
library(HistData)
head(Cavendish)
str(Cavendish)

크리에이티브 커먼즈 라이선스
이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.