Chapter 1 Introduction 강의 개요

  • 장소: 한국생명공학연구원 연구동 세미나실 1213호 (매주수요일 13:00~16:00)
  • 강사: 한국생명공학연구원 바이오합성연구센터 김하성
  • 연락처: 042-860-4372, (생명연 연구동 1143)
  • 강의site: https://greendaygh.github.io/Rstat2020/

1.1 Goal 강의 목표

  • 이공계열 대학원생의 원활한 실험 설계와 데이터 분석을 위한 범용 프로그램 언어인 R의 사용법과 프로그래밍 기술의 습득이 목표. 특히 Data scientist를 위해 개발된 tidyverse와 ggplot2 패키지 사용법을 위주로 강의와 실습을 진행하며 후반부 대규모 서열 데이터를 이용한 실습을 통해 R의 활용 기술을 학습함

1.2 This course

  • R 사용에 대한 기본 개념과 프로그래밍을 중심으로 필요시 기초 통계지식 강의
  • 실습 데이터로는 교제에서 제공되는 예제 데이터와 생물학 서열 등 대규모 데이터를 사용한 분석 진행
  • 모든 강의 시간 실습을 위한 개인 노트북 지참 필수
  • 강의 자료는 강의 웹사이트에 수업 전 업데이트됨
  • 상황에 따라 강의 일정이 조정될 수 있음
  • 과제물은 필요에 따라 수업 후 제공되며 다음 수업 전까지 메일로 제출

1.3 Tips

  • 눈으로 이해하지 않고 스스로 실습 필수
  • 각 명령줄이 어떻게/왜 작동하는지 이해하기
  • 인터넷 검색을 통한 다른사람의 코드를 적극적으로 이해하고 적용 필요

1.4 References books 참고 교제

1.5 References 참고 자료

1.6 Evaluation 평가 세부 항목

  • 출석 50% / 과제 50% / 80점 이상 S, 80점 미만 U 부여

1.7 Schedule 강의 계획

  • 1주차 - Introduction and installation of R/Rstudio
  • 2주차 - R language basics I – Interface, operations, packages, help, NULL, NA, and NaN
  • 3주차 - R language basics II - data type and structure
  • 4주차 - R language basics III – if, for, while
  • 5주차 - R programming – Maze Robot (function, matrix) I
  • 6주차 - R programming – Maze Robot (function, matrix) II
  • 7주차 - Data manipulation I - read, write, rbind, cbind, split, subset
  • 8주차 - Data manipulation II - dplyr, apply, reshape
  • 9주차 - Visualizing data in R I – plot, hist
  • 10주차 - Visualizing data in R II – ggplot2
  • 11주차 - Visualizing data in R III – ggplot2
  • 12주차 - Shiny for interactive applications in R I
  • 13주차 - Shiny for interactive applications in R II
  • 14주차 - Data analysis #1
  • 15주차 - Data analysis #2
  • 16주차 - Data analysis #3