Chapter 1 Introduction 강의 개요
- 장소: 한국생명공학연구원 연구동 세미나실 1213호 (매주수요일 13:00~16:00)
- 강사: 한국생명공학연구원 바이오합성연구센터 김하성
- 연락처: 042-860-4372, haseong@kribb.re.kr (생명연 연구동 1143)
- 강의site: https://greendaygh.github.io/Rstat2019/
1.1 Goal 강의 목표
- 이공계열 대학원생이 보다 쉽게 통계 이론을 습득하고 활용하는 능력을 배양하는데 주요 목적이 있음. 특히 데이터 분석용 프로그래밍언어인 R을 기반으로 한 실습을 통하여 프로그래밍 기술 습득과 함께 데이터를 다루는 능력을 배움으로써 이공계 연구에 있어서 필수인 통계적 사고의 기초를 다지는데 그 목적이 있음.
1.2 References 참고 자료
- Using R for Introductory Statistics by John Verzani
- R for Data Science (https://r4ds.had.co.nz, https://github.com/hadley)
- https://resources.rstudio.com/
- 일반통계학 (영지문화사, 김우철 외)
1.3 Evaluation 평가 세부 항목
- 출석 50% / 과제 50% / 80점 이상 S, 80점 미만 U 부여
1.4 Schedule 강의 계획
1주차- R basics / introduction of data
2주차 - Univariate data – Summary statistics 일변량자료 (범주형, 수치형, 분포)
3주차 - Bivariate data – Correlation / Independence 이변량자료 (자료비교, 수치자료의 관계, 단순선형회귀)
4주차 - Multivariate data – R data structure 다변량자료 (다변량, R자료형, R그래픽)
5주차 - Populations – Families of distributions 모집단과 분포
6주차 - Sampling – Distribution and CLT 시뮬레이션, 샘플링
7주차 - Statistical inference 통계적 추론
8주차 - Confidence intervals 신뢰구간
9주차 - Significance test - parameteric 유의성 검정 (모수)
10주차 - Significance test – non parametric 유의성 검정 (비모수)
11주차 - Goodness of fit - parametric 적합도 검정 (모수)
12주차 - Goodness of fit – non parametirc 적합도 검정 (비모수)
13주차 - Linear regression – basics & simple LR 단순회귀모형
14주차 - Multiple linear regression 다중회귀모형
15주차 - Analysis of variance 분산분석
16주차 - Logistic / Non-linear regression 로지스틱/비선형회귀모형
9/25 휴강 (강사 해외 출장)
1.5 References 참고 자료
- R 홈페이지 https://www.r-project.org/
- Rstudio 홈페이지 https://www.rstudio.com/
- Packages for biologists https://www.bioconductor.org/
- R 기본 문서들 (소개, 사용, 설치, 운영)
- R ebooks
- Cheat Sheets