• [2021 KRIBB 특강] R을 이용한 생명데이터 분석
  • 1 강의 개요
    • 1.1 참고 교제
    • 1.2 참고 자료
    • 1.3 강의 계획
  • 2 R/Rstudio basics
    • 2.1 What is R / Rstudio
    • 2.2 R / Rstudio Installation
      • 2.2.1 R 설치
      • 2.2.2 Rstudio 설치
    • 2.3 Rstudio interface
      • 2.3.1 Keyboard shortcuts
      • 2.3.2 Exercise
      • 2.3.3 Set a project
    • 2.4 R programming
      • 2.4.1 Console calculator
      • 2.4.2 Exercise
      • 2.4.3 Variables and values
      • 2.4.4 Exercise
      • 2.4.5 Functions
      • 2.4.6 Exercise
    • 2.5 Terminology
    • 2.6 Supports
      • 2.6.1 Help
      • 2.6.2 Cheatsheet
    • 2.7 R packages and Dataset
      • 2.7.1 R packages
      • 2.7.2 Data sets
  • 3 Tidyverse for Data science
    • 3.1 Tibble object type
    • 3.2 Tidy data structure
    • 3.3 Pivoting
      • 3.3.1 Exercise
    • 3.4 Separating and uniting
    • 3.5 dplyr and pipe operator
      • 3.5.1 Exercise
    • 3.6 dplyr - Important functions
      • 3.6.1 filter
      • 3.6.2 arrange
      • 3.6.3 select
      • 3.6.4 mutate
      • 3.6.5 summarise
      • 3.6.6 join
    • 3.7 Airquality example
      • 3.7.1 Exercise
  • 4 ggplot2 for data visualization
    • 4.1 Basics
    • 4.2 Bar graph
    • 4.3 Line graph
    • 4.4 Smoothing
    • 4.5 Statstics and positions
    • 4.6 Facets
      • 4.6.1 Exercise
      • 4.6.2 Exercise
    • 4.7 Themes, Labels, and Scales
      • 4.7.1 Exercise
    • 4.8 ggplot examples
      • 4.8.1 Violin plot
      • 4.8.2 Bubble plot
      • 4.8.3 Barplot with errorbars
      • 4.8.4 horizontal barplot
      • 4.8.5 Circular barplot
      • 4.8.6 Stacked area chart
      • 4.8.7 Density plot
      • 4.8.8 Waffle chart
      • 4.8.9 Marginal histogram
      • 4.8.10 Density ridgeline plots
  • 5 Day1 강의 정리
    • 5.1 Class 1 - 기초, 사용법, 프로그래밍
      • 5.1.1 목표
      • 5.1.2 Rstudio
      • 5.1.3 Rmarkdown 사용법
      • 5.1.4 변수
      • 5.1.5 함수
      • 5.1.6 지역변수 광역변수
    • 5.2 Class 2 - 데이터의 이해
      • 5.2.1 목표
      • 5.2.2 tibble
      • 5.2.3 tidy data
    • 5.3 class 3 - 데이터 형변환의 이해
      • 5.3.1 목표
      • 5.3.2 파이프오퍼레이터
      • 5.3.3 dplyr 사용
      • 5.3.4 예제
      • 5.3.5 스크립트 활용
  • 6 Bioconductor
    • 6.1 Packages
      • 6.1.1 Installation
    • 6.2 Learning and support
    • 6.3 Class, Object and Method
    • 6.4 Bioconductor의 OOP
      • 6.4.1 Exercise
  • 7 Working with DNA sequences
    • 7.1 Biostrings
      • 7.1.1 DNAString
      • 7.1.2 DNAStringSet
      • 7.1.3 Exercise
      • 7.1.4 Apply functions
      • 7.1.5 XStringView
      • 7.1.6 sequence read and write
      • 7.1.7 Exercise
    • 7.2 Sequences from NCBI
      • 7.2.1 Exercise
    • 7.3 Sequence statistics
      • 7.3.1 Exercise
    • 7.4 Align two sequences
  • 8 Day2 강의 정리
    • 8.1 Class 1 - ggplot 활용 1
      • 8.1.1 목표
      • 8.1.2 ggplot 문법
      • 8.1.3 facet 사용법
    • 8.2 Class 2 - ggplot 활용 2
      • 8.2.1 목적
      • 8.2.2 theme 사용
    • 8.3 class 3 - S3 클래스 학습
      • 8.3.1 목적
      • 8.3.2 S3 클래스 이해
      • 8.3.3 Biostrings 패키지
    • 8.4 class 4 - Biostrings 활용
      • 8.4.1 목적
  • 9 Working with DNA sequences II
    • 9.1 Sequences from NCBI
      • 9.1.1 Exercise
    • 9.2 Pattern matching
    • 9.3 Align two sequences
    • 9.4 Multiple sequence alignment
    • 9.5 Phylogenetic trees with clustering
  • 10 Genomic data analysis
    • 10.1 IRanges
    • 10.2 Genomic ranges
      • 10.2.1 Exercise
    • 10.3 ORFinder with Docker
      • 10.3.1 Exercise
  • 11 Day3 강의 정리
    • 11.1 Class 1 - NCBI 서열 download
    • 11.2 class 2 - sequence alignment
    • 11.3 class 3 - genomic data with ranges
      • 11.3.1 Exercise
    • 11.4 class 4 - ORFfinder with docker
      • 11.4.1 Exercise
  • 12 Practice for review
  • 13 BLAST on local machine
  • 14 High-throughput genomic data
    • 14.1 Sequence Read Archive
    • 14.2 Gene expression omnibus (GEO)
    • 14.3 SummarizedExperiment Class
  • 15 Bioconductor Workflow (link)
  • 16 Day4 강의 정리
    • 16.1 class 1 - 학습내용리뷰
    • 16.2 class 2 - docker based blast
    • 16.3 class 3 - Blast 출력 분석
    • 16.4 class 4 - Bioconductor workflow 리뷰
  • 17 References
  • Published with bookdown

2021 한국생명공학연구원 연구데이터 분석과정

Chapter 15 Bioconductor Workflow (link)

Bioconductor에서는 다양한 생물학적 데이터를 분석하기 위한 툴이 개발되고 있으며 이러한 툴들은 RNA-seq과 같은 특정 목적을 위해 반복적으로 또는 순차적으로 수행되어야 하고 이러한 일련의 툴 사용 방법을 workflow로 만들어 제공하고 있습니다. 일부 워크플로에 대해서 간단히 리뷰하며 마치도록 하겠습니다.

workflow


크리에이티브 커먼즈 라이선스
이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 4.0 국제 라이선스에 따라 이용할 수 있습니다.