ポスターを貼っていただきました!

스타2 다운로드중

2018年6月22日

기본 프로토콜과 같은, 그리고 rsem 1.2.20. 다운로드 및 설치 지침은 rsem 웹 사이트: http://deweylab.biostat.wisc.edu/rsem/또는 https://github.com/bli25wisc/RSEM를 참조 하십시오. 그것은 rsem ~/star/code/RSEM-1.2.20 옵션에 설치 된 것으로 간주 됩니다: 그것은 주석 없이 매핑 작업을 실행할 수 있습니다 (예를 들어 경우에는 주석을 사용할 수 없습니다) 제거 하 여-sjdbgtffile ~/star/Homo_sapiens. grch 38.79–sjdboverhang 100 옵션. RNA-seq “는 게놈의 맞은편에 신호” (i.e 지도로 나타난) 교차점 읽는의 수로 산출 된다 각 게놈 위치 (뉴클레오티드). 이 신호는 ucsc 게놈 브라우저 (http://genome.ucsc.edu/) 또는 igv 브라우저 (https://www.broadinstitute.org/igv/)와 같은 게놈 브라우저에서 구상 될 수 있다. STAR는 좌표 정렬 bam 파일에서 시작 하 여 신호 파일을 계산할 수 있습니다. sortedByCoord. bam은 대체 프로토콜 3에서 생성 됩니다. 이 프로토콜은 illuminina 좌초 된 tru-seq 프로토콜과 같은 좌초 RNA-seq 데이터와 함께 작동 합니다.

유엔 좌초 된 RNA-seq 자료를 위해 대체 프로토콜 5를 보십시오. 우리는 인코딩 프로젝트에서 rna-seq 데이터를 사용 합니다 (105m 2×101 illuminina GM12878 세포 라인에서 읽습니다, 전체 RNA에 좌초 “dutp” 프로토콜). 두 개의 파일을 다운로드 (“읽기 1″과 “읽기 2″) ~/스타 디렉토리로: 또 다른 일반적인 리소스 문제는 출력 파일을 저장 하기 위한 디스크 공간의 크기입니다. 읽기 수와 길이에 따라 출력 파일은 특히 압축 되지 않은 SAM 형식에서 10 ~ 100 GB의 디스크 공간을 차지할 수 있습니다. 매핑 작업을 시작 하기 전에 출력 파일에 대해 충분 한 디스크 공간을 할당 하는 것이 중요 합니다. 2 .에 있는 gzip으로 압축 fastq 파일을 지도 ~/star/디렉토리 (입력 파일 참조): 기본 프로토콜과 같은, 플러스 커 프 스 단추 2.2.1. 에 커 프 스를 다운로드 하 고 설치 하려면 ~/star/code/directory:이 디렉토리와 모든 필요한 게놈 지 수를 포함 스타-genomedir 디렉토리, 예–genomedir ~/star/ENSEMBL.homo_sapiens.로 직접 사용 가능 GRCh38. 릴리스-79/. 또한 각 디렉토리에는–sjdbgtffile 옵션 (예:–sjdbgtffile ~/star/ENSEMBL)에서 사용할 수 있는 하나 이상의 주석 gtf 파일이 포함 되어 있습니다. GRCh38. 릴리스-79/Homo_sapiens. grch 38.79 2.

스타 실행 디렉토리 ~/star/alt_bam/, 기본 커 프 스 단추를 실행 명령: 1. 대체 프로토콜 3에 따라 sortedByCoord 파일을 생성 합니다. 정렬 되지 않은 bam 파일이 필요 하지 않으면–outsamtype bam SortedByCoordinate 옵션을 사용 하 여 좌표 정렬 파일만 생성 합니다. 명령줄에서–twopasmode 기본 옵션은 2 단계 절차를 활성화 합니다. 4. 생성 한 파일을 검열 하십시오 (크기는 게놈 크기에 따라서 변화할 것 이다): 참고이 파일의 참조는 게놈 SAM/BAM 파일 참조 게놈 시퀀스 (염색체)와는 대조적으로, 대 본 시퀀스 주석이 있습니다. 높은 처리량을 시퀀싱 하는 대량의 집합 매핑 참조 게놈은 RNA-seq 데이터 분석의 기초 단계 중 하나입니다. STAR 소프트웨어 패키지는 높은 수준의 정확성과 속도를 통해이 작업을 수행 합니다. 주석이 달린 비 발한 결합 접속점 검출 이외에, 별은 키메라와 원형 RNA와 같은 더 복잡 한 RNA 순서 배열을 발견 가능 하다.

STAR는 새로운 시퀀싱 기술을 위한 확장성을 제공 하면서 어떤 길이의 접합 된 시퀀스를 적당 한 오류율로 맞출 수 있습니다. STAR는 대 본/유전자 발현 정량화, 차동 유전자 발현, 소설 isoform 재구성, 신호 시각화 등과 같은 많은 다운스트림 분석에 사용할 수 있는 출력 파일을 생성 한다. 이 단원에서는 다양 한 출력 파일을 생성 하 고 다른 RNA-seq 데이터 형식을 사용 하며 서로 다른 매핑 전략을 활용할 전산 프로토콜에 대해 설명 합니다. 별은 유닉스, 리눅스 또는 Mac OS X 체계에 달릴 수 있는 오픈 소스 소프트웨어 이다. –도서관 유형 fr firststrand 매개 변수는 RNA-seq 도서관 의정서에 따라 선택 되어야 한다.

カテゴリー:未分類