download: http://hannonlab.cshl.edu/fastx_toolkit/download.html


1. libgtextutils-0.6.1.tar.bz2 설치

> wget -r [tools download page link]

> bunzip2 libgtextutils-0.6.1.tar.bz2

> tar -xvf libgtextutils-0.6.1.tar



2. 해당 폴더로 가서 설치

> ./configure --prefix=/my/local/page/libgtextutils-0.6.1

> make

> make install



출처: http://hannonlab.cshl.edu/fastx_toolkit/pkg_config_email.txt

3. path 설정 

> pkg-config --cflags libgtextutils-0.6.1

If your file was installed into "/usr/local/lib..." but pkg-config shows
the following error:
  Package gtextutils-0.1 was not found in the pkg-config search path.
  Perhaps you should add the directory containing `gtextutils-0.1.pc'
  to the PKG_CONFIG_PATH environment variable
  No package 'gtextutils-0.1' found
export PKG_CONFIG_PATH=/my/local/page/libgtextutils-0.6.1:$PKG_CONFIG_PATH
> cp gtextutils.pc libgtextutils-0.6.1.pc
> pkg-config --cflags libgtextutils-0.6.1
-I /my/local/page/libgtextutils-0.6.1/include/gtextutils


4. fastx_toolkit-0.0.13.2.tar.bz2 설치

> wget -r [tools download page link]

> bunzip2 fastx_toolkit-0.0.13.2.tar.bz2

> tar -xvf fastx_toolkit-0.0.13.2.tar



5. 해당 폴더로 가서 설치

> ./configure --prefix=/my/local/page/fastx_toolkit-0.0.13.2

> make

> make install



6. /my/local/page/fastx_toolkit-0.0.13.2/bin 폴더에 fastx toolkit들이 설치된 것을 확인



---------------------------------------------------------------------------------------------------


fastx toolkit 의 fastq_quality_boxplot_graph.sh 명령어 실행 시

fastq_quality_boxplot_graph.sh: line 162: gnuplot: command not found 와 같은 오류 발생.


gnuplot 프로그램을 설치해야 함.


homepage: http://www.gnuplot.info/

download: http://sourceforge.net/projects/gnuplot/files/gnuplot/4.6.3/


1. 프로그램 다운로드

> wget -r [program]



2. 압축을 풀고 해당 폴더로 가서 설치

> tar -xvzf gnuplot-4.6.3.tar.gz

> cd gnuplot-4.6.3

> ./configure

> make

> sudo make install




'Bioinformatics > New Tech' 카테고리의 다른 글

vector trim을 위한 NCBI vecscreen 서버에 설치하기  (0) 2014.01.23
BLAST local db setting  (0) 2014.01.20
GWAS? TCGA? ENCODE?  (0) 2013.11.01
Fold Change  (0) 2013.10.11
미토콘드리아 모계 유전  (0) 2013.07.29
Posted by halloRa
,

sys:1: DeprecationWarning: Non-ASCII character '\xc6' in file filterCIGAR.py on line 5, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 와 같은 에러 발생 시


# This Python file uses the following encoding: utf-8


의 문장을 해당 python 파일 맨 위에 삽입 시켜 주면 해결



--------------------------------------------------------------------------------------------------------------------

윈도우 PC에서 작업 시

출처: http://blog.naver.com/PostView.nhn?blogId=johoonx2&logNo=110154861377&parentCategoryNo=&categoryNo=17&viewDate=&isShowPopularPosts=true&from=search


#-*- coding: cp949 -*-
#-*- coding: utf-8 -*- 


2줄을 코드 페이지 상단에 입력하면 한글이 제대로 출력됨

[출처] [파이썬] 한글처리|작성자 johoonx2


2


'프로그래밍 > Python' 카테고리의 다른 글

Local PC에 파이썬 개발 환경 구축  (0) 2014.07.10
Posted by halloRa
,

출처: http://blog.naver.com/yhk1975?Redirect=Log&logNo=138680860



......핵에 있는 DNA 양에 비하면 미토콘드리아 DNA의 양은 약 1퍼센트 정도 밖에 되지 않지만 다른 고양이의 난자에 들어있던 미토콘드리아의 유전물질 때문에 두 고양이의 털 색깔이 달라진 것으로 유추해 볼 수 있다. 즉 CC (Copy Cat) 가 레인보우와 다른 유전 형질을 가진 것은 난자를 제공한 고양이의 형질을 받았다는 것을 의미한다. 이와 같이 난자에 DNA를 포함한 미토콘드리아가 있다는 것을 알 수 있다.


미토콘드리아가 오로지 모계 유전이 되는 것은 미토콘드리아가 핵이 아닌 세포질 속에 있기 때문이다


......난자도, 정자도 모두 미토콘드리아를 가지고 있다. 정자는 세포질이 없고 중편에 미토콘드리아가 밀집되어 있어 세포 호흡을 통해 정자가 운동하는데 필요한 에너지를 생산한다............난자의 세포막과 정자의 막이 융합하면서 정자의 머리 부분이 난자 속으로 침입하는데, 수정을 하면 정자가 가지고 들어온 미토콘드리아는 난자에 의해 모두 파괴되어 버린다.........정자에 있는 미토콘드리아는 파괴되고 난자의 세포질에 있는 미토콘드리아만이 남게 되기 때문에 수정란에 존재하는 것은 난자의 미토콘드리아가 된다. 즉 모든 생명체는 모계 미토콘드리아를 가지게 된다는 의미이다. 

'Bioinformatics > New Tech' 카테고리의 다른 글

vector trim을 위한 NCBI vecscreen 서버에 설치하기  (0) 2014.01.23
BLAST local db setting  (0) 2014.01.20
GWAS? TCGA? ENCODE?  (0) 2013.11.01
Fold Change  (0) 2013.10.11
FastX toolkit local install  (0) 2013.09.09
Posted by halloRa
,
출처: http://stackoverflow.com/questions/4608187/how-to-reload-bash-profile-from-the-command-line

> source ~/.bash_profile

or

> . ~/.bash_profile


Posted by halloRa
,

TLEN 정의

Bioinformatics/SAM/BAM 2013. 7. 23. 14:47

SAM spec: 

SAM1.pdf


9. TLEN: signed observed Template LENgth. If all segments are mapped to the same reference, the

unsigned observed template length equals the number of bases from the leftmost mapped base

to the rightmost mapped base. The leftmost segment has a plus sign and the rightmost has a

minus sign. The sign of segments in the middle is undened. It is set as 0 for single-segment

template or when the information is unavailable.


: TLEN은 picard에서 insert size를 계산할 때 사용하는 값으로 insert size로도 대표된다.


TLEN case.pptx




'Bioinformatics > SAM/BAM' 카테고리의 다른 글

FLAG 정의  (0) 2013.07.23
Posted by halloRa
,

FLAG 정의

Bioinformatics/SAM/BAM 2013. 7. 23. 13:43

SAM spec: 

SAM1.pdf


flag 계산기: http://picard.sourceforge.net/explain-flags.html


FLAG: bitwise FLAG. Each bit is explained in the following table:

Bit Description

0x0 read aligned in the forward direction (0)

출처: http://seqanswers.com/forums/showthread.php?t=15280


0x1 template having multiple segments in sequencing (1)

: read paired


0x2 each segment properly aligned according to the aligner (2)

: read mapped in proper pair

: 즉, proper pair의 형태로 pair read가 위치하고 있다는 것임. 굳이 양쪽이 모두 mapped되지 않아도 나타날 수 있는 flag. 하지만 mate나 혹은 자기자신이 unmapped flag를 가지고 있더라도 마찬가지로 strand flag를 가지고 있어야 한다. 이럴 경우에는 proper pair flag가 나타나게 된다.

proper_pair_1.pdf

=> 현재 SAM spec이 바뀌면서 each segment properly aligned according to the aligner 로 의미가 바뀜

이를 보면 단순히 aligner에 의해 align(맵핑이 되었든 안되었든)이 되면 해당 flag가 발생. 

무조건 모든 read들의 맵평 결과 flag로 추가되어 나타남을 알 수 있다.


0x4 segment unmapped (4)

: read unmapped


0x8 next segment in the template unmapped (8)

: mate unmapped


0x10 SEQ being reverse complemented (16)

: read aligned in the reverse direction


0x20 SEQ of the next segment in the template being reversed (32)

: mate reverse strand


0x40 the first segment in the template (64)

: first in pair

: read1 파일에서 추출된 read


0x80 the last segment in the template (128)

: second in pair

: read2 파일에서 추출된 read


0x100 secondary alignment (256)

: a read having split hits may have multiple primary alignment records

: splice junction을 찾아주는 도구들을 사용할 경우 볼 수 있음

출처: http://bioinformatics.bc.edu/chuanglab/wiki/index.php/SAM_pairwise_flag_translation_table


0x200 not passing quality controls (512)

0x400 PCR or optical duplicate (1024)


-------------------------------------------------------------------------------------------------

[또다른 이야기]


출처: http://onetipperday.blogspot.kr/2012/04/understand-flag-code-of-sam-format.html

출처: http://seqanswers.com/forums/showthread.php?p=69643#post69643


Each reported read or pair alignment beyond the first has the SAM 'secondary' bit (which equals 256) set in its FLAG field. So, for multiple mapping reads, SAM alignments also contain their strand information. 

btw, For strand-specific RNAseq, the Tophat output SAM (converted from BAM) does not contain XS:A:+/- tag (which is required by cufflinks) for non-spliced reads. In order to get the proper strand info for the assembly, you need to manually add the tags. Here is an example code:



samtools view -h accepted_hits.bam | awk '{if($0 ~ /XS:A:/ || $1 ~ /^@/) print $0; else {if($2==16 || $2==272) print $0"\tXS:A:-"; if($2==0 || $2==256) print $0"\tXS:A:+";}}' accepted_hits.sam

FLAG=256 and 272 is the corresponding version of 0 and 16 for multiple mapped hits.

UPDATE: This only works for single-end lib. For pair-end lib, the FLAG should be odd number, but in any case, reads on minus strand always have 1 on the 5th bit of binary code (e.g. 0x10 =10000). Thanks to Wei's suggestion on this. Here is the updated code:

samtools view -h accepted_hits.bam | awk '{if($0 ~ /XS:A:/ || $1 ~ /^@/) print $0; else {if(and($2,0x10)==16) print $0"\tXS:A:-"; else print $0"\tXS:A:+";}}' accepted_hits.sam


UPDATE2: (from the  final version of RNAseq lecture slides)ØFor non-strand-specific lib, you’re actually sequencing cDNA from both strands. So, the ‘strand’ info in the alignment is senseless (except for the spliced-reads).

ØFor strand-specific lib, if FLAG contains 0x10 (e.g. 0x53=0x40+0x10+0x2+0x1), reads map to ‘minus’ strand,otherwise, ‘plus’ strand.
ØCufflinks requires XS:A:+/- tag (which Tophat doesnt have for some reads). You need to manually add it by command, e.g. for dUTP library (where /2 is from transcript strand, /1 from the opposite strand):
samtools view -h accepted_hits.bam | awk '{if($0 ~ /XS:A:/ || $1 ~ /^@/) print $0; else {if(and($2,0x40) || and($2,0x90)) print $0"\tXS:A:-"; else print $0"\tXS:A:+";}}' accepted_hits.sam



 See my post here:

http://seqanswers.com/forums/showthread.php?p=69643#post69643

If you used a non-strand-specific protocol (which most people still do) you're not actually sequencing transcripts, you're sequencing cDNA with two strands. So the read could come from either of the two strands of a cDNA and you don't have any information which of the two strands corresponds to the original mRNA strand. This can be inferred when a read spans a splice junctions because splice site are highly conserved at the first 2 bases and last 2 bases of an intron. (Thomas Doktor)


# So, the strand info in the SAM alignment for non-strand-specific RNAseq lib cannot be used as evidence of transcript strand.

'Bioinformatics > SAM/BAM' 카테고리의 다른 글

TLEN 정의  (0) 2013.07.23
Posted by halloRa
,

출처: http://stackoverflow.com/questions/3512603/compiling-multiple-packages-using-the-command-line-in-java (compiling multiple packages using the command line in Java)

Hi i have been using an IDE but now I need to run and compile from the command line.

The problem is that I have multiple packages and I have tried to find the answer but nothing has worked.

So I have

src/
  Support/ (.java files)
  Me/ (.java files) 
  Wrapers/ (.java files)  

Do you know how to compile everything with javac?

share|improve this question

This should do it (may require additional classpath elements via the -cp command line switch):

javac Support/*.java Me/*.java Wrapers/*.java

But if your build process gets more complex (and it will!), you should look into using Apache Ant for build automation.

share|improve this answer

출처: http://blog.naver.com/PostView.nhn?blogId=jazz1234k&logNo=40101348073 (jar 파일 만들기, 실행하기 KR)


출처: https://coderwall.com/p/ssuaxa (jar 파일 만들기, 실행하기 EN)


$ javac HelloWorld.java $ echo Main-Class: HelloWorld > MANIFEST.MF $ jar cvmf MANIFEST.MF helloworld.jar HelloWorld.class

$ java -jar helloworld.jar


출처: https://coderwall.com/p/ssuaxa (jar 파일 만들기, 실행하기 EN)


출처: https://blogs.oracle.com/olaf/entry/jdev_including_a_classpath_in (MANIFEST.MF 파일 만들 때)


----------------------------------------------------------------------------


$ javac -d bin src/.../data/*.java src/.../RNASim/*.java src/.../utils/*.java

를 이용하여 컴파일 후


$ vi MANIFEST.MF 

하여


Class-Path: /home/njkoo/program/RNAseqSim/bin/ /home/njkoo/program/RNAseqSim/includes/commons-math-2.2.jar

Main-Class: edu.unc.csbio.RNASim.MainCmdline


와 같이 입력 후 저장


$ jar cvmf MANIFEST.MF RNAseqSim-version.jar bin/.../data/*.class bin/.../RNASim/*.class bin/.../utils/*.class

를 이용하여 jar 파일을 생성하면


$ java -jar RNAseqSim-version.jar 

명령어를 이용하여 프로그램 실행 가능


혹은 jar 파일을 만들지 않고


$java -cp ./bin/:./includes/commons-math-2.2.jar edu.unc.csbio.RNASim.MainCmdline config.txt


$java -cp /home/njkoo/program/RNAseqSim/bin/:/home/njkoo/program/RNAseqSim/includes/commons-math-2.2.jar edu.unc.csbio.RNASim.MainCmdline config.txt


와 같은 명령어를 그냥 사용하여도 실행 가능.



'프로그래밍 > JAVA' 카테고리의 다른 글

JTable에서 열(row) 삭제하기  (0) 2012.11.14
[mysql]  (0) 2012.10.12
Table 만들기  (0) 2012.09.12
Border  (0) 2012.09.12
MFC와 같이 group 묶어주는 titled border  (0) 2012.09.11
Posted by halloRa
,

출처: http://stackoverflow.com/questions/5461972/boostfiltering-streambuf-with-gzip-decompressor-how-to-access-line-by-line



ifstream fin_unmapped_read(output.c_str(), ios_base::in | ios_base::binary);

filtering_streambuf<input> in;

in.push(bzip2_decompressor());

in.push(fin_unmapped_read);

//boost::iostreams::copy(in, cout);


std::istream incoming(&in);
getline(incoming, transfer);


Posted by halloRa
,

출처: http://rasskang.tistory.com/31


cpp 파일들을 array list로 할 경우

첫 번째 방식 사용 불가 -> *.cpp와 같은 확장자 포맷으로 인하여

두 번째 방식을 사용하여야 한다.

'프로그래밍 > SCRIPT' 카테고리의 다른 글

PHP] 파일 읽기  (0) 2011.06.22
PHP] php error 출력 설정  (0) 2011.06.19
html, PHP] form 사용하기  (0) 2011.06.18
php와 mysql 연동  (0) 2011.06.18
Posted by halloRa
,

출처: http://www.daniweb.com/software-development/java/threads/26217/deleting-rows-from-a-jtable


((DefaultTableModel)테이블명.getModel()).removeRow(row_index);

'프로그래밍 > JAVA' 카테고리의 다른 글

리눅스 상에서 jar 파일 만들기  (0) 2013.07.11
[mysql]  (0) 2012.10.12
Table 만들기  (0) 2012.09.12
Border  (0) 2012.09.12
MFC와 같이 group 묶어주는 titled border  (0) 2012.09.11
Posted by halloRa
,