coding region

대학원/바이오 2012. 2. 20. 12:53

Regions of DNA/RNA sequences that code for proteins. Usually starts with a start codon (ATG) and ends with a stop codon.

위키피디아 : http://translate.google.co.kr/translate?hl=ko&sl=en&tl=ko&u=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FCoding_region&anno=2

'대학원 > 바이오' 카테고리의 다른 글

Single-Letter Amino Acid Code  (0) 2012.07.20
GC content  (0) 2012.04.11
Codon Bias  (0) 2012.04.10
CpG islands  (0) 2011.10.06
인간세포 기능 보존한 '최소 핵심구조' 찾았다  (0) 2011.06.23
Posted by halloRa
,

출처: http://www.joon.pe.kr/blog/161, http://phiz.kr/linuxtip/356775

'split -b 용량'과 같이 명령어 입력.
용량은 K, M, G와 같이 단위도 입력해주어야 한다.
* 옵션
-b size : 파일을 byte 단위로 분리
-l line : 파일을 주어진 line 수 단위로 분리
-C size : 파일을 한 줄에 최대 size 바이트 만큼씩 분리


다시 합칠 때
'cat 분할된파일이름 > 합칠파일이름'과 같이 명령어 입력.

Posted by halloRa
,

출처: http://oskorean.com/bbs/board.php?bo_table=B13&wr_id=33

현재 실행되고 있는 작업을 background로 돌리고 싶다면

ctrl+z 한 다음
'bg' 명령어를 입력.

이렇게 하면 현재 실행 중인 작업이 일시 멈춤이 되고 bg 명령어로 인해 백그라운드 실행되게 된다.

백그라운드에서 진행 중인 작업을 확인하려면
'jobs' 명령어를 입력.

다른 작업 후 다시 진행 상황을 보고 싶을 때는
'fg' 명령어를 입력.
Posted by halloRa
,

wc -l 파일이름

*주의! \n 도 라인 수에 들어감!

Posted by halloRa
,


1. string형에서 바꾸고자 할 때

#include <algorithm>
#include <cctype>
// 위의 2개의 라이브러리 추가

string s;

> lowercase all characters
transform (s.begin(), s.end(),  s.begin(), tolower);                 
   
> uppercase all characters
transform (s.begin(), s.end(), s.begin(), toupper);    

[출처] http://blog.naver.com/PostView.nhn?blogId=young4862&logNo=100088120933&redirect=Dlog&widgetTypeCall=true



2. char형에서 바꾸고자 할 때

#include <string>
// string 라이브러리가 있어야 사용 가능

char c[20];

> lowercase all characters
strlwr(c);

> uppercase all characters
strupr(c);

[출처] http://blog.naver.com/PostView.nhnblogId=young4862&logNo=100088120933&redirect=Dlog&widgetTypeCall=true


'프로그래밍 > C/C++' 카테고리의 다른 글

반올림 함수  (0) 2012.03.28
Single char to int  (0) 2012.03.15
getline(cin, temp);  (0) 2011.09.26
Visual Studio 2010에서 콘솔 창이 바로 꺼질 때  (0) 2011.06.22
C++ string tokenizer  (0) 2011.05.27
Posted by halloRa
,

CpG islands

대학원/바이오 2011. 10. 6. 15:13


naver 사전에 따르면,
유전체 상에 섬모양으로 띄엄띄엄 떨어져있는 CpG배열이 많이 포함되는 영역. 길이가 수백 염기쌍으로 유전체의 다른 영역에 비하여10배 이상의 CpG배열을 가지며 포유류에서는 유전체 상에 약30,000 정도가 존재한다.CpG배열의 시토신은 메틸화를 받기 쉽고5-메틸시토신이 탈아미노화하면 티민으로 변하기 때문에 오랜 진화의 과정에서CpG배열은 서서히 TpG배열로 교체되어 왔다. 생식세포 내에서는 난이나 정자에 필요한 것 이외의 조직 특이적인 유전자프로모터영역은 불활성이기 때문에 메틸화를 받아 그 결과로CpG배열을 상실한다고 생각된다. 한편 세포의 생존에 불가결한 단백질을 코드하고 있는 유전자, 즉 하우스키핑유전자(housekeeping gene) 대부분은 활성화되어 있기 때문에 메틸화를 받지 않고 이 배열은 보존되어 왔다. 이 때문에 CG섬 대부분은 하우스키핑유전자의 프로모터영역에 존재하게 된다.

대부분의 말들이 상당히 이해 불가.
그래서 나름 매우 상당한 부분을 책이나 검색을 통하여 알아봄.

http://blog.naver.com/mulddang?Redirect=Log&logNo=140003480655 
이 블로그에서 유전자 조절에서의 methylation에 대해 매우 쉽게 설명된 아래의 자료를 찾음.

유전자 조절 기작을 밝혀내는데 DNA의 메틸화를 연구하는 학문을 후성학(epigenetics;後成學)이라고 한다. 게놈프로젝트의 연구가 거의 마무리 되었고 그 뒤를 이어 프로테오놈 프로젝트가 시행되는 이른 바 포스트 게놈 시대가 도래되었다. 과학자들은 이러한 연구에서 얻은 정보를 이용하여 의학에 적용하거나 신약개발에 활용하는 일에 최선을 다하고 있다. 그러나 이를 위해서는 단백질을 만드는 유전자의 기능과 조절 기작이 우선 밝혀져야 한다.

일반적인 유전학관점에서 중요한 현상은 염기가 바뀌는 돌연변이가 있지만 후성학에서는 염기에 메틸기가 붙는 메탈화 과정이다.  게놈의 염기서열에 C와 G의 두 염기가 나란히 존재하는 것을 CpG라고 한다.  이 배열에서 시토신이 메틸화되는 경향이 많아 인간게놈의 경우 전체 시토신 중 3~4%는 메틸화 되어 있다.(책에서는 "정상적으로 포유동물 유전체에서 약 70~80%의 CG dionucleotide가 methylation되어 있다."라고 함 [출처]분자생물학 입문서)

CpG는 진화과정에서 점차 감소되어 왔다. 게놈에 존재하는 CpG의 메틸화 정도와 패턴은 포유동물의 종에 따라 다르고 조직에 따라서도 다른 매우 특이적인 양상을 보이고 있다.

포유동물의 염기서열에는 CpG가 밀집되어 있는 'CpG 섬(island)'이라는 부위가 존재한다.  이 부위는 0.5~4kb 정도로 게놈의 유전자와 밀접한 연관성을 가지고 있는 것으로 생각된다. 이 CpG섬은 유전자의 전사과정을 조절하는 프로모터 부근에 위치한다.

대부분 존재하는 CpG 섬은 메틸화 되지 않았으며 따라서 CpG섬의 메틸화는 중요한 의미를 가지고 있다.

부모에서 물려받은 각 염색체의 유전자가 모두 기능할 때 유전이상이 발생하는 유전자군이 수 십종이나 된다. 따라서 어느 한쪽의 유전자만 발현되어야만 한다. 이러한 과정을 유전체 각인(GENOMIC IMPRINTING)이라고 하며 이러한 조절을 받는 유전자를 각인 유전자라고 한다.

이러한 각인 현상이 가능한 이유는 수정란의 발생단계 초기에서 해당 유전자의 CpG 섬이 선택적으로 메틸화되어 발현을 막기 때문이다. 메틸화되지 않은 대립 유전자 만이 발현됨으로써 유전자용량(gene dosage)이 조절되는 것이다.  또한 각인 현상은 X염색체를 2개를 가지고 있는 여성에서 볼 수 있는 바(bar)체에서도 볼 수 있다. 아울러 조직에서도 조직에 따라 특이적으로 CpG섬의 메틸화가 발생해 발현이 조절되는 것으로 알려졌다.

CpG메틸화는 외부에서 유입되는 트랜스포손과 같은 이동성 유전자들의 기능을 무력화시키는 방어기작이 되기도 한다. 외부 유입유전자들의 프로모터 CpG섬이 메틸화돼 유전자 발현이 원천봉쇄된다. 시간이 경과함에 따라 메틸기가 붙은 시토신이 티민으로 치환되어 결국에는 이동성 유전자들이 점차 기능을 상실하는 것으로 생각된다. 아울러 암발생의 원인으로 암을 억제하는 유전자의 기능이 이들 유전자의 CpG섬에 메틸화라는 연구결과도 나오고 있다. 암억제유전자의 기능소실은 돌연변이, 결실, 그리고 프로모터 영역의 메틸화로 일어나게 된다.


찾고 나서 또 다른 곳을 찾아보니
http://chem.ewha.ac.kr/cgi-bin/technote/read1.cgi?board=funnystory&nnew=2&y_number=3 의 원출처를 찾게된 것 같음.
또 다른 의미로 유용한 자료이니 참고할 것.

혹시나 궁금해하시는 분들이 있을까봐 위에서 CpG의 p는 인산기를 의마한다고 함.

'대학원 > 바이오' 카테고리의 다른 글

Single-Letter Amino Acid Code  (0) 2012.07.20
GC content  (0) 2012.04.11
Codon Bias  (0) 2012.04.10
coding region  (0) 2012.02.20
인간세포 기능 보존한 '최소 핵심구조' 찾았다  (0) 2011.06.23
Posted by halloRa
,

자꾸 헷갈려서 짜증나서 정리.

cin.getline()이 있고
getline()이 있다.


1. cin.getline();
char temp[size];
cin.getline(temp, 256);


2. getline();
string temp;
getline(cin, temp);

더 자세한건 찾아보도록!


'프로그래밍 > C/C++' 카테고리의 다른 글

Single char to int  (0) 2012.03.15
C++에서 소문자, 대문자 바꾸기  (0) 2011.10.11
Visual Studio 2010에서 콘솔 창이 바로 꺼질 때  (0) 2011.06.22
C++ string tokenizer  (0) 2011.05.27
String to Integer & Integer to String  (0) 2011.05.27
Posted by halloRa
,


1. [파일이름].tar
압축 : tar -cvf [압축될 파일이름].tar [압축할 파일이름]
풀기 : tar -xvf [압축된 파일이름].tar


2. [파일이름].tar.gz, [파일이름].tgz, [파일이름].tar.z
압축 : tar -zcvf { [파일이름].tar.gz , [파일이름].tgz, [파일이름].tar.z } [압축할 파일이름]
풀기 : tar -zxvf { [파일이름].tar.gz , [파일이름].tgz, [파일이름].tar.z }


3. [파일이름].tar.bz2
압축 : tar -jcvf [파일이름].tar.bz2 [압축당할 파일이름]
풀기 : tar -jxvf [파일이름].tar.bz2


4. [파일이름].zip
압축 : zip [파일이름].zip [압축당할 파일이름]
풀기 : unzip [파일이름].zip


5. [파일이름].gz

압축: gzip -1/9 [파일이름] ; 1의 경우 faster, 9의 경우 better

풀기 : gunzip [파일이름].gz


6. [파일이름].bz2
풀기 : bunzip2 [파일이름].bz2

출처: http://mokuzin21.egloos.com/2363138

출처: http://blog.ohmynews.com/casiopea/131126

Posted by halloRa
,

'대학원 > 바이오' 카테고리의 다른 글

Single-Letter Amino Acid Code  (0) 2012.07.20
GC content  (0) 2012.04.11
Codon Bias  (0) 2012.04.10
coding region  (0) 2012.02.20
CpG islands  (0) 2011.10.06
Posted by halloRa
,

$fp = fopen('해당주소', '파일모드');

해당 주소 부분에는 열고자 하는 파일이 있는 경로를 적어주고,
파일 모드는 아래와 같다.
r : 파일을 읽기 전용으로 연다. 파일의 처음에서 시작한다.
r+ : 파일을 읽고 쓰기 위해 연다. 파일의 처음에서 시작한다.
w : 파일을 쓰기 전용으로 연다. 파일의 처음에서 시작한다. 만약 파일이 있을 경우 먼저 있던 내용은 지우고 없다면 새로 만든다.
w+ : 파일을 읽고 쓰기 위해 연다. 나머지 내용은 w와 같다.
x : 파일을 쓰기 위해 연다. 만약 파일이 있을 경우 파일을 열지 않고 fopen()은 false로 반환하고 PHP는 경로를 낸다.
x+ : 파일을 읽고 쓰기 위해 연다. 나머지 내용은 x와 같다.
a : 파일을 추가하기 위해 연다. 현재 있는 내용의 끝에서 시작한다. 만약 파일이 없다면 새로 만든다.
a+ : 파일을 읽고 추가하기 위해 연다. 나머지 내용은 a와 같다.
b : 다른 모드들과 합쳐서 사용한다. 바이너리와 텍스트 파일을 구별하는 경우에반 사용할 수 있다. windows에서는 구별하며 unix에서는 구별하지 않는다. 이동성을 높이기 위해 항상 이 모드를 사용하는 것이 좋다. 바이너리 모드가 기본값이다.
t : 다른 모드들과 합쳐서 사용한다. 이 모드는 windows 시스템에서만 사용할 수 있다. 코드를 b 옵션으로 사용하도록 바꾸고 난 뒤가 아니라면 t 옵션은 사용하지 않는 편이 좋다.

실제 파일을 열고 나면 파일 안의 데이터를 읽어 와야 되는데 그럴 때 사용하는 함수로는 3개가 있다.

$data = fgets($fp, 999);
fgets() 함수는 파일에서 한 줄씩 읽는다. 이 경우 파일의 줄바꿈 문자나 EOF를 만나지 않는다면 998바이트를 읽을 때까지 진행한다.

$data = fgetss($fp, 999, "특정 태그");
fgetss() 함수는 읽어들인 문자열에서 PHP와 HTML 태그를 모두 제거한다. 특정 태그를 남겨두려면 적어준다.

$data = fgetcsv($fp, 999, "delimiter");
fgetcsv() 함수는 파일에서 읽은 문자열을 구분 문자로 나누어서 배열에 저장한다. 가운데는 length 파라미터인데, 이 값은 읽으려는 한 줄의 길이보다 좀 더 길어야 한다.

$data = fgetc($fp);
fgetc() 함수는 파일에서 한번에 한 문자씩 읽어들인다.

책에서 보면 상대 경로를 지정해서 사용하는 것이 이식성 때문에 좋다고 나와있는데
왜 나는 상대 경로를 지정하지 작동이 되지 않는지 모르겠다.
일단 절대 경로를 지정 해놓았는데 나중에 시간이 나면 다시 고쳐 봐야겠다.

출처: 성공적인 웹 프로그래밍 PHP와 MySQL 제 3판

'프로그래밍 > SCRIPT' 카테고리의 다른 글

shell] array 사용  (0) 2013.06.12
PHP] php error 출력 설정  (0) 2011.06.19
html, PHP] form 사용하기  (0) 2011.06.18
php와 mysql 연동  (0) 2011.06.18
Posted by halloRa
,