Полная версия страницы  English  

Что такое STS? Чем отличается mRNA от CDS?

Alexy, 29.04.2010 15:55
Вот кусок хромосомы (длиной в 2 гена) в формате Genbank

... gene complement(12186..14801)
/gene="nhr-80"
/locus_tag="H10E21.3"
/note="Nuclear Hormone Receptor family"
/db_xref="GeneID:175167"
/db_xref="WormBase:WBGene00003670"
mRNA complement(join(12186..12401,12476..12627,12965..13391,
13464..13682,13812..14083,14522..14686,14741..14801))
/gene="nhr-80"
/locus_tag="H10E21.3"
/transcript_id="NM_064725.3"
/db_xref="GI:193210024"
/db_xref="GeneID:175167"
/db_xref="WormBase:WBGene00003670"
mRNA complement(join(12189..12401,12476..12627,12965..13391,
13464..13682,13812..14083,14522..14753))
/gene="nhr-80"
/locus_tag="H10E21.3"
/transcript_id="NM_181901.1"
/db_xref="GI:32564283"
/db_xref="GeneID:175167"
/db_xref="WormBase:WBGene00003670"
CDS complement(join(12189..12401,12476..12627,12965..13391,
13464..13682,13812..14083,14522..14686,14741..14753))
/gene="nhr-80"
/locus_tag="H10E21.3"
/inference="similar to RNA sequence, EST (same
species):INSD:AU110482.2"
/inference="similar to RNA sequence, EST (same
species):INSD:AU114413.1"
/inference="similar to RNA sequence, EST (same
species):INSD:AV197155.1"
/inference="similar to RNA sequence, EST (same
species):INSD:BJ755322.1"
/inference="similar to RNA sequence, EST (same
species):INSD:BJ779487.1"
/inference="similar to RNA sequence, EST (same
species):INSD:BJ796495.1"
/inference="similar to RNA sequence, other RNA (same
species):INSD:CB405648.1"
/codon_start=1
/protein_id="NP_497126.1"
/db_xref="GI:17553874"
/db_xref="GeneID:175167"
/db_xref="WormBase:WBGene00003670"
CDS complement(join(12189..12401,12476..12627,12965..13391,
13464..13682,13812..14083,14522..14753))
/gene="nhr-80"
/locus_tag="H10E21.3"
/inference="similar to RNA sequence, mRNA (same
species):INSD:CK584504.1"
/inference="similar to RNA sequence, other RNA (same
species):INSD:BI174764.1"
/codon_start=1
/protein_id="NP_871630.1"
/db_xref="GI:32564284"
/db_xref="GeneID:175167"
/db_xref="WormBase:WBGene00003670"
STS 13103..14054
/standard_name="H10E21.3"
/db_xref="UniSTS:312656"
STS 15681..17220
/standard_name="H10E21.1"
/db_xref="UniSTS:313206"
gene 16180..17279
/locus_tag="H10E21.1"
/db_xref="GeneID:186718"
/db_xref="WormBase:WBGene00019182"
mRNA join(16180..16251,16521..16938,17148..17279)
/locus_tag="H10E21.1"
/transcript_id="NM_064726.3"
/db_xref="GI:71987598"
/db_xref="GeneID:186718"
/db_xref="WormBase:WBGene00019182"
CDS join(16807..16938,17148..17279)
/locus_tag="H10E21.1"
/inference="similar to RNA sequence, other RNA (same
species):INSD:BI175370.1"
/inference="similar to RNA sequence, other RNA (same
species):INSD:CV122816.1"
/inference="similar to RNA sequence, other RNA (same
species):INSD:CV122817.1"
/codon_start=1
/protein_id="NP_497127.2"
/db_xref="GI:32564149"
/db_xref="GeneID:186718"
/db_xref="WormBase:WBGene00019182"...

А что такое STS?
Чем отличается mRNA от CDS?
Тем, что CDS получены картированием реально транслируемых с хромосомы белков?
А mRNA получены именно в виде РНК?
bluebird, 02.05.2010 18:06
Процитирую Bioinformatics for Dummies
"CDS (CoDing Segment) introduces a complex section that describes the gene’s open reading frame (ORF). The first line indicates the coordinates of the ORF from its initial ATG to the last nucleotide of the first stop codon TAA. Each of the following lines (indented at the same level) gives the name of a protein product, indicates the reading frame to use, the genetic code to apply, and a number of IDs for the protein sequence. /translation, the final keyword of the CDS section, introduces the conceptual amino-acid sequence of the coding segment. This sequence is a computer translation that uses the coordinates, reading frame, and genetic code indicated in the preceding lines."

а из GeneBank glossary:
"STS
A short DNA segment that occurs only once in the human genome, the exact location and order of bases of which are known. Because each is unique, STSs are helpful for chromosome placement of mapping and sequencing data from many different laboratories. STSs serve as landmarks on the physical map of the human genome."
Alexy, 05.05.2010 08:12
Большое спасибо!
Ещё из GenBank glossary http://www.ncbi.nlm.nih.gov/bookshelf/br.f...ook&part=A1237:

mRNA
messenger RNA. mRNA describes the section of a genomic DNA sequence that is transcribed, and can include the 5' untranslated region (5'UTR), CDS, and 3' untranslated region (3'UTR). Successful translation of the CDS section of an mRNA results in the synthesis of a protein

CDS
coding region, coding sequence. CDS refers to the portion of a genomic DNA sequence that is translated, from the start codon to the stop codon, inclusively, if complete. A partial CDS lacks part of the complete CDS (it may lack either or both the start and stop codons). Successful translation of a CDS results in the synthesis of a protein

contig
A contiguous segment of the genome made by joining overlapping clones or sequences. A clone contig consists of a group of cloned (copied) pieces of DNA representing overlapping regions of a particular chromosome. A sequence contig is an extended sequence created by merging primary sequences that overlap. A contig map shows the regions of a chromosome where contiguous DNA segments overlap. Contig maps provide the ability to study a complete and often large segment of the genome by examining a series of overlapping clones, which then provide an unbroken succession of information about that region.
Alexy, 20.05.2010 21:27
Если на http://www.ncbi.nlm.nih.gov/mapview/seq_re...m=1&to=81195210 поставить Sequence Format: "GenBank"
и "Display" напрмимер последний из 6-и контигов, то на экране появится текст несколько отличный от того, который сохраняется в файле, если нажать "Save to Disk"?

Почему есть разница?
Отличием является только отсутствие в тексте, появляющемся при нажатии "Display", нуклеотидной последовательности?
Alexy, 20.05.2010 21:29
Оба на!!!
Зашел в другую хромосому, а потом вернулся опять к 17-ой
и содержательная часть файла формата GenBank, открываемого нажатием "Display", имеет такой вид:

FEATURES             Location/Qualifiers
     source          1..9412842
                     /organism="Homo sapiens"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:9606"
                     /chromosome="17"
CONTIG      join(AC069061.11:1..178558,complement(AC129926.4:1..130041),
            AC026254.9:15357..154906,complement(AC090615.9:1..66843),
            complement(AC069366.8:1..145619),complement(AC015688.11:1..107220),
            AC130289.11:10591..136599,AC005697.1:47205..174503,
            AC090287.9:1983..90543,AC100852.2:11683..157980,
            complement(AC061975.6:1..126154),complement(AC002094.1:1..82934),
            complement(AC015917.30:1..111927),complement(AC005726.1:1..144810),
            AC010761.10:9964..111393,FJ695200.1:1..559,
            AC010761.10:111952..177765,AC024267.18:18763..175020,
            AC024619.16:15006..198666,complement(AC005412.8:1..178439),
            AC068025.12:98369..190194,complement(AC068588.20:1..45567),
            AC090698.14:15750..87777,complement(AC104564.11:1..168116),
            complement(AC023389.13:1..91555),complement(AC087510.7:1..20709),
...
    complement(AC005549.1:1..145416),complement(AC011193.3:1..173588),
            AC012336.9:37369..40405,complement(AC005691.1:1..154820),
            complement(AC110605.5:1..39374),complement(AC005552.3:1..136841),
            complement(AC022903.12:1..170680),complement(AC004223.2:1..95219),
            AC022916.11:57312..215786,AC022706.7:76418..162474,
            complement(AC060766.8:1..102842),AC015911.8:25270..181561,
            complement(AC004134.1:1..113841),complement(AC006237.1:1..80166),
            complement(AC015849.5:1..131235),AC004675.1:48819..128501,
            complement(AC069363.10:1..116685),AC003976.1:58430..123925,
            complement(AC131056.5:1..167732))
//
http://www.ncbi.nlm.nih.gov/nuccore/NT_010...&report=genbank

А при предыдущем заходе сюда же, имела нормальный вид (с CDS, STS и тому подобным)!!! http://www.ncbi.nlm.nih.gov/nuccore/NT_024...&report=genbank
Guest1, 20.05.2010 22:41
(Alexy @ 20.05.2010 22:27)
Ссылка на исходное сообщение  Если на хттп://щщщ.нцби.нлм.них.гов/мапвиещ/сея_ре...м=1&то=81195210 поставить Сеяуенце Формат: "ГенБанк"
и "Дисплаы" напрмимер последний из 6-и контигов, то на экране появится текст несколько отличный от того, который сохраняется в файле, если нажать "Саве то Диск"?

Почему есть разница?
Отличием является только отсутствие в тексте, появляющемся при нажатии "Дисплаы", нуклеотидной последовательности?


Леш - а поподробней и без пальцев веером ? Ты по-русски ваащетто говорищь ?
rikitiki, 25.05.2010 20:35
вопрос - сколько контигов, по вашему, в хромосоме человека номер 17?
Alexy, 27.05.2010 18:32
6, судя по http://www.ncbi.nlm.nih.gov/mapview/seq_re...m=1&to=81195210
А название контига идет очевидно в первой же строке (например для третьего контига "LOCUS NT_024862 596398 bp DNA linear CON")?
Alexy, 27.05.2010 19:09
Что означает запись в конце генбанковского файла, например, последнего из 6 контигов - NT_010663.15:
...
FEATURES             Location/Qualifiers
     source          1..1436161
                     /organism="Homo sapiens"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:9606"
                     /chromosome="17"CONTIG      join(AC174470.1:1..42029,complement(AC145207.2:1..143777),
            AC137723.6:5964..57644,AC135056.4:5024..96066,
            complement(AC129510.15:1..56438),complement(AC132872.17:1..159935),
            complement(AC132938.9:1..120842),AC124287.10:89496..162180,
            AC124283.11:30001..143744,AC024361.21:4513..111473,
            complement(AC068014.16:1..63353),AC068584.11:21492..65598,
            AC087222.21:15050..70000,complement(AC130371.4:13265..180858),
            AC144831.2:2908..30461,complement(AC139099.2:1..119467))
//
Почему используются слова "complement", если нету описания генов?
Можно ли из этого описпания взять информацию о началах и концах генов и о началах и концах интронов и экзонов? Если нет, ТО ОТКУДА ее БРАТЬ?


"source" в любом из 6 контигов начинается с позиции 1? В каждом контиге своя нумерация от начала этого контига?

Длины gap-ов, указанные в http://www.ncbi.nlm.nih.gov/mapview/seq_re...m=1&to=81195210, кончаются как минимум 4 нулями. Эти длины наверное очень приблизительно определены?
Guest1, 03.06.2010 18:56
(bluebird @ 02.05.2010 19:06)
Ссылка на исходное сообщение  Процитирую Биоинформатицс фор Думмиес
"ЦДС (ЦоДинг Сегмент) интродуцес а цомплех сецтион тхат десцрибес тхе гене’с опен реадинг фраме (ОРФ). Тхе фирст лине индицатес тхе цоординатес оф тхе ОРФ фром итс инитиал АТГ то тхе ласт нуцлеотиде оф тхе фирст стоп цодон ТАА. Еач оф тхе фоллощинг линес (индентед ат тхе саме левел) гивес тхе наме оф а протеин продуцт, индицатес тхе реадинг фраме то усе, тхе генетиц цоде то апплы, анд а нумбер оф ИДс фор тхе протеин сеяуенце. /транслатион, тхе финал кейщорд оф тхе ЦДС сецтион, интродуцес тхе цонцептуал амино-ацид сеяуенце оф тхе цодинг сегмент. Тхис сеяуенце ис а цомпутер транслатион тхат усес тхе цоординатес, реадинг фраме, анд генетиц цоде индицатед ин тхе прецединг линес."

а из ГенеБанк глоссары:
"СТС
А шорт ДНА сегмент тхат оццурс онлы онце ин тхе хуман геноме, тхе ехацт лоцатион анд ордер оф басес оф щхич аре кнощн. Бецаусе еач ис унияуе, СТСс аре хелпфул фор чромосоме плацемент оф маппинг анд сеяуенцинг дата фром маны дифферент лабораториес. СТСс серве ас ландмаркс он тхе пхысицал мап оф тхе хуман геноме."



Интересная "птичка" из Тарту - Естония ? Вы случайно Андреаса Метспалу не знаете ? wink.gif
Guest1, 03.06.2010 19:04
(bluebird @ 02.05.2010 19:06)
Ссылка на исходное сообщение  Процитирую Биоинформатицс фор Думмиес
"ЦДС (ЦоДинг Сегмент) интродуцес а цомплех сецтион тхат десцрибес тхе гене’с опен реадинг фраме (ОРФ). Тхе фирст лине индицатес тхе цоординатес оф тхе ОРФ фром итс инитиал АТГ то тхе ласт нуцлеотиде оф тхе фирст стоп цодон ТАА. Еач оф тхе фоллощинг линес (индентед ат тхе саме левел) гивес тхе наме оф а протеин продуцт, индицатес тхе реадинг фраме то усе, тхе генетиц цоде то апплы, анд а нумбер оф ИДс фор тхе протеин сеяуенце. /транслатион, тхе финал кейщорд оф тхе ЦДС сецтион, интродуцес тхе цонцептуал амино-ацид сеяуенце оф тхе цодинг сегмент. Тхис сеяуенце ис а цомпутер транслатион тхат усес тхе цоординатес, реадинг фраме, анд генетиц цоде индицатед ин тхе прецединг линес."

а из ГенеБанк глоссары:
"СТС
А шорт ДНА сегмент тхат оццурс онлы онце ин тхе хуман геноме, тхе ехацт лоцатион анд ордер оф басес оф щхич аре кнощн. Бецаусе еач ис унияуе, СТСс аре хелпфул фор чромосоме плацемент оф маппинг анд сеяуенцинг дата фром маны дифферент лабораториес. СТСс серве ас ландмаркс он тхе пхысицал мап оф тхе хуман геноме."


напомионает вечную дружбу" финно-уггорсских и англо-сакссонсских языков" -
узнав про 16 естонсских финно-угорских падежов англо-сакс покончил жизнь самоповешением smile.gif
Guest1, 03.06.2010 19:14
(bluebird @ 02.05.2010 19:06)
Ссылка на исходное сообщение  Процитирую Биоинформатицс фор Думмиес
"ЦДС (ЦоДинг Сегмент) интродуцес а цомплех сецтион тхат десцрибес тхе гене’с опен реадинг фраме (ОРФ). Тхе фирст лине индицатес тхе цоординатес оф тхе ОРФ фром итс инитиал АТГ то тхе ласт нуцлеотиде оф тхе фирст стоп цодон ТАА. Еач оф тхе фоллощинг линес (индентед ат тхе саме левел) гивес тхе наме оф а протеин продуцт, индицатес тхе реадинг фраме то усе, тхе генетиц цоде то апплы, анд а нумбер оф ИДс фор тхе протеин сеяуенце. /транслатион, тхе финал кейщорд оф тхе ЦДС сецтион, интродуцес тхе цонцептуал амино-ацид сеяуенце оф тхе цодинг сегмент. Тхис сеяуенце ис а цомпутер транслатион тхат усес тхе цоординатес, реадинг фраме, анд генетиц цоде индицатед ин тхе прецединг линес."

а из ГенеБанк глоссары:
"СТС
А шорт ДНА сегмент тхат оццурс онлы онце ин тхе хуман геноме, тхе ехацт лоцатион анд ордер оф басес оф щхич аре кнощн. Бецаусе еач ис унияуе, СТСс аре хелпфул фор чромосоме плацемент оф маппинг анд сеяуенцинг дата фром маны дифферент лабораториес. СТСс серве ас ландмаркс он тхе пхысицал мап оф тхе хуман геноме."


Кстати, Птичка - первый раз сллышу што-то вразумительное из чухонской деревни smile.gif
Вам что , делать нечего - жизнь гробить в Тарту ? frown.gif
artemka, 03.06.2010 20:55
(bluebird @ 02.05.2010 19:06)
Ссылка на исходное сообщение  Процитирую Биоинформатицс фор Думмиес
"ЦДС (ЦоДинг Сегмент) интродуцес а цомплех сецтион тхат десцрибес тхе гене’с опен реадинг фраме (ОРФ). Тхе фирст лине индицатес тхе цоординатес оф тхе ОРФ фром итс инитиал АТГ то тхе ласт нуцлеотиде оф тхе фирст стоп цодон ТАА. Еач оф тхе фоллощинг линес (индентед ат тхе саме левел) гивес тхе наме оф а протеин продуцт, индицатес тхе реадинг фраме то усе, тхе генетиц цоде то апплы, анд а нумбер оф ИДс фор тхе протеин сеяуенце. /транслатион, тхе финал кейщорд оф тхе ЦДС сецтион, интродуцес тхе цонцептуал амино-ацид сеяуенце оф тхе цодинг сегмент. Тхис сеяуенце ис а цомпутер транслатион тхат усес тхе цоординатес, реадинг фраме, анд генетиц цоде индицатед ин тхе прецединг линес."

а из ГенеБанк глоссары:
"СТС
А шорт ДНА сегмент тхат оццурс онлы онце ин тхе хуман геноме, тхе ехацт лоцатион анд ордер оф басес оф щхич аре кнощн. Бецаусе еач ис унияуе, СТСс аре хелпфул фор чромосоме плацемент оф маппинг анд сеяуенцинг дата фром маны дифферент лабораториес. СТСс серве ас ландмаркс он тхе пхысицал мап оф тхе хуман геноме."


похоже "птичка" всетаки" ЦИТИРОВАЛА ТЕКСТ" - и "наезд" на "птичку" необоснован smile.gif
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2012 Invision Power Services, Inc.