Anonymous, 10.12.2003 20:25
Я никак не могу понять, что подразумевается под гомологией и как это считается. Это identity или similarity? Или гомология - вообще некая интегральная величина?
Anonymous, 10.12.2003 21:00
гомология- это идентичность, в отличие от аналогии. А чего вдруг потянуло на философский разбор понятий?
Anonymous, 10.12.2003 21:06
И где это она должна считаться? Если, например, % гомологии двух молекул ДНК, то это в идеале отношение кол-ва совпадающих оснований в фрагманте к общему кол-ву оснований, выраженное в %. Однако часто оценивается нечто большое типа геномной ДНК по эффективности гибридизации и это тоже некоторые называют % гомологии
Anonymous, 10.12.2003 21:09
Исторически термин появился в морфологии. Гомологичные органы, по определению, просходят от общего предка. Если быть терминологически строгим, то и гомологичные последовательности (белковые, нуклеиновые) также происходят от общей предковой последовательноти. Сходство же (similarity) есть просто сходство. Однако, очень многие, если не большинство исследователей используют там, где было бы более уместно говорить о сходстве, термин "гомология".
И это уже почти общепринято. Почему - долго можно рассуждать.
Ну а про идентичность и так понятно.
Опять боюсь подписываться. А то скажет кто-нибудь - вот, устроили
детский сад, читайте школьные учебники.
Anonymous, 10.12.2003 21:29
Не, все-же "гомология" - это точное, полное соответствие. И плюньте тем исследователям в глаза, которые лишь сходство называют гомологией.
Другое дело, если это ПС белка или ДНК. тогда говорят о степени, доле или % гомологии, имея в виду, что гомологичны не все основания.
А ранее морфологии термин использовался и еще где попало - распространенное греческое словечко.
Anonymous, 10.12.2003 21:38
Ну и, соответственно, считают долю гомологичных оснований или АК от всех. Так что речь о степени идентичности, а не сходства
Anonymous, 10.12.2003 22:04
Какой, к черту, "детский сад"???!!!
Человек спрашивает о терминах биоинформатики: "homology", "identity" и "similarity".
Просто вопрос задал неточно.
Отвечать должны специалисты по биоинформатике.
Судя по репликам, таковые пока в разговоре не участвуют.
Anonymous, 10.12.2003 22:06
В классической генетике тоже есть понятие "гомология". Там, поскольку какие-то структурные элементы не сравниваются, под гомологией подразумеваетя общность происхождения признаков, в отличие от аналогии. Например, закон гомологических рядов в наследственной изменчивости Вавилова. Правда сам Вавилов, ввиду совсем не бесконечного количества синонимов слова "гомологичный", написал в определении "сходный". Но стоит на экзамене заменить это авторское словечко на "аналогичный" - кондовый генетик пошлет домой, учить дальше.
А вот из области сходства, аналогии в структуре макромолекул можно привести следующее: молекулы, образующие аналогичные вторичные и третичные структуры. Напр. ПС терминаторов и др. регуляторных элементов ДНК, сходные элементы структуры и домены белков, особенно со сходными функциями могут быть очень схожи, но совершенно негомологичны по ПС.
Anonymous, 10.12.2003 22:20
Автор - <Биоинфчайник>:
Какой, к черту, \"детский сад\"???!!!
Человек спрашивает о терминах биоинформатики: \"homology\", \"identity\" и \"similarity\".
Просто вопрос задал неточно.
Отвечать должны специалисты по биоинформатике.
Судя по репликам, таковые пока в разговоре не участвуют.
Что за интересный запрос "специалист по биоинформатике"? Поняли, что лажу несете? Может быть Вам спец по библиотечному делу нужен?
Anonymous, 10.12.2003 22:28
To AJ
Вы, многоуважаемый, такую науку знаете: "Биоинформатика"?
Esya, 10.12.2003 22:52
DNA homology: How closely related two or more separate strands of DNA are to each other, based on their base sequences.
identity: The relatedness of two DNA as represented by the percentage of the bases they share
Я не специалист, все претензии к авторам определений. А в каждом конкретном случае - читаыте описание к конкретному методу.
Гости пугливые пошли, но вежливые и образованые.
[Текст переведён с транслита]
[Текст переведён с транслита]
Esya, 10.12.2003 22:58
Почувствуйте разницу

Я с трудом...
Grossary of Bioinformatics terms
homology - similarity in sequence that is based on descent from a common ancestor
identity - the extent to which two sequences are invariant
similarity - how related one nucleotide or protein sequence is to another. The extent of similarity between two sequences is based on the percent of sequence identity and/or conservation.
[Текст переведён с транслита]
Anonymous, 10.12.2003 23:05
To Esya
И кто же, по Вашему, самый пугливый из гостей?
Esya, 10.12.2003 23:08
Тот который сам заявил, что он подписываться боиться, конечно. Я правда не понимаю, что в этой теме такого опасного, мне так и полезно оказалось

Для того и на форум ходим...
[Текст переведён с транслита]
DmitriM, 10.12.2003 23:08
Если речь идет о гомологии двух последовательностей, то она считается по "весам". Наибольший вес имеют идентичные аа или основания, но если замена имеет сходные черты, например, один гидрофобный аминокислотный остаток заменен другим гидрофобным, то добавляют частичный "вес". Сколько в случае каких замен добавлять - есть таблицы, причем несколько версий, немного различных, ставящих во главу угла несколько разные свойства. Теперь, если идентичности или близкие замены разделены разрывом - gap - то за каждый gap дается "штраф", то есть от "веса" отнимается. Так работает blast, например. Только спокойно, если всем это известно, то и ладно. Просто возник вопрос, и мне кажется, конкретно никто не написал. Еся, я не выпендриваюсь.
Anonymous, 10.12.2003 23:10
Прошу прощения, уважаемые коллеги за неточный вопрос. Как-то не подумала, что на форуме молекулярных биологов не все каждый день, например, BLAST используют. Биоинфочайник прав , спрашиваю про термины биоинформатики: "homology", "identity" и "similarity".Несмотря на то, что уже давно с этим работаю, никак не могу понять, что народ имеет в виду в статьях, когда пишет про % гомологии сиквенсов: "identity" и "similarity". Некоторые (немногие) честно пишут, % "identity" такой-то, % "similarity" такой-то, но громадное большинство при описании сиквенсов оперирует термином "homology". А вот что такое "homology" и как его посчитать - очень хотелось бы узнать точно. И ваше, Esya, определение ясности не добавляет.
Anonymous, 10.12.2003 23:24
To DmitriM.
Спасиба за ответ, кажется, проясняется. Но, может я не теми программами пользуюсь, как раз blast и дает "identity" и "similarity", а то, про что вы пишете (я себе так гомологию и представляю), оценивает не в %.
Esya, 10.12.2003 23:24
Дима, я вижу
Аксел, а я и не говорила, что это мое... Описание к программе читайте, ИМХО. Там алгоритм описан.
А в каждой из статей, точность исползованых терминов на совести авторов, кот. и не биоинформатики вовсе... Т.е. понимают не намного больше нас с вами, им программа написала, а они процитировали. Убегаюуу...
[Текст переведён с транслита]
Zvezdochet, 10.12.2003 23:25
Мои 5 копеек...
Similarity - действительнозначная функция от двух переменных, где переменные есть два обьекта сравнения, в данном случае протеиновые последовательности или структуры. Чаще всего нормированная (на отезке [0,1]). Определяет похожесть двух обьектов.
Гомология есть формально двузначная функция от двух переменных. В данном случае - протеиновых последовательностей или же структур. Даете на вход два протеина, а функция вам выдает "1" если протеины есть гомологи и "0" в обратном случае. Очень часто гомологию получают как пороговую функцию на основе similarity - ставят определенный порог значения similarity до которого протеины определяются как негомологичные, а после - гомологичные.
Частный случай гомологии - идентичность. Это когда similarity двух обьектов равна единице. Самый простой случай - полное совпадение двух протеиновых строк. Хотя все зависит от того как определена функция similarity. Почему частный случай гомологии? Потому что идентичность определяет верхнюю границу порогового значения.
Надеюсь, что помог хоть чем-то.
Anonymous, 10.12.2003 23:31
Esya, у меня закралось подозрение, что в половине статей под процентом гомологии идет "identity" , а в другой половине "similarity", в зависимосте от желаемых цифр. Например, если хочется показать сходство, берут "similarity", если отличие - в ход идет цифра "identity".
DmitriM, 10.12.2003 23:34
Ничего себе 5 копеек... Эх, почему я не стал биоинформатиком...
DmitriM, 10.12.2003 23:39
Судя по тому, что написано в документам к blast (косвенно, правда; и косно), думаю, % identity = [N of identical aa]/[N total aa]*100%. А similarity в blast - это positive matrix score, то есть, если я верно понял, SUM(identities, substitutions) - SUM(gap penalties).
Как из этого сделать процент?

Наверное, поделить на максимально возможное значение скора в данном случае и умножить на 100%.
Anonymous, 10.12.2003 23:57
И еще, в одних программах при оценке сходства двух сиквенсов по одному и тому же параметру (насколько я понимаю) пишут "Positives", в других это же называется "Similarity". Господа биоинформатики, как считается % гомологии, если я этого не в одной программе не вижу? Но тем не менее, откройте практически любую статью, где сравниваются сиквенсы, увидите % гомологии. Может подскажете программу, кто знает, пожалуйста, где считается именно % "gomology"?
Anonymous, 11.12.2003 00:17
DmitriM, спасибо, ваши для меня самые полезные.
Если упростить ваш пост, то получается "similarity"="рositives"-"gaps"?
Gobochka, 11.12.2003 00:31
по-моему, "gomology" не считают, но я в этом не уверена. например в статье, которую мы выпустили, я точно знаю, что процентное соотношение там "identities", но мы написали "97% and 95%
homology with the human and the mouse sequences respectively" (примерно что-то типо этого). наверное так принято. босс мой, правда, в биоинформатике не сильно разбирается.
а если вас интересуют positives, то их уже обсуждали:
http://molbiol.ru/cgi-bin/ubb/ultimatebb.c...ic;f=1;t=003727
daniil naumoff, 11.12.2003 12:33
Автор - <Axel>:
И еще, в одних программах при оценке сходства двух сиквенсов по одному и тому же параметру (насколько я понимаю) пишут \"Positives\", в других это же называется \"Similarity\". Господа биоинформатики, как считается % гомологии, если я этого не в одной программе не вижу? Но тем не менее, откройте практически любую статью, где сравниваются сиквенсы, увидите % гомологии. Может подскажете программу, кто знает, пожалуйста, где считается именно % \"gomology\"?
Как человек, занимающийся биоинформатикой уже ни один год хочу сказать, что из всего тут сказанного истине более-менее соответствует то, что процитировал Zvezdochet, хотя там есть некоторые спорные моменты. Если кому интересно - можно обсудить отдельно.
Теперь по сути вопроса:
"Identity" при выравнивании двух последовательностей - процент позиций, где буквы одинаковы (аминокислоты, нуклеотиды).
"Similarity" = "Positives" при выравнивании двух аминоислотных последовательностей - процент позиций, где находятся одинаковые или сходные (согласно используемому матриксу весов) аминокислотные остатки.
"Homology" - характеристика КАЧЕСТВЕННАЯ, а не КОЛИЧЕСТВЕННАЯ (измерена быть не может ни в %, ни в чём либо ещё!!!). Говоря о гомологии двух последовательностях мы делаем утверждение (или предположение) об общности их эволюционного происхождения. Ровно так же, как когда мы говорим о гомологичных органах, например, у животных.
Действительно в статьях сплошь и рядом встречаются попытки измерить гомологию в процентах. Но это от безграмотности. Эти люди имеют в виду или "Identity", или "Similarity". Но я бы прежде чем принимать во внимание их цифровые данные задумался бы над тем что они сравнивали - нуклеотидные последовательности или аминокислотные? Не доверяйте дилетантам...
Axel, учитывая вышесказанное Вы, наверное, уже поняли, почему ни в одной программе по выравниванию последовательностей не упоминается "как считается % гомологии".
Gobochka, 11.12.2003 12:33
более того, мне кажется, что если бы мы процентное соотношение по "positives" брали (оно бы было выше естественно), то в статье написали бы вместо homology similarity. может я и ошибаюсь, но это самое логичное, что приходит мне в голову.
daniil naumoff, 11.12.2003 12:40
Небольшое добавление. В качестве "лабораторного жаргона" применяется "процент гомологии" как синоним "процента идентичности", но это абсолютно недопустимо в научных статьях.
Gobochka, 11.12.2003 12:45
to daniil_naumoff :
о очень хорошо, что вы появились. у меня возник наводящий вопрос: similarity тоже качаственная характеристика?
хотя после того, как ещё раз прочитала ваше объяснение, поняла, что similarity не качественная характеристика, а просто тоже самое, что и positives, непонятно зачем нужны два термина. поэтому в статьях процент similarity можно писать, а homology- нельзя.
daniil naumoff, 11.12.2003 13:00
"Similarity" = "Positives" при выравнивании двух аминоислотных последовательностей - процент позиций, где находятся одинаковые или сходные (согласно используемому матриксу весов) аминокислотные остатки.
Gobochka,
Конечно количественная!!! Хотя никто Вам не помешает говорить о сходстве в отрыве от конкретных значений, ну, например, фраза "два белка имеют достаточно высокий уровень сходства для того, чтобы..." вполне допустима.
Gobochka, 11.12.2003 13:08
to daniil_naumoff :
спасибо.
Anonymous, 11.12.2003 13:58
Ага! к вопросу об аргументах функции сходства, определннной звездочетом. Пущай значение функции определно на множестве действительных чисел, а вот на каком множестве и чего собственно определены аргументы сей функции. Но это уже так к спецам и теоретикам, но просто забавно. А разъяснения мне понравились делныя оченя.
Anonymous, 11.12.2003 18:25
daniil_naumoff: "Действительно в статьях сплошь и рядом встречаются попытки измерить гомологию в процентах. Но это от безграмотности. Эти люди имеют в виду или "Identity", или "Similarity".
Даниил, мне процент гомологии в статьях попадается настолько часто (практически всегда - вот что интересно, а куда смотрят рецензенты?),что мне начало казаться, что это я чего-то не знаю. Все считают, измеряют, обсуждают, а я даже понятия не имею, как этот процент гомологии посчитать. Вот и пытаюсь выяснить. Очень понравилось замечание Gobochka о том, как шеф писал статью (мои подозрения о том, что % гомологии - это %Identity" или "Similarity" обрели материальную основу).
Даниил, еше одна ваша цитата: "Но я бы прежде чем принимать во внимание их цифровые данные задумался бы над тем что они сравнивали - нуклеотидные последовательности или аминокислотные?" - у меня к вам (к другим тоже), есть ли принципиальная разница в процессе сравнивания (я понимаю, что сравниваются разные сиквенсы), почему надо задумываться? В статьях всегда говорится, что именно сравнивали.
Esya, 11.12.2003 18:37
Я присоединяюсь к благодарностям... Все скопирую и в кучку положу. Правда у меня рефлекс - мне как программа выдает что - я в тех же терминах представляю- осозновая собственную неграмотность. Да и босс (current) в таких весчах очень ничего, но это редко встречается.
[Текст переведён с транслита]
daniil naumoff, 11.12.2003 18:53
Автор - <Axel>: а куда смотрят рецензенты?
Если статья подаётся в журнал специализирующийся на биоинформатике или в обычный журнал, но тематика статьи явно биоинформатическая, то большие шансы, что Вам подберут рецензента по профилю. Если же публикуется статья про секвенирование/эксперессию/кинетику и там лишь один абзац посвящён обсуждению сходства секвенированного белка с ранее известными, то с большой вероятностью и рецензента дадут из той же области. Он даже может и не догадываться, что BLAST - это аббревиатура... не говоря уж о том в каких терминах надо характеризовать полученные с его помощью результаты.
Автор - <Axel>: Даниил, еше одна ваша цитата: \"Но я бы прежде чем принимать во внимание их цифровые данные задумался бы над тем что они сравнивали - нуклеотидные последовательности или аминокислотные?\" - у меня к вам (к другим тоже), есть ли принципиальная разница в процессе сравнивания (я понимаю, что сравниваются разные сиквенсы), почему надо задумываться? В статьях всегда говорится, что именно сравнивали.
Я имел в виду, что люди не аккуратные в терминах и цифры могут перепутать - вместо % идентичности ДНК указать для белка или наоборот.
Принципиальной разницы конечно нет, но понятие "% сходства" имеет смысл только для белков. И ещё один практический совет: если сравниваются последовательности с низким уровнем сходства, то лучше иметь дело с аминокислотными последовательностями - уровень шума будет ниже.
DmitriM, 11.12.2003 19:04
Я, конечно, извиняюсь за то, что осмеливаюсь вопрошать таких мэтров, как daniil_naumoff, но вот что получается (это не утверждение, а лишь попытка разобраться). daniil_naumoff утверждает, что similarity - величина количественная, а homology - качественная. Читаем определение из BLAST glossary: "Homology - Similarity attributed to descent from a common ancestor." Если одно понятие определяется через количественное понятие, то не является это определенное понятие тоже количественным? По определению BLAST получается, что homology - это та же similarity, при условии общности происхождения. BLAST - тоже мэтры. Кто прав? Может, у рецензентов есть основания, чтобы не придраться?
Ну, хорошо что хоть относительно similarity и identity никаких разногласий больше нет.
Теперь относительно сравнения нуклеотидных и аминокислотных последовательностей. Разница технически состоит в том, что в первом случае используется unitary matrix, то есть при совпадении score увеличивается на 1, при несовпадении - на 0. Поскольку аминокислотные остатки несут больше информации о возможной функции и т. п., то их совпадения-несовпадения оцениваются по substitution matrix, когда каждой замене X -> Y присваивается свое значение при прибавлении к score. В зависимости от встречаемости в белках с не менее чем 62%, 80% или 45% расхождений (для разных матриц по-разному).
daniil naumoff, 11.12.2003 19:34
"Homology - Similarity attributed to descent from a common ancestor"
Similarity + Сommon Аncestor = Homology
Однако, любые две последовательности обладают каким-то уровнем сходства: Similarity > 0%
Отсюда имеем:
Сommon Аncestor = Homology
Сommon Аncestor - характеристика качественная! Наличие гомологии между двумя белками не требует наличия какого-либо % сходства или идентичности. Иначе говоря при низком уровне сходства нельзя сделать однозначный вывод, что белки не гомологичны.
Anonymous, 11.12.2003 19:53
Автор - <Биоинфчайник>:
To AJ Вы, многоуважаемый, такую науку знаете: \"Биоинформатика\"?
Дык, термин то не только к биоинформатике относится, между прочим, а несколько шире, Вам не кажется?
О том, что под гомологией в МБ подразумевается по-сути тут уже давно все выяснили.
Только,

Sorry, как оказалось, я был кое где не прав. Заглянул на досуге в литературу и вот...
Это только в МБ под термином "гомология" подразумевается "идентичность". В других областях знаний (математика, химия, анатомия и морфология...) - это скорее сходство, связанное с родственностью или общностью происхождения.
(О чем, собственно, и написал
Guest Буквальный перевод дает именно "сходство". А давать строгое определение никто не берет на себя труд.
Видимо, действительно возможны варианты употребления, тем более в английском. В прочем - вопрос риторики, главное считать правильно
Rhizon, 11.12.2003 20:02
Лучше бы искать ответы на такие принципиальные вопросы под руководством человека сведущего, а не искать случайные ссылки по справочникам, учебникам и интернетам (увы большинству из нас). Глубокий (и очень ясный)анализ понятий гомологии, сходства и идентичности дан в последней книжке Кунина. К нему можно по разному относиться, но в данном вопросе его взгляд, IMHO, безупречен. Если хотите, я вышлю эту главу по электронной почте (кому надо).
Советую!
Anonymous, 11.12.2003 20:03
To daniil_naumoff
Вы представили очень стройную систему ряда терминов. Но почему в очень многих статьях авторы не придерживаются такой стогости их значений?
DmitriM, 11.12.2003 20:04
Умоляю, вышлите ее мне на replydmitry@mail.ru! Спасибо!
Anonymous, 11.12.2003 20:11
Please, ajs2003@inbox.ru
Anonymous, 11.12.2003 20:12
И мне, please, ajs2003@inbox.ru
Anonymous, 11.12.2003 20:13
И мне, пожалуйста: ajs2003@inbox.ru
Anonymous, 11.12.2003 20:14
О, черт, в борьбе с транслитом получилось три варианта...
daniil naumoff, 11.12.2003 20:15
Автор - <AJ>:
To daniil_naumoff
Вы представили очень стройную систему ряда терминов. Но почему в очень многих статьях авторы не придерживаются такой стогости их значений?
Да потому, что это не является областью их научных интересов. Статьи-то эти по большей части посвящены совсем другим вопросам.
Между прочим, я сам впервые узнал о том, что гомология не может быть измерена в %% из рецензии на мою статью...
Anonymous, 11.12.2003 20:24
Очень благодарна всем, особенно daniil_naumov за ответы. Не думала, что такая неразбериха с терминами творится.
To Rhizon: и мне, пожалуйста, Кунина
на smarkova@mail.ru.
Anonymous, 11.12.2003 20:30
Однако регистрироваться пора и заходить сюда почаще (очень полезно)- Это я себе.
Посты можно будет тогда редактировать - это гостю AJ.
daniil naumoff, 11.12.2003 20:30
Rhizon,
если не трудно - напишите здесь ссылку: о какой статье Кунина идёт речь?
Anonymous, 11.12.2003 21:28
ЭЭ рискну заявить, что гомология относится скорее к понятию качественно колличественному с размытой границей, вроде понятия куча. Каждый сам решает для себя что можно назвать уже кучей, а что еще нет. Для крайних значений: очень большое и совершенное отсутствие, куча определяется совершенно однозначно. А в промежутке как договоримся. Так и со занчениями функции сходства и гомологичности.
Все что я здесь изложил всего лиш мое мнение и не является устоявшимся положением.