guest: Андрей , 29.09.2010 18:59
Уважаемые коллеги,
Подскажите пожалуйста какую-нибудь альтернативу пакету MEGA 4, желательно под юникс. Нужно произвести "Phylogeny reconstruction" по методу "Maximum parsimony". Исходные данные в формате CLUSTAL. Мега на этих исходных данных тихо виснет, предположительно из-за ошибки в алгоритме.
Я сам терминологией владею слабо, поскольку не биолог, а сисадмин выч. центра
GUEST, 01.10.2010 08:14
В Меге, если мне не изменяет память, перед анализом данных
в формате CLUSTAL, надо их сконвертировать в собственный формат МЕГИ.
Думаю, что Ваша проблема в этом.
-vr, 01.10.2010 12:24
Проблема не обязательно в формате. Может у Вас данных больше чем любая комбинаторная программа может сгрызть. В любом случае сначала попробуйте эвристики например лучшую из лучших - в программе TNT. Есть консольный вариант под *nix. Затем, если МЕГА таки досчитает это дело - то сравните cost обоих деревьев. С вероятностью близкой к 100% могу утверждать, что на элайнментах вменяемого размера TNT достигает оптимума и притом за несколько секунд.
Я предполагаю, что Вы юзаете МЕГУ без эвристик, типа NNI или что у них там по дефолту не помню. Если таки да, у Вас эвристики - тогда просто смешно. МЕГА мягко говоря не тот пакет где реализованы сносные эвристики, просто трата времени.
Guest, 01.10.2010 12:27
Она сама умеет конвертировать, с этим проблем нет. Просто количество цепочек весьма большое - за сотню. В результате с какими-то параметрами алгоритм просто виснет, а с другими Мега вообще падает с ошибкой.
Это уже не говоря о том, что хотелось бы делать обсчёт на 50-80 процессорах, а Мега принципиально не параллелится, в отличие от POY, например.
Guest, 01.10.2010 12:41
Вот именно поэтому я и ищу замену - чует моё сердце, что с алгоритмами в Меге не всё гладко

TNT посмотрю, спасибо.
-vr, 01.10.2010 13:53
Алгоритм точной парсимонии в принципе параллелится, но эффект этого мизерный. Если сиквенсов за сотню то точное решение получить можно только если это очень медленно мутирующие позиции. Скажем для вирусной ДНК даже 30 штук таксонов может быть пределом. Поэтому надежно работают только эвристики. Настоятельно рекомендую TNT, начать прямо по дефолту New Technology Search. Можно с GUI, можно и скриптом когда освоитесь. Внешне у нее фронтенд невзрачный, но математика внутрях само совершенство. По скорости эвристик и их близости к оптимуму TNT не опередил еще никто.
МЕГУ лучше использовать только для точной парсимонии, она у них шустрее в среднем чем у других (но опять-таки и здесь есть варианты получше).
-vr, 01.10.2010 13:55
>с какими-то параметрами алгоритм просто виснет, а с другими Мега вообще падает с ошибкой
Виснет точная парсимония. Эвристики через некоторое всегда время отпускает

А вот падение с ошибкой просто бага, может формат парсится плохо.
-vr, 01.10.2010 15:20
>в отличие от POY
POY лучше Меги, зачем шило на мыло?
guest: Андрей , 01.10.2010 19:32
Не, POY - это я сам нашёл.

Наши биологи просто привыкли к Меге, вот мне и приходится искать что-то, чем её можно заменить под юниксом.
Большое спасибо за советы.
Это — лёгкая версия форума. Чтобы попасть на полную,
щелкните здесь.