Olezhek, 22.09.2010 13:57
Коллеги и специалисты. Вот, появилась такая микро-задача.
Есть у вас Excel или обычный текстовый файл в котором, скажем 100 строк и каждая строка - это отдельная нуклеотидная последовательность.
Как легко и непринужденно каким-нить хитрым способом сделать из такого файла файл Multi-Fasta так чтобы каждой последовательности (т.е. каждой строчке) было присвоено имя, например Sequence-1, Sequence-2 и т.д.
Заранее большое спасибо!
tikiriki, 22.09.2010 18:23
Excel:
A B C
1 > seq1_ АТГЦАГТАЦАГАТАГАЦА
2 > seq2_ АЦТАГАЦАГТАГАЦАА
3 > seq3_ АЦТГАТАГАЦАГА
скопировать в Word
убрать пробелы
найти и заменить _ на ^p
Olezhek, 23.09.2010 10:25

Спасибо! Но это понятно. Нужно вот как.
На входе
АТГЦАГТАЦАГАТАГАЦА
АЦТАГАЦАГТАГАЦАА
АЦТГАТАГАЦАГА
и что бы на выходе было
>seq1
АТГЦАГТАЦАГАТАГАЦА
>seq2
АЦТАГАЦАГТАГАЦАА
>seq3
АЦТГАТАГАЦАГА
Вручную-то я умею. Просто когда массив из 10000+ последовательностей и таких массивов много, - хочется чего-то более нано-технологичного
AlexanderL, 23.09.2010 13:07
1. в экселе в колонку В ставим ваши последовательности.
2. в колонку А ставим >seq1 и "протягиваем", схватив за нижний правый угол ячейки до необходимого >seqN (эксель сам номера проставит)
3. копируем два столбца в ворд
4. в ворде преобразовываем таблицу в текст (таблица/преобразовать/таблцу в текст), выбираем преобразование с разделителем "знак табуляции"
5. делаем замену всех знаков табуляции ^t на знаки абзаца ^p
на всё 2 минуты.
Olezhek, 23.09.2010 13:44
Коллеги, уууууууууууууууу! Жизнь стала проще и радостнее!
Спасибо огромное!!!!
Olezhek, 23.09.2010 13:46
(tikiriki @ 22.09.2010 16:23)

Excel:
A B C
1 > seq1_ АТГЦАГТАЦАГАТАГАЦА
2 > seq2_ АЦТАГАЦАГТАГАЦАА
3 > seq3_ АЦТГАТАГАЦАГА
скопировать в Word
убрать пробелы
найти и заменить _ на ^p
Ага, всё. Понял что вы имели ввиду то же самое что и следующий докладчик.
Пардон, что доходит до японских ущеных все туго.
Спасибо!!!!
Это — лёгкая версия форума. Чтобы попасть на полную,
щелкните здесь.