<<
>>

4. КОМПЬЮТЕРНЫЙ АНАЛИЗ ГЕНЕТИЧЕСКИХ ТЕКСТОВ.

Выявление и анализ закодированных в последовательностях функциональных сигналов требует применения современных методов информатики - качественных баз данных с современными средствами управления, новейших методов распознавания образов, статистических исследований, применения специальных алгоритмов для преодоления возникающих вычислительных трудностей.

В настоящее время исследование функциональных свойств расшифрованных последовательностей нуклеиновых кислот - это новый раздел молекулярной биологии, граничащий с информатикой, с одной стороны, и молекулярной биофизикой - с другой. Можно с уверенностью сказать, что в настоящее время анализ последовательности биополимера позволяет извлечь лишь очень небольшую долю закодированной в ней информации. В конечном счете точное выявление функциональных особенностей в последовательностях нуклеиновых кислот будет возможно только после детального исследования соответствующих реакций, осуществляемых нуклеиновобелковыми комплексами.

Для оперативной работы с последовательностями создаются специальные банки данных.

В банке в доступном для пользователя виде хранится каждая расшифрованная последовательность и ее паспорт, в котором указаны различные сведения о ней. Это сведения об организме, из которого выделена последовательность, о документе, где она описана, о расположении на ней регуляторных участков и белках, которые она кодирует и т.д. В настоящее время созданы три большие базы данных последовательностей нуклеиновых кислот: "Genbank" (Лос-Аламос, США - более 30 млн. нуклеотидов), база данных нуклеотидных последовательностей Европейской молекулярно-биологической лаборатории (EMBL, Гейдельберг, ФРГ - более 30 млн. нуклеотидов) и "Генэкспресс" (СССР, ВИНИТИ-ИМГ АН СССР - более 11 млн. нуклеотидов). Известны также несколько белковых баз данных, наиболее представительной из которой является MBRF-PIR (США).
Эти базы данных распространяются на различных носителях - магнитных лентах и дисках, на оптических дисках.

Кроме построения филогенетических древ геномов вирусов компьютерный анализ применяется при поиске гомологий, распознавании кодирующих областей, функциональных сигналов, физическом (рестрикционном) картировании молекул ДНК и для предсказания вторичных структур РНК.

Сейчас в мире создано большое количество программ ( обычно организованных в пакеты ) , предназначенных для анализа последовательностей нуклеиновых кислот и избавляющих исследователей от многих трудоёмких рутинных операций , в том числе: подсчёт числа моно -, ди – и тринуклеотидов, перевод нуклеотидной последовательности в аминокислотную и т.д.

Все программы условно делятся на два класса: общего назначения и специального. Первые осуществляют ряд_ наиболее распространенных операций по сбору и анализу последовательностей и позволяют: вводить и редактировать новые последовательности, считывать с помощью сканирующих устройств информацию непосредственно с автографов или гелей', находить участки узнавания эндонуклеаз рестрикции и представлять результаты в удобном (табличном или графическом) виде, находить участки с элементами поворотной и зеркальной симметрии (палиндромы), транслировать нуклеотидную последовательность в белковую во всех трех рамках считывания, сравнивать две последовательности методом точечных матриц гомологии, сравнивать новую последовательность со всеми данными Ген Банка, находить участки, обогащенные теми или иными нуклеотидами, вычислять гипотетическую температуру плавления ДНК, осуществлять автоматическую сборку секвенированных фрагментов в единую структуру - молекулу ДНК, транслировать белковую последовательность в нуклеотидную с учетом неравномерности использования кодонов-синонимов, определять молекулярную массу НК и белков, предсказывать вторичную структуру белков, вычислять свободную энергию образования шпилек и др.

Программы специального назначения создаются для решения более специальных и часто более сложных задач и представляют интерес для более узкого круга специалистов.

Так, например, они могут выполнять ряд функций: вычисление длины фрагментов ДНК на основании их электрофоретической подвижности в гелях; выбор гибридизационных зондов; предсказание вторичной структуры РНК; локализация нуклеотидов в гене, которые могут быть изменены (без изменения аминокислотной последовательности) с целью введения сайта узнавания эндонуклеазы рестрикции; нахождение участков с потенциально возможной структурой Z-формы ДНК; выявление функционально значимых участков в неизвестной вновь расшифрованной структуре на основании ранее выведенного консенсуса (в результате сравнительного анализа ряда известных структур с одинаковой функцией); локализацию участков, кодирующих белки, и т.д.

Для примера представлено меню пакета программ MICROGENIE, из которых следует, какие функции общего или специального назначения может выбрать исследователь при работе с нуклеотидными последовательностями.

Программа общего назначения "COMMON" обеспечивает ввод последовательности в ЭВМ, а также проверку введенных данных в диалоговом режиме. Они позволяют также редактировать нуклеотидные последовательности: вводить замены и вставки, исключать нуклеотиды, вырезать, встраивать и объединять нуклеотидные последовательности и таким образом моделировать гибридные и мутантные молекулы ДНК. Ввод последовательностей в память машины можно осуществлять вручную с клавиатуры, но в последнее время созданы приборы для автоматического сканирования авторадиограмм и секвениру-ющих гелей, полученных при использовании флуоресцентных меток , передачи данных сразу в компьютер и последующего анализа последовательности с помощью специальных программ. В недавно вышедшей в издательстве IRL (Оксфорд) книге "Анализ сиквенса нуклеотидных кислот и белков" подробно описываются как конструкция сканирующих устройств, так и программы для чтения авторадиограмм. Созданы программы для восстановления первичных структур высокомолекулярных ДНК на базе данных сиквенса фрагментов, полученных при ее Неспецифическом расщеплении (например, ультразвуком,).

Родство между любой парой фрагментов ДНК выявляется на основании совпадения последовательности нуклеотидов в их структурах, причем эти совпадающие последовательности и являются местом перекрывания и такие два фрагмента могут быть объединены в более протяженную структуру. Процесс отбора фрагментов и стыковки продолжается до. тех пор, пока не будет восстановлена вся первичная структура исследуемой ДНК. Одной из такого рода программ является "CONTIG" (существует ее вариант для компьютера IBM PC), созданная в лаборатории Ф.Сангера (Кембридж, Англия). Ниже приводятся основные операции, которые позволяет осуществлять программа "CONTIG":

1) хранение сиквенса каждого фрагмента;

2) отбор смежных фрагментов и сборка последовательностей из них;

3) сравнение данных, полученных при чтении новых авторадиограмм, с уже установленными последовательностями;

4) объединение двух фрагментов с помощью третьего, представляющего собой область перекрывания первых;

5) поиск участков ДНК, комплементарных уже установленным, что является проверкой правильности сборки полной структуры ДНК.

<< | >>
Источник: РЕФЕРАТ. ГЕНОМЫ. 2018

Еще по теме 4. КОМПЬЮТЕРНЫЙ АНАЛИЗ ГЕНЕТИЧЕСКИХ ТЕКСТОВ.:

  1. ТЕКСТ ДОКУМЕНТА
  2. Компьютерная томография
  3. Компьютерная томография
  4. В.М. Брюханов, Я.Ф. Зверев, В.В. Лампатов, А.Ю. Жариков, О.С.. Лекции по фармакологии для высшего медицинского и фармацевтического образования [Текст] / - Барнаул : изд-во Спектр2014, 2014
  5. КОМПЬЮТЕРНЫЙ СИНТЕЗ
  6. Компьютерная томография головного мозга
  7. Краткая хронология компьютерных технологий
  8. РЕФЕРАТ. ВЛИЯНИЕ КОМПЬЮТЕРНЫХ СЕТЕЙ НА ЧЕЛОВЕКА2018, 2018
  9. Генетическая детерминированность основных психофизиологических характеристик
  10. РЕФЕРАТ. КОМПЬЮТЕРНАЯ ТЕРМОГРАФИЯ В ДИАГНОСТИКЕ ЗЛОКАЧЕСТВЕННЫХ ОПУХОЛЕЙ ГЛАЗА И ОРБИТЫ2018, 2018
  11. МЕДИКО-ГЕНЕТИЧЕСКОЕ КОНСУЛЬТИРОВАНИЕ
  12. ill. ГЕНЕТИЧЕСКИЕ АСПЕКТЫ
  13. Молекулярные и генетические характеристики