Биоинформатика
Материал из Википедии — свободной энциклопедии
Эта статья или раздел нуждается в переработке.
Пожалуйста, улучшите её в соответствии с правилами написания статей.
|
[источник?] Биоинформа́тика или вычисли́тельная биоло́гия — одна из дисциплин биологии, рассматривающая использование компьютеров для решения биологических задач. Под биоинформатикой понимают любое использование компьютеров для обработки биологической информации. На практике, иногда это определение более узкое, под ним понимают использование компьютеров для характеризации молекулярных компонентов.
Термины биоинформатика и вычислительная биология часто взаимозаменяются, хотя последний чаще указывает на разработку алгоритмов и конкретные вычислительные методы. Считается, что не все использование вычислительной биологии является биоинформатикой, например, математическое моделирование – это не биоинформатика, хотя и связана с биологическими задачами. [1]
Биоинформатика использует методы прикладной математики, статистики и информатики. Исследования в вычислительной биологии нередко пересекаются с системной биологией. Основные усилия исследователей в этой области направлены на изучение геномов, анализ и предсказание структуры белков, анализ и предсказание взаимодействий молекул белка друг с другом и другими молекулами, а также моделирование эволюции. Биоинформатика и её методы используются также в биохимии и биофизике. Основная линия в проектах биоинформатики — это использование математических средств для извлечения полезной информации из «шумных» или слишком объёмных данных о структуре ДНК и белков, полученных экспериментально.
Содержание |
[править] Основные области исследований
[править] Анализ генетических последовательностей
C тех пор как в 1977 году был секвенирован фаг Phi-X174, последовательности ДНК всё большего числа организмов были дешифрованы и сохранены в базах данных. Эти данные используются для определения последовательностей белков и регуляторных участков. Сравнение генов в рамках одного или разных видов может продемонстрировать сходство функций белков или отношения между видами (таким образом могут быть составлены филогенетические деревья). С возрастанием количества данных уже давно стало невозможным вручную анализировать последовательности. В наши дни для поиска по геномам тысяч организмов, состоящих из миллиардов пар нуклеотидов используются компьютерные программы. Программы могут однозначно сопоставить ("выравнять") похожие последовательности ДНК в геномах разных видов; часто такие последовательности несут сходные функции, а различия возникают в результате мелких мутаций, таких как замены отдельных нуклеотидов, вставки нуклеотидов, и их "выпадения" (делеции). Один из вариантов такого выравнивания применяется при самом процессе секвенирования. Так называемая техника «дробного секвенирования» (которая была, например, использована Институтом Генетических Исследований для секвенирования первого бактериального генома, Haemophilus influenzae) вместо полной последовательности нуклеотидов даёт последовательности коротких фрагментов ДНК (каждый длиной около 600—800 нуклеотидов). Концы фрагментов накладываются друг на друга и, совмещённые должным образом, дают полный геном. Такой метод быстро даёт результаты секвенирования, но сборка фрагментов может быть довольно сложной задачей для больших геномов. В проекте по расшифроке генома человека сборка заняла несколько месяцев компьютерного времени. Сейчас этот метод применяется для практически всех геномов, и алгоритмы сборки геномов являются одной из острейших проблем биоинформатики на сегодняшний момент.
Другим примером применения компьютерного анализа последовательностей является автоматический поиск генов и регуляторных последовательностей в геноме. Не все нуклеотиды в геноме используются для задания последовательностей белков. Например, в геномах высших организмов большие сегменты ДНК явно не кодируют белки, и их функциональная роль не известна. Разработка алгоритмов выявления кодирующих белки участков генома является важной задачей современной биоинформатики.
Биоинформатика помогает связать геномные и протеомные проекты, к примеру, помогая в использовании последовательности ДНК для идентификации белков.
[править] Аннотация геномов
В контексте геномики аннотация — процесс маркировки генов и других объектов в последовательности ДНК. Первая программная система аннотации геномов была создана в 1995 Оуэном Уайтом (Owen White), работавшим в команде, секвенировавшей и проанализировавшей первый декодированный геном свободноживущего организма, бактерии Haemophilus influenzae. Доктор Уайт построил систему для нахождения генов, тРНК и других объектов ДНК и сделал первые обозначения функций этих генов. Большинство современных систем работают сходным образом, но эти программы постоянно развиваются и улучшаются.
[править] Вычислительная эволюционная биология
Эволюционная биология исследует происхождение и появление видов, также как их развитие с течением времени. Информатика помогает эволюционным биологам в нескольких аспектах:
- изучать эволюцию большого числа организмов, измеряя изменения в их ДНК, а не только в строении или физиологии,
- сравнивать целые геномы (см. BLAST), что позволяет изучать более комплексные эволюционные события, такие как дупликация генов, латеральный перенос генов и предсказывать бактериальные специализирующие факторы
- строить компьютерные модели популяций, чтобы предсказать поведение системы во времени
- отслеживать появление публикаций, содержащих информацию о большом количестве видов
Область в компьютерных науках, которая использует генетические алгоритмы часто путают с компьютерной эволюционной биологией. Работа в этой области использует специализированное программное обеспечение для улучшения алгоритмов и вычислений и основывается на эволюционных принципах, таких, как репликация, диферсификация через рекомбинацию или мутации, и выживании в естественном отборе.
[править] Оценка биологического разнообразия
Биологическое разнообразие экосистемы может быть определено как полная генетическая совокупность определённой среды, состоящая из всех обитающих видов, была бы это биоплёнка в заброшенной шахте, капля морской воды, горсть земли или вся биосфера планеты Земля. Для сбора видовых имён, описаний, ареала распространения, генетической информации используются базы данных. Специализированное программное обеспечение применяется для поиска, визуализации и анализа информации, и, что более важно, предоставления её другим людям. Компьютерные симуляторы моделируют такие вещи, как популяционная динамика, или вычисляют общее генетическое здоровье культуры в агрономии. Один из важнейших потенциалов этой области заключается в анализе последовательностей ДНК или полных геномов целых вымирающих видов, позволяя запомнить результаты генетического эксперимента природы в компьютере и возможно использовать вновь в будущем, даже если эти виды полностью вымрут.
Важные проекты: Проект "Виды 2000".
[править] Внешние ссылки
- Русскоязычный портал молекулярных биологов
- Российские биотехнологии и биоинформатика
- Объединённый центр вычислительной биологии и биоинформатики
- Институт цитологии и генетики СО РАН
- Кафедра информационной биологии ФЕН НГУ
- Институт математических проблем биологии РАН РФ
- Институт физико-химической биологии им.Белозёрского
- Факультет биоинформатики и биоинженерии МГУ им.Ломоносова
- Лаборатория биоинформатики в ГосНИИ Генетика
[править] См также
Эта статья или раздел нуждается в переработке.
Пожалуйста, улучшите её в соответствии с правилами написания статей.
|
Это незавершённая статья по биологии. Вы можете помочь проекту, исправив и дополнив её. |
|
---|
Анатомия | Биоакустика |Биологическая систематика | Биология океана | Биология развития | Биология человека | Биофизика | Биохимия | Ботаника | Вирусология | Возникновение жизни | Генетика | Геномика | Гидробиология | Гистология | Зоология | Зоопсихология | Космическая биология | Математическая биология | Микология| Микробиология | Молекулярная биология | Палеонтология | Паразитология | Патология | Протистология | Физиология | Цитология | Эволюционная биология | Экология | Этология |