BLAST

Поделись знанием:
Перейти к: навигация, поиск
BLAST
Тип

Биоинформатика

Разработчик

Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI

Операционная система

UNIX, Linux, Apple Macintosh, Microsoft Windows

Последняя версия

2.3.0 (21.12.2015)

Лицензия

Public Domain

Сайт

ftp.ncbi.nlm.nih.gov/blast/

К:Википедия:Статьи без изображений (тип: не указан)

BLAST (англ. Basic Local Alignment Search Tool - средство поиска основного локального выравнивания) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. Является важнейшим инструментом для молекулярных биологов, биоинформатиков, систематиков. Программа BLAST была разработана учёными Stephen Altschul, Warren Gish, Webb Miller, Eugene Myers, и David J. Lipman в системе Национальных институтов здравоохранения США и была опубликована в журнале Journal of Molecular Biology (англ.) в 1990[1].





Классификация программ серии BLAST

Семейство программ серии BLAST делится на 5 основных групп:

Нуклеотидные

предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированных нуклеиновых кислот и их участков:

  • megablast — быстрое сравнение с целью поиска высоко сходных последовательностей,
  • dmegablast — быстрое сравнение с целью поиска дивергировавших последовательностей, обладающих незначительным сходством,
  • blastn — медленное сравнение с целью поиска всех сходных последовательностей и др.

Белковые

предназначены для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков.

  • blastp — медленное сравнение с целью поиска всех сходных последовательностей,
  • cdart — сравнение с целью поиска гомологичных белков по доменной архитектуре,
  • rpsblast — сравнение с базой данных консервативных доменов,
  • psi-blast — сравнение с целью поиска последовательностей, обладающих незначительным сходством,
  • phi-blast — поиск белков, содержащих определённый пользователем паттерн и др.

Транслирующие

способны транслировать нуклеотидные последовательности в аминокислотные:

  • blastx — переводит изучаемую нуклеотидную последовательность в кодируемые аминокислоты, а затем сравнивает её с имеющейся базой данных аминокислотных последовательностей белков,
  • tblastn — изучаемая аминокислотная последовательность сравнивается с транслированными последовательностями базы данных секвенированных нуклеиновых кислот,
  • tblastx — переводит изучаемую нуклеотидную последовательность в аминокислотную, а затем сравнивает её с транслированными последовательностями базы данных секвенированных нуклеиновых кислот.

Геномные

предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированного генома какого-либо организма (человека, мыши и др.)

Специальные

прикладные программы, использующие BLAST:

  • bl2seq — сопоставление двух последовательностей по принципу локальных выравниваний,
  • VecScreen — определение сегментов нуклеотидной последовательности нуклеиновой кислоты, которые могут иметь векторное происхождение и др.

Принципы работы BLAST

Все выравнивания принято делить на глобальные (последовательности сравниваются полностью) и локальные (сравниваются только определённые участки последовательностей). Программы серии BLAST производят локальные выравнивания, что связано с наличием в различных белках сходных доменов и паттернов. Кроме этого локальное выравнивание позволяет сравнить иРНК с геномной ДНК. В случае глобального выравнивания обнаруживается меньшее сходство последовательностей, особенно их доменов и паттернов.

После введения изучаемой нуклеотидной или аминокислотной последовательности (запрос) на одну из веб-страниц BLAST, она вместе с другой входной информацией (база данных, размера «слова» (участка), значение величины E и др.) поступает на сервер. BLAST создаёт таблицу всех «слов» (в белке — это участок последовательностей, который по умолчанию состоит из трёх аминокислот, а для нуклеиновых кислот из 11 нуклеотидов) и сходных «слов».

Затем в базе данных проводится их поиск. Когда обнаруживается соответствие, то делается попытка продлить размеры «слова» (до 4 и более аминокислот и 12 и более нуклеотидов) сначала без гэпов (пробелов), а затем с их использованием. После максимального продления размеров всех возможных «слов» изучаемой последовательности, определяются выравнивания с максимальным количеством совпадений для каждой пары запрос — последовательность базы данных, и полученная информация фиксируется в структуре SeqAlign. Форматер, расположенный на сервере BLAST, использует информацию из SeqAlign и представляет её различными способами (традиционным, графическим, в виде таблицы).

Для каждой обнаруженной в базе данных программами BLAST последовательности необходимо определить, насколько она сходна с изучаемой последовательностью (запрос) и значимо ли это сходство. Для этого BLAST вычисляет число битов и величину Е (expected value, E-value) для каждой пары последовательностей.

При определении сходства ключевым элементом является матрица замен, так как она определяет показатели сходства для любой возможной пары нуклеотидов или аминокислот. В большинстве программ серии BLAST используется матрица BLOSUM62 (Blocks Substitution matrix 62 % identity, блоковая матрица замен с 62 % идентичности). Исключением являются blastn и megablast (программы, которые выполняют нуклеотид — нуклеотидные сравнения и не используют матрицы аминокислотных замен).

С помощью модифицированных алгоритмов Смита-Уотермана или Селлерса определяются все пары сегментов (продленные «слова»), которые нельзя увеличить, так как это приведёт к уменьшению показателей сходства. Такие пары продленных «слов» называются парами сегментов с максимальным сходством (high-scoring segment pairs, HSP). В случае достаточно большой длины изучаемой последовательностей (m) и последовательности базы данных (n) показатели сходства HSP характеризуются двумя параметрами K (размера области поиска) и P (системы подсчёта). Эти показатели необходимо указывать при приведении показателей сходства изучаемой последовательности и последовательности базы данных (S).

Для сравнения показателей сходства различных выравниваний независимо от используемой матрицы, их необходимо преобразовать. Для получения преобразованного показателя сходства (числа битов, B) используют формулу:

<math>B = (P\cdot S - \ln{K})/\ln{2} </math>

Величина B показывает, насколько сходны последовательности (чем больше число битов, тем больше сходство). Так как в формулу расчёта B заложены показатели К и P, то нет необходимости указывать их при приведении значений B. Величина E (Е-value), соответствующая показателю B, показывает достоверность данного выравнивания (чем ниже значение E, тем достовернее выравнивание). Она определяется по формуле:

<math>E = m\cdot n\cdot 2^{-B} </math>

Программы BLAST преимущественно определяют значение E, а не P (вероятности наличия хотя бы одного HSP с показателем, превышающим или равным S). Но при E < 0,01 значения P и E почти идентичны.

Величина E определяется по формуле (2) при сравнении лишь двух аминокислотных или нуклеотидных последовательностей. Сравнение изучаемой последовательности длиной m с множеством последовательностей базы данных может основываться на двух положениях. Первое положение состоит в том, что все последовательности базы данных одинаково сходны с изучаемой. Это подразумевает, что значение E для выравнивания с короткой последовательностью, содержащейся в базе данных, следует приравнять со значением E для выравнивания с длинной последовательностью. Для вычисления значения E по базе данных необходимо умножить значение E, полученное при попарном сравнении, на число последовательностей в ней. Второе положение заключается в том, что изучаемая последовательность более сходна с короткими, а не с длинными последовательностями, потому что последние часто состоят из различных участков (многие белки состоят из доменов). Если предположить, что вероятность сходства пропорциональна длине последовательности, то попарное значение E для последовательности базы данных длиной n надо умножить на N/n, где N — общая длина аминокислот или нуклеотидов в базе данных. Программы BLAST преимущественно используют этот подход для вычисления значений E по базе данных.

Теоретически локальное выравнивание может начинаться с любой пары нуклеотидов или аминокислот выровненных последовательностей. Однако HPS, как правило, не начинаются близко к краю (началу или концу) последовательностей. Для коррекции такого краевого эффекта необходимо вычислять эффективную длину последовательностей. В случае последовательностей длиной более 200 остатков происходит нейтрализация краевого эффекта.

См. также

Напишите отзыв о статье "BLAST"

Примечания

  1. S. Altschul, W. Gish, W. Miller, E. Myers, and D. Lipman. Basic local alignment search tool. Journal of Molecular Biology, 215(3):403–410, October 5, 1990.

Ссылки

  • [blast.ncbi.nlm.nih.gov/Blast.cgi NCBI Blast] (англ.)
  • [biochem.bio.msu.ru/assets/files/bioinformatics/bioinfo7_08.ppt Презентация о BLAST на русском]

Отрывок, характеризующий BLAST

– Да вот, как видишь. До сих пор всё хорошо; но признаюсь, желал бы я очень попасть в адъютанты, а не оставаться во фронте.
– Зачем?
– Затем, что, уже раз пойдя по карьере военной службы, надо стараться делать, коль возможно, блестящую карьеру.
– Да, вот как! – сказал Ростов, видимо думая о другом.
Он пристально и вопросительно смотрел в глаза своему другу, видимо тщетно отыскивая разрешение какого то вопроса.
Старик Гаврило принес вино.
– Не послать ли теперь за Альфонс Карлычем? – сказал Борис. – Он выпьет с тобою, а я не могу.
– Пошли, пошли! Ну, что эта немчура? – сказал Ростов с презрительной улыбкой.
– Он очень, очень хороший, честный и приятный человек, – сказал Борис.
Ростов пристально еще раз посмотрел в глаза Борису и вздохнул. Берг вернулся, и за бутылкой вина разговор между тремя офицерами оживился. Гвардейцы рассказывали Ростову о своем походе, о том, как их чествовали в России, Польше и за границей. Рассказывали о словах и поступках их командира, великого князя, анекдоты о его доброте и вспыльчивости. Берг, как и обыкновенно, молчал, когда дело касалось не лично его, но по случаю анекдотов о вспыльчивости великого князя с наслаждением рассказал, как в Галиции ему удалось говорить с великим князем, когда он объезжал полки и гневался за неправильность движения. С приятной улыбкой на лице он рассказал, как великий князь, очень разгневанный, подъехав к нему, закричал: «Арнауты!» (Арнауты – была любимая поговорка цесаревича, когда он был в гневе) и потребовал ротного командира.
– Поверите ли, граф, я ничего не испугался, потому что я знал, что я прав. Я, знаете, граф, не хвалясь, могу сказать, что я приказы по полку наизусть знаю и устав тоже знаю, как Отче наш на небесех . Поэтому, граф, у меня по роте упущений не бывает. Вот моя совесть и спокойна. Я явился. (Берг привстал и представил в лицах, как он с рукой к козырьку явился. Действительно, трудно было изобразить в лице более почтительности и самодовольства.) Уж он меня пушил, как это говорится, пушил, пушил; пушил не на живот, а на смерть, как говорится; и «Арнауты», и черти, и в Сибирь, – говорил Берг, проницательно улыбаясь. – Я знаю, что я прав, и потому молчу: не так ли, граф? «Что, ты немой, что ли?» он закричал. Я всё молчу. Что ж вы думаете, граф? На другой день и в приказе не было: вот что значит не потеряться. Так то, граф, – говорил Берг, закуривая трубку и пуская колечки.
– Да, это славно, – улыбаясь, сказал Ростов.
Но Борис, заметив, что Ростов сбирался посмеяться над Бергом, искусно отклонил разговор. Он попросил Ростова рассказать о том, как и где он получил рану. Ростову это было приятно, и он начал рассказывать, во время рассказа всё более и более одушевляясь. Он рассказал им свое Шенграбенское дело совершенно так, как обыкновенно рассказывают про сражения участвовавшие в них, то есть так, как им хотелось бы, чтобы оно было, так, как они слыхали от других рассказчиков, так, как красивее было рассказывать, но совершенно не так, как оно было. Ростов был правдивый молодой человек, он ни за что умышленно не сказал бы неправды. Он начал рассказывать с намерением рассказать всё, как оно точно было, но незаметно, невольно и неизбежно для себя перешел в неправду. Ежели бы он рассказал правду этим слушателям, которые, как и он сам, слышали уже множество раз рассказы об атаках и составили себе определенное понятие о том, что такое была атака, и ожидали точно такого же рассказа, – или бы они не поверили ему, или, что еще хуже, подумали бы, что Ростов был сам виноват в том, что с ним не случилось того, что случается обыкновенно с рассказчиками кавалерийских атак. Не мог он им рассказать так просто, что поехали все рысью, он упал с лошади, свихнул руку и изо всех сил побежал в лес от француза. Кроме того, для того чтобы рассказать всё, как было, надо было сделать усилие над собой, чтобы рассказать только то, что было. Рассказать правду очень трудно; и молодые люди редко на это способны. Они ждали рассказа о том, как горел он весь в огне, сам себя не помня, как буря, налетал на каре; как врубался в него, рубил направо и налево; как сабля отведала мяса, и как он падал в изнеможении, и тому подобное. И он рассказал им всё это.
В середине его рассказа, в то время как он говорил: «ты не можешь представить, какое странное чувство бешенства испытываешь во время атаки», в комнату вошел князь Андрей Болконский, которого ждал Борис. Князь Андрей, любивший покровительственные отношения к молодым людям, польщенный тем, что к нему обращались за протекцией, и хорошо расположенный к Борису, который умел ему понравиться накануне, желал исполнить желание молодого человека. Присланный с бумагами от Кутузова к цесаревичу, он зашел к молодому человеку, надеясь застать его одного. Войдя в комнату и увидав рассказывающего военные похождения армейского гусара (сорт людей, которых терпеть не мог князь Андрей), он ласково улыбнулся Борису, поморщился, прищурился на Ростова и, слегка поклонившись, устало и лениво сел на диван. Ему неприятно было, что он попал в дурное общество. Ростов вспыхнул, поняв это. Но это было ему всё равно: это был чужой человек. Но, взглянув на Бориса, он увидал, что и ему как будто стыдно за армейского гусара. Несмотря на неприятный насмешливый тон князя Андрея, несмотря на общее презрение, которое с своей армейской боевой точки зрения имел Ростов ко всем этим штабным адъютантикам, к которым, очевидно, причислялся и вошедший, Ростов почувствовал себя сконфуженным, покраснел и замолчал. Борис спросил, какие новости в штабе, и что, без нескромности, слышно о наших предположениях?
– Вероятно, пойдут вперед, – видимо, не желая при посторонних говорить более, отвечал Болконский.
Берг воспользовался случаем спросить с особенною учтивостию, будут ли выдавать теперь, как слышно было, удвоенное фуражное армейским ротным командирам? На это князь Андрей с улыбкой отвечал, что он не может судить о столь важных государственных распоряжениях, и Берг радостно рассмеялся.
– Об вашем деле, – обратился князь Андрей опять к Борису, – мы поговорим после, и он оглянулся на Ростова. – Вы приходите ко мне после смотра, мы всё сделаем, что можно будет.
И, оглянув комнату, он обратился к Ростову, которого положение детского непреодолимого конфуза, переходящего в озлобление, он и не удостоивал заметить, и сказал:
– Вы, кажется, про Шенграбенское дело рассказывали? Вы были там?
– Я был там, – с озлоблением сказал Ростов, как будто бы этим желая оскорбить адъютанта.
Болконский заметил состояние гусара, и оно ему показалось забавно. Он слегка презрительно улыбнулся.
– Да! много теперь рассказов про это дело!
– Да, рассказов, – громко заговорил Ростов, вдруг сделавшимися бешеными глазами глядя то на Бориса, то на Болконского, – да, рассказов много, но наши рассказы – рассказы тех, которые были в самом огне неприятеля, наши рассказы имеют вес, а не рассказы тех штабных молодчиков, которые получают награды, ничего не делая.
– К которым, вы предполагаете, что я принадлежу? – спокойно и особенно приятно улыбаясь, проговорил князь Андрей.
Странное чувство озлобления и вместе с тем уважения к спокойствию этой фигуры соединялось в это время в душе Ростова.
– Я говорю не про вас, – сказал он, – я вас не знаю и, признаюсь, не желаю знать. Я говорю вообще про штабных.
– А я вам вот что скажу, – с спокойною властию в голосе перебил его князь Андрей. – Вы хотите оскорбить меня, и я готов согласиться с вами, что это очень легко сделать, ежели вы не будете иметь достаточного уважения к самому себе; но согласитесь, что и время и место весьма дурно для этого выбраны. На днях всем нам придется быть на большой, более серьезной дуэли, а кроме того, Друбецкой, который говорит, что он ваш старый приятель, нисколько не виноват в том, что моя физиономия имела несчастие вам не понравиться. Впрочем, – сказал он, вставая, – вы знаете мою фамилию и знаете, где найти меня; но не забудьте, – прибавил он, – что я не считаю нисколько ни себя, ни вас оскорбленным, и мой совет, как человека старше вас, оставить это дело без последствий. Так в пятницу, после смотра, я жду вас, Друбецкой; до свидания, – заключил князь Андрей и вышел, поклонившись обоим.
Ростов вспомнил то, что ему надо было ответить, только тогда, когда он уже вышел. И еще более был он сердит за то, что забыл сказать это. Ростов сейчас же велел подать свою лошадь и, сухо простившись с Борисом, поехал к себе. Ехать ли ему завтра в главную квартиру и вызвать этого ломающегося адъютанта или, в самом деле, оставить это дело так? был вопрос, который мучил его всю дорогу. То он с злобой думал о том, с каким бы удовольствием он увидал испуг этого маленького, слабого и гордого человечка под его пистолетом, то он с удивлением чувствовал, что из всех людей, которых он знал, никого бы он столько не желал иметь своим другом, как этого ненавидимого им адъютантика.