Британские исследователи разработали новую общедоступную базу данных, которая, как они надеются, со временем сократится. Это потому, что база данных объединяет тысячи малоизученных белков, кодируемых генами человеческого генома, о существовании которых известно, но чьи функции по большей части неизвестны.
База данных, названная «unknome», является результатом исследований Мэтью Фримена из Школы патологии Данна при Оксфордском университете, Великобритания, и Шона Манро из Лаборатории молекулярной биологии MRC в Кембридже, Великобритания, и их коллег. Они изучили некоторые белки в базе данных и обнаружили, что большинство из них способствуют важным клеточным функциям, включая развитие и устойчивость к стрессу.
Секвенирование генома человека ясно показало, что геном человека кодирует тысячи возможных белковых последовательностей, идентичность и функции которых до сих пор остаются неизвестными. Причины этого многофакторны, включая тенденцию сосредотачивать ограниченное финансирование исследований на известных мишенях и отсутствие инструментов, включая антитела, для изучения функции этих белков в клетках.
Но авторы считают, что игнорировать эти белки рискованно, поскольку вполне вероятно, что некоторые белки, а возможно, и многие, играют важную роль в ключевых клеточных процессах и могут как дать представление, так и служить мишенями для терапевтического вмешательства.
Чтобы облегчить более быстрое исследование этого класса белков, авторы создали базу данных Unknome, которая присваивает каждому белку оценку «известности», отражающую информацию из научной литературы относительно функции, межвидовой консервации, субклеточной компартментализации и других элементов.
Согласно этой системе, существуют тысячи белков с «известной степенью», близкой к нулю. К ним относятся белки модельных организмов, а также белки генома человека. База данных открыта для всех и настраивается, что позволяет пользователям назначать свои собственные веса для различных элементов и, таким образом, генерировать собственный набор показателей известности для определения приоритетов собственных исследований.
Чтобы проверить полезность базы данных, авторы выбрали 260 генов человека, которые имеют сходные гены у мух и имеют показатель известности 1 или меньше у обоих видов, что указывает на то, что о них почти ничего не известно. Полный нокаут многих из этих генов несовместим с жизнью мух; Частичный или тканеспецифичный нокаут показал, что большинство генов участвуют в важных функциях, влияющих на фертильность, развитие, рост тканей, контроль качества белка или устойчивость к стрессу.
Результаты показывают, что, несмотря на десятилетия детальных исследований, тысячи генов мух еще предстоит понять даже на самом базовом уровне, и то же самое, очевидно, относится и к геному человека. «Эти неизведанные гены не следует игнорировать», — сказал Манро. «Наша база данных представляет собой мощную, универсальную и эффективную платформу для идентификации и выбора важных генов с неизвестной функцией для анализа, тем самым ускоряя ликвидацию пробела в биологических знаниях, представленного неизвестными геномами». "
Манро добавил: «Роль тысяч человеческих белков остается неясной, но исследования, как правило, сосредотачиваются на тех, которые уже хорошо изучены. Чтобы помочь решить эту проблему, мы создали базу данных Unknome, которая ранжирует белки в соответствии с тем, насколько хорошо они известны, а затем функционально проверяет подмножество этих загадочных белков, чтобы показать, как незнание стимулирует биологические открытия».