Тільки чотири нуклеотиду

Група фізиків з ФІАН, МФТІ і МДУ розробила новий метод порівняння двох молекул РНК. Його несподіваним наслідком стала гіпотеза про статистичному механізмі вибраного використовуваного природою «чотирибуквене нуклеотидного алфавіту».

Для еволюційної біології питання порівняння ДНК і РНК послідовностей - один з ключових, зокрема, він дозволяє судити про те, наскільки далеко в еволюційному сенсі розійшлися один від одного два розглянутих гена, і які гени можуть бути їхніми спільними предками. І якщо питання порівняння двох послідовностей молекул дезоксирибонуклеїнової кислоти (ДНК) з алгоритмічної точки зору не викликає принципових труднощів, то завдання побудови алгоритму порівняння молекул рибонуклеїнової кислоти (РНК) наштовхується на серйозні перешкоди і не дивлячись на значний прогрес в цій області, до цих пір повністю не вирішена. Справа в тому, що молекули РНК містять нетривіальну вторинну структуру типу "конюшини" або "кактуса". Сергій Нечаєв (ФІАН), Михайло Тамм (МДУ) та Ольга вальба (МФТІ) пропонують метод порівняння РНК, що враховує як порядок проходження нуклеотидів, так і комбінаторики, обумовлену тим, що молекула РНК може утворити різні кактусоподобние структури.

Наука і життя // Ілюстрації

<

>

"Молекули ДНК і РНК - це нерегулярні послідовності, утворені чотирма типами" букв "- нуклеотидів. Завдання порівняння або, як кажуть," вирівнювання "послідовностей молекул ДНК, полягає в знаходженні максимальної загальної підпослідовності двох молекул. Ця підпослідовність не обов'язково складається з йдуть безпосередньо один за одним букв, вони можуть йти і з пробілами - делеціями. завдання про порівняння двох послідовностей РНК ми звели до задачі про обчислення вільної енергії комплексу двох взаємодіючих н еоднородних ланцюгів, кожна з яких може утворювати кактусоподобную структуру ", - розповідає керівник роботи, доктор фіз.-мат.наук Сергій Нечаєв.

"Уявіть собі, - пояснює Нечаєв, - що в експерименті виникла необхідність передбачити вторинну структуру синтезованої молекули РНК по послідовності нуклеотидів. Наш алгоритм дозволяє передбачити оптимальну з точки зору статистичної фізики вторинну структуру молекули РНК, яка буде відповідати мінімуму вільної енергії. При цьому ми намагалися по можливості залишатися в рамках статистичної фізики і уникати евристичних міркувань, отриманих лише на основі аналізу експериментальних даних ".

При цьому ми намагалися по можливості залишатися в рамках статистичної фізики і уникати евристичних міркувань, отриманих лише на основі аналізу експериментальних даних

Наслідком розробленого підходу стало досить несподіване спостереження. Виявилося, що якщо не обмежуватися тільки чотирма типами нуклеотидів (аденін, цитозин, гуанін і урацил), присутніми в найпростішої моделі РНК з випадковою первинної структурою, а розглянути гіпотетичний "алфавіт" з довільним числом "букв", з, то "вирівнювання" молекул РНК при з ≤ 4 і при с> 4 відбувається по-різному.

"Алфавіт, який використовує природа, - говорить Сергій Нечаєв, - виділений тим, що при числі букв, меншому або рівному чотирьом, укладання дуже довгою молекули РНК практично не містить пропусків, тобто їх частка наближається до нуля, і кожному нуклеотиду знайдеться комплементарний. у разі ж, коли число букв більше чотирьох, в дуже довгому ланцюгу РНК завжди присутня велика кількість пропусків (їх число порівняно з довжиною всього ланцюжка). число "чотири" є прикордонним: це максимальне число букв, при якому дуже довга випадкова РНК может т утворювати "досконалу" вторинну структуру, тобто у кожного нуклеотиду в послідовності знайдеться комплементарний ".

Питання про те, чому природа використовує саме 4 типи нуклеотидів, - один з найважливіших в біології та генної інженерії. Як припускають дослідники з ФІАН, МГУ і МФТІ, з точки зору статистичної фізики випадкових гетерополімера зі складною ієрархічною вторинної структурою типу РНК, число "чотири" є статистично виділеним серед всіх можливих алфавітів при вивченні проблеми вирівнювання. Для "лінійної" молекули ДНК, де кількість нуклеотидів також дорівнює чотирьом (аденозин, цітідін, гуанозин і тимидин), воно вже нічим не виділено. Це спостереження може розглядатися як непрямий аргумент на користь гіпотези "РНК-світу", згідно з якою на початковому етапі виникнення життя на Землі існували тільки РНК, а ДНК з'явилися вже в результаті їх еволюції.