Библиотека ДИССЕРТАЦИЙ

Главная страница Каталог

Новые диссертации Авторефераты
Книги
Статьи
О сайте
Авторские права
О защите
Для авторов
Бюллетень ВАК
Аспирантам
Новости
Поиск
Объявления
Конференции
Полезные ссылки

Введите слово для поиска

Лунина Наталья Леонидовна.
Вычислительные подходы к решению фазовой проблемы кристаллографии биополимеров при низком разрешении

ИНСТИТУТ МАТЕМАТИЧЕСКИХ ПРОБЛЕМ БИОЛОГИИ
РОССИЙСКАЯ АКАДЕМИЯ НАУК

Специальность 03.00.2 - Биофизика

Диссертация
на соискание ученой степени кандидата физико-математических наук

Научный руководитель: кандидат физико-математических наук, А.Г. Уржумцев

Пущино - 1998

Содержание диссертации
Вычислительные подходы к решению фазовой проблемы кристаллографии биополимеров при низком разрешении

Введение

Глава I. Фазовая проблема при низком Разрешении. (литературный обзор)
1. Зачем нужны фазы рефлексов низкого разрешения
2. Восстановление структурных факторов низкого разрешения
2.1. Определение фаз методом максимального детерминанта
2.2. Двухшаговая процедура восстановления структурных факторов
2.3. Восстановление структурных факторов с использованием гистограмм электронной плотности
3. Классические прямые методы
4. Экспериментальные методы определения фаз структурных факторов низкого разрешения
4.1. Изоморфное замещение
4.2. Молекулярное замещение
4.3. Метод вариации контраста
4.4. Многоволновая дифракция
5. Ab-initio определение фаз при низком разрешении
5.1. Поиск в пространстве фаз
5.2. Критерии, основанные на свойствах функции распределения электронной плотности
5.2.1. Гистограмма электронной плотности
5.2.2. Топологические свойства (связность)
5.2.3. Локальная вариация плотности
5.3. Поиск в пространстве параметров
5.3.1. Сферически симметричная модель
5.3.2. Сферически несимметричная модель
5.3.3. Параметризация при помощи нескольких сфер
5.3.4. Параметризация при помощи большого числа сфер
5.3.5. Использование сферической оболочки
5.3.6. Пиксельное моделирование
5.4. Критерии поиска в пространстве параметров
5.4.1. Критерий типа R-фактора
5.4.2. Коэффициент корреляции модулей
5.4.3. Анализ упаковки
5.5. Вероятностные подходы
5.5.1. Априорные распределения с максимальной энтропией
5.5.2. Маска области как априорное распределение
5.5.3. Выбор из нескольких альтернативных масок
5.5.4. Максимум правдоподобия
5.5.5. Аппроксимация априорного распределения градиентом функции правдоподобия

Глава II. Fam - метод решения фазовой проблемы при низком разрешении
1. Предварительные сведения
1.1. Тестовый объект
1.2. Контрольный критерий: фазовая корреляция
1.3. Критерий отбора: корреляция модулей
1.4. FAM-модели
2. Связь между качеством модулей и фаз, рассчитанных по FAM - модели
2.1. Точность фаз, получаемых при помощи FAM моделей
2.2. Поиск оптимальной FAM-модели
2.3. Переформулировка задачи определения фаз
3. FAM - метод
3.1. Генерация и отбор вариантов
3.2. Кластерный анализ
3.3. Обработка кластера
3.4. Уточнение значений фаз и повышение разрешения
4. Проблема выбора наилучшего кластера
4.1. Визуальный анализ
4.2. Анализ плотности на осях вращения
4.3. Топологические свойства (связность)
4.4. Монте-Карловский тест (правдоподобие)

Глава III. Определение структуры рибосомной частицы 50S из Thermus thermophilus при разрешении порядка 40A
1. Определение структуры T50S
2. Сравнение с электронно-микроскопической моделью

Приложение. Оптимальное выравнивание наборов фаз
1. Введение
2. Выравнивание карт
2.1. Группа Р1
2.2. Нетривиальные пространственные группы
3. Использование асимметричной части множества структурных факторов
4. "Перевернутые" карты
5. Разрешенные сдвиги начала координат

Основные результаты и выводы
Список литературы

I. ФАЗОВАЯ ПРОБЛЕМА ПРИ НИЗКОМ РАЗРЕШЕНИИ
(ЛИТЕРАТУРНЫЙ ОБЗОР)

1. Зачем нужны фазы рефлексов низкого разрешения

Необходимость решения фазовой проблемы является главным препятствием на пути от полученных экспериментально значений модулей структурных факторов к картам распределения электронной плотности.

Обычно для макромолекулярных объектов эта проблема решается методами изоморфного замещения (Perutz, 1965; Blow & Crick, 1959; Blow & Rossman, 1961), аномального рассеяния или молекулярного замещения (Rossmamm, 1972). При этом достигается разрешение карт, близкое к атомному, что позволяет интерпретировать эти карты в терминах координат атомов. При этом структурные факторы низкого разрешения (разрешение ниже 10A) традиционно игнорируются в силу ряда экспериментальных и методических сложностей. Тем не менее знание фаз рефлексов низкого разрешения является весьма важным в ряде случаев, например:
• в случае, когда знание маски для области молекулы необходимо для решения фазовой проблемы при более высоком разрешении; Это включает в себя методы модификации электронной плотности (Podjarny, Rees & Urzhuntsev, 1996) и молекулярное замещение, где необходимо знание положения и ориентации объекта (Rossmann,1990);
• в случае, когда знание фаз для базовых рефлексов низкого разрешения позволяет повысить эффективность классических прямых методов (Mo etal., 1996; Mathiesen & Mo, 1998);
• в случае исследования больших макромолекулярных комплексов, когда изображения даже при низком разрешении могут нести важную структурную информацию;
• когда измеряемое дифракционное поле кристаллов ограничено низким разрешением;
• в случаях, когда исключение рефлексов низкого разрешения вызывает большие искажения в изображении объекта (Podjarny, Schevitz & Sigler, 1981; Urzhumtsev, 1991; Stenkamp, 1994).

Определение термина “низкое разрешение” зависит от традиций различных лабораторий и типа исследуемых объектов. Этот термин часто используется просто для обозначения рефлексов центральной зоны обратного пространства, не измеренных в эксперименте. Альтернативный путь - использовать термины “очень низкое разрешение” и “низкое разрешение” в соответствии с тем, как влияет рассеяние рентгеновских лучей растворителем на рефлексы этой зоны (Urzhumtsev & Podjarny, 1995; Podjarny & Urzhumtsev, 1997):
• Очень низкое разрешение (d > 25A). В этой зоне разрешения близко расположенные атомы объекта рассеивают рентгеновские лучи почти в фазе, что приводит к очень большим величинам модулей структурных факторов для некоторых рефлексов. С другой стороны, при этом уровне разрешения может использоваться модель однородного растворителя. В этом случае комплексные структурные факторы, соответствующие рассеянию растворителем, коллинеарны структурным факторам, отвечающими изучаемому объекту. Проблема учета влияния растворителя сводится поэтому к переопределению коэффициента шкалирования экспериментальных данных.

• Низкое разрешение (25A > d > 8A). В этой зоне разрешения границы области молекулы становятся более сложными, и плотность растворителя не может более рассматриваться как постоянная во всей области, занятой растворителем (Badger & Caspar, 1991; Urzhumtsev & Podjarny, 1995). Проблема моделирования влияния растворителя становится более сложной.

• Среднее и высокое разрешения (8A > d). В этой зоне разрешения влиянием растворителя на интенсивность рассеянных рентгеновских лучей можно в первом приближении пренебречь.

2. Восстановление структурных факторов низкого разрешения

Рефлексы низкого (и очень низкого) разрешения чрезвычайно важны для формирования правильных внешних очертаний изучаемого объекта.

Отсутствие даже небольшого числа структурных факторов низкого разрешения может приводить к существенным искажениям изображения и создавать значительные сложности при попытках изучать его топологические свойства (например, связность; Baker, Krukowski & Agard, 1993; Urzhumtsev, Lunin & Lunina, 1998; Lunin, Lunina & Urzhumtsev, 1998) или применять процедуры автоматической интерпретации карт электронной плотности (Lamzin & Wilson, 1993). Тем не менее эта информация часто игнорируется.

Причины кроются как в технических сложностях измерения интенсивностей рассеянных лучей при малых углах рассеяния, как и в сложности определения фаз таких рефлексов. До некоторой степени отсутствие малоугловых рефлексов может быть компенсировано кооперативным эффектом сдвигов в фазах большого числа рефлексов среднего разрешения (Brazhnikov et al. 1993). Такой сдвиг, в частности, достигается при использовании широко распространенной процедуры модификации электронной плотности: плотность вне области молекулы принудительно зануляется, и фазы, полученные преобразованием Фурье модифицированной плотности, используются вместе с экспериментальными модулями для расчета нового синтеза Фурье (Bricogne, 1974; Hendrickson, Klippenstein & Ward, 1975).

Эта процедура позволяет получить более отчетливые границы молекулы в элементарной ячейке даже при отсутствии малоугловых рефлексов, но ценой введения дополнительных ошибок в фазы структурных факторов. В этом случае рефлексам среднего разрешения “навязывается” несвойственная им роль формирования внешних очертаний молекулы.

2.1. Определение фаз методом максимального детерминанта

В случае, когда интенсивности рефлексов низкого разрешения измерены, но соответствующие фазы не определены, существенное улучшение карт электронной плотности может быть достигнуто за счет определения этих фаз и включения соответствующих рефлексов в синтез Фурье. При определении структуры тРНК было продемонстрировано (Podjarny, Schevitz & Sigler, 1981), как добавление в синтез 28 первоначально отсутствующих рефлексов низкого разрешения с фазами, определенными методом максимального детерминанта (Tsoucaris, 1970), существенно улучшило интерпретируемость карт.

2.2. Двухшаговая процедура восстановления структурных факторов

Когда и модули, и фазы для рефлексов низкого разрешения неизвестны, но имеются достаточно точные фазы для рефлексов среднего разрешения, для некоторого числа отсутствующих малоугловых структурных факторов могут быть восстановлены значения как модулей, так и фаз. Такое восстановление в неявном виде присутствует в широко применяемой процедуре автоматического определения границ молекулы, предложенной Вонгом (Wang, 1985). В явном виде процесс восстановления значений структурных факторов может быть описан как двухшаговая процедура (Urzhumtsev, 1985; Urzhumtsev, Lunin & Luzyanina, 1989). На первом шаге (нелинейная фильтрация в прямом пространстве) восстанавливаются фазы рефлексов низкого разрешения. На втором шаге (усреднение в прямом пространстве или линейная фильтрация в обратном) восстанавливаются модули (Urzhumtsev, 1991). Первый шаг состоит в том, что каждой точке в элементарной ячейке приписывается некоторый вес, отражающий вероятность того, что эта точка принадлежит области молекулы.

Определенная таким образом функция надежности используется на втором шаге процедуры для построения маски области, обладающей максимальной интегральной надежностью. Это достигается путем свертки функции надежности с некоторым гладким ядром. При благоприятных условиях в результате свертки возникает сглаженный образ области молекулы.

Существуют различные стратегии задания функции надежности. В процедуре Вонга значение надежности в точке совпадает со значением на синтезе Фурье, если это значение выше среднего, и равно нулю в противном случае. Очевидно, что все разнообразие функций, применяемых для модификации электронной плотности низкомолекулярных (Simonov, 1976) и макромолекулярных объектов (Podjarny, Rees & Urzhumtsev, 1996), может быть использовано аналогичным образом на этом этапе. В частности, при работе с синтезами среднего разрешения не только самые высокие значения электронной плотности, но и самые низкие (отрицательные) могут быть использованы как индикатор того, что точка принадлежит области молекулы.

Более сложные подход может состоять в приписывании большей надежности точкам, обладающим максимальной локальной флюктуацией электронной плотности (Jones, Walker & Stuart, 1991). Было показано, что фазы, полученные обратным преобразованием Фурье функции надежности, могут являться хорошим приближением к правильным значениям фаз малоугловых структурных факторов. Таким образом, нелинейная процедура фильтрации в прямом пространстве может рассматриваться как метод определения фаз для рефлексов низкого разрешения. Этот метод определения фаз был использован на ранних стадиях определения фактора элонгации G (Чиргадзе и др., 1991; Urzhumtsev, 1991). Здесь определенные методом изоморфного замещения фазы разрешения 30-8A были использованы для определения фаз 29 рефлексов в зоне разрешения 120-30A.

Второй шаг процедуры восстановления малоугловых структурных факторов эквивалентен (Urzhumtsev, 1985; Leslie, 1988) умножению модулей обратного преобразования Фурье функции надежности на некоторую убывающую функцию в обратном пространстве (например, гауссову функцию). Для этой цели были предложены разные сглаживающие функции (Shevyrev & Simonov, 1981; Number & Stubbs, 1985; Wang, 1985; Urzhumtsev, Lunin & Luzyanina, 1989). Было показано (Urzhumtsev, 1991), что сглаженные таким образом структурные факторы функции надежности являются разумным приближением структурных факторов низкого разрешения и могут быть добавлены в синтез Фурье, если соответствующие модули не были экспериментально определены.

2.3. Восстановление структурных факторов с использованием гистограмм электронной плотности

Альтернативная процедура определения фаз или полного восстановления отсутствующих малоугловых структурных факторов может быть основана на свойствах гистограмм электронной плотности (Lunin, 1988; 1993). Гистограммы электронной плотности (Lunin, 1988; Harrison, 1988; Luzzati, Mariani & Delacroix, 1988, Zhang & Main, 1990) могут быть предсказаны для синтезов среднего разрешения до того, как соответствующая атомная структура определена (Lunin & Skovoroda, 1991). Они чувствительны к ошибкам в фазах, и неизвестные фазы (и при необходимости модули) могут быть определены из требования, чтобы при использовании их вместе с известными структурными факторами гистограмма соответствующего синтеза Фурье была максимально близка к предсказанной. Этот подход применялся (Lunin & Skovoroda, 1991) для восстановления амплитуд и фаз примерно 30% рефлексов в зоне разрешения до 4A для “сухой” формы Y-кристаллина IIIb (Chirgadze et al., 1991), модули которых не были определены в эксперименте.

В качестве стартовой точки при минимизации расхождения гистограмм (Lunin, 1988) были использованы фазы ранее определенной “влажной” формы Y-кристаллина IIIb (Чиргадзе и др., 1986). Возможна и альтернативная техника использования гистограмм для уточнения значений фаз (Harrison, 1988; Zhang & Main, 1990), которая более близка к обычным методам модификации электронной плотности. Эта процедура более проста в реализации, чем минимизация расхождения гистограмм, но вовлекает в работу только половину ограничений, налагаемых известной гистограммой (Lunin & Vernoslova, 1991).

3. Классические прямые методы

Развитие классических прямых методов привело недавно к вдохновляющим успехам в ab-initio определении фаз для небольших белков (Miller & Weeks, 1998; Sheldrick, 1998). Однако для успешного применения этих методов требуется наличие экспериментальных данных очень высокого разрешения (порядка 1.0), и они ограничены пока структурами, содержащими не более 1000 атомов в независимой части элементарной ячейки. Первые попытки перенесения прямых методов с низкомолекулярных соединений на макромолекулы были основаны на надежде, что при изменении размеров (примерно в 10 раз) большие молекулы при низком разрешении станут похожими на малые молекулы при высоком разрешении. Эта идея была проверена на данных тРНК (Podjarny & Yonath, 1977), где для определения фаз были использованы матричные методы (Tsoucaris, 1970), которые могут рассматриваться как расширение классических прямых методов.

4. Экспериментальные методы определения фаз структурных факторов низкого разрешения

Мы обсудим ниже методы определения фаз, использующие информацию, полученную в дополнительных экспериментах. Следует заметить, что стандартные методы определения фаз для рефлексов среднего и высокого разрешения могут давать совсем плохие значения фаз для рефлексов низкого разрешения.

4.1. Изоморфное замещение

Метод изоморфного замещения обычно не позволяет надежно определить фазы структурных факторов низкого разрешения. Это связано с тем, что относительный вклад тяжелых атомов в очень сильные рефлексы малоугловой зоны становится очень мал, что ведет к большим ошибкам в определяемых фазах. Чтобы обойти эту сложность, делаются попытки использовать в качестве изоморфных добавок достаточно большие кластеры тяжелых атомов. Однако на этом пути встречаются большие экспериментальные трудности.

4.2. Молекулярное замещение

При наличии приближенной модели исследуемого объекта для определения фаз может быть использован метод молекулярного замещения (Rosmann, 1972). Однако этот метод, естественно, должен быть модифицирован для работы при низком разрешении, поскольку в качестве приближенной модели здесь более уместно использовать некоторую оболочку (например, полученную методами электронной микроскопии), чем атомную модель структуры. С технической точки зрения это не вносит существенных изменений в метод, поскольку поиск положения и ориентации модели в ячейке осуществляется путем сравнения экспериментальных и рассчитанных модулей структурных факторов, и при этом не имеет значения, как рассчитаны структурные факторы - по атомной модели или по некоторой оболочке. Тем не менее, некоторые изменения в методику должны быть внесены.

В частности, было показано (Urzhumtsev & Podjarny, 1995), что при низком разрешении используемая в качестве критерия функция корреляции дает более надежные результаты, чем функция перекрытия синтезов Паттерсона. С этими изменениями стандартные пакеты программ, такие как AMoRe (Navaza, 1994; Navaza & Vernoslova, 1995), могут быть успешно применены для правильного размещения оболочки в элементарной ячейке кристалла.

Отметим, что фазы, рассчитанные по размещенной таким образом оболочке, могут быть использованы, например, для определения мест расположения кластеров из тяжелых атомов (Ban et al., 1998).

4.3. Метод вариации контраста

Рассеивающая сила растворителя может быть изменена либо изменением концентрации солей (Bragg and Perutz, 1952) при использовании рентгеновского излучения, либо изменением соотношения D2O и H2O (Roth, 1987; Bentley et al.; 1987) при использовании рассеяния нейтронов. Это создает возможность определять значения фаз структурных факторов за счет использования разностей в интенсивностях рассеяния при разном уровне контраста (Carter et al., 1990).

Запрос на полный текст диссертации присылайте на адрес kulseg@mail.ru

Биология
Ветеринария
География
Искусствоведение
История
Культурология
Медицина
Педагогика
Политика
Психология
Сельхоз
Социология
Техника
Физ-мат
Филология
Философия
Химия
Экономика
Юриспруденция

Подписаться на новости библиотеки





Пишите нам
X