Большая База Рефератов - Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков - бесплатно рефераты, скачать рефераты, рефераты на тему

Инфракрасная спектроскопия и спектроскопия кругового дихроизма. Методы определения вторичной структуры белков

, (1.2.6)

где

. (1.2.7)

Здесь - среднее число аминокислот на a-спиральный участок цепи в молекуле белка.

Параметры , , и в уравнении (1.2.7) были найдены на основе спектра КД миоглобина. Они имеют следующие значения:

j	, нм	, нм	, град×см2×дмоль-1
1	223.4	10.8	-3.73×10	2.50
2	206.6	8.9	-3.72×10	3.50
3	193.5	8.4	+10.1×10	2.50

Эти параметры для глобулярных белков с достаточно большой точностью можно считать постоянными. Попытки оценить для конкретных белков по их спектрам КД оказались ненадежными. Для большинства исследованных белков этот параметр оказался равным примерно 10-11 аминокислотам на a-спиральный сегмент. Распространяя этот факт на все анализируемые белки, авторы данного метода положили равным 10.

Вклад b-структуры в спектр КД белка оказывается зависящим от гораздо большего числа параметров: не только от числа аминокислотных остатков на сегмент, но и от числа нитей в данном участке структуры и их направленности, поэтому его описание простым уравнением, подобным уравнению (1.2.7), невозможно. То же самое касается b-изгиба и, особенно, “неупорядоченной” формы, под которой подразумевается все, не относящееся к другим классам. Используемые в данном методе эталонные спектры b-структуры, b-изгиба и “неупорядоченной” формы являются статистически усредненными по белкам, используемым в качестве базисных.

Процедура анализа спектра КД исследуемого белка подразделяется на два этапа. Первый этап заключается в вычислении эталонных спектров структурных элементов, то есть значений , , и для длин волн в диапазоне 185-240 нм с интервалом в 1 нм, на основе экспериментальных спектров КД пятнадцати эталонных белков со значениями , , , , , известными из рентгеноструктурного анализа. Эталонный спектр, соответствующий a-спирали, может быть вычислен непосредственно по формуле (1.2.7). Остальные эталонные спектры находятся из уравнения (1.2.6) с помощью метода наименьших квадратов, причем для уменьшения числа неизвестных в этом уравнении из экспериментального спектра КД каждого эталонного белка исключается вклад a-спиральной формы, вычисленный по формуле (1.2.7). Эталонные спектры, вычисленные с помощью данного метода показаны на рисунке 1.2.1.

Когда эталонные спектры найдены, могут быть вычислены коэффициенты , , , в уравнении (1.2.6), примененном к спектру КД исследуемого белка. Для этого также используется метод наименьших квадратов. Он заключается в подборе таких коэффициентов , что

minimum. (1.2.8)

Здесь - экспериментальный, а - рассчитанный по формуле (1.2.6) спектр КД исследуемого белка; - число точек в спектре. Коэффициенты , являющиеся решением уравнения (1.2.8) с учетом условий (1.2.2), представляют собой искомые доли структурных элементов во вторичной структуре белка.

Метод "регуляризации" [4].Подход к анализу спектра КД белка, лежащий в основе предыдущего метода, заключается в определении эталонных спектров, которые, как можно было бы предполагать, полностью характеризуют структурные элементы, образующие вторичную структуру исследуемого белка. Однако, как показывают экспериментальные данные, ни один эталонный спектр не может точно описать все разновидности таких обширных и достаточно неопределенных классов, как a-спираль, b-структура, b-изгиб и др.

Конформация элементов вторичной структуры глобулярных белков значительно отличается от идеальной. Кроме этого, вклад каждого структурного класса в спектр КД белка зависит от очень многих параметров, о которых упоминалось выше. Для учета всего разнообразия типов вторичной структуры белков требуется расширить исходный набор базисных спектров. В результате возникающей при этом избыточности начальных данных обычный метод наименьших квадратов становится неустойчивым к экспериментальной ошибке и приводит к заведомо неверным результатам. Применение метода "эталонных спектров" в том виде, как он описан в предыдущем пункте, к большому базисному набору спектров оказывается, по сути, некорректным.

Эту проблему частично можно разрешить, заменив метод наименьших квадратов моделью, применение которой, на первый взгляд, не вполне оправдано и адекватно, но зато приводит к устойчивому к экспериментальной ошибке результату даже в случае большого числа параметров. Применение такой стабилизирующей модели позволяет подойти к анализу спектров КД с другой стороны. А именно, появляется возможность прямого представления спктра КД исследуемого белка в виде линейной комбинации базисных спектров. Таким образом удается полностью избежать проблемы, связанной с определением эталонных спектров отдельных структурных классов и проводить более гибкий и точный анализ с использованием реальных белковых спектров.

Рассмотрим данный метод более подробно. Предположим, что нам удалось представить спектр КД исследуемого белка в виде линейной комбинации спектров базисных белков, структура которых известна из рентгеноструктурного анализа. Обозначим число этих спектров через (в данном методе =16). Тогда можем записать:

, (1.2.9)

где - спектр КД (эллиптичность) исследуемого белка.

Обозначим долю аминокислот j-ого базисного белка в i-ом структурном классе через , тогда базисные спектры могут быть представлены в виде суперпозиции идеализированных эталонных спектров , соответствующих отдельным структурным классам:

. (1.2.10)

Аналогично для спектра КД исследуемого белка:

. (1.2.11)

Подставляя равенства (1.2.10) и (1.2.11) в уравнение (1.2.9), получим связь искомых коэффициентов с известными (из рентгеноструктурного анализа) коэффициентами :

. (1.2.12)

Проблема заключается в определении коэффициентов в разложении (1.2.9). В подобных задачах широко применяется метод наименьших квадратов, определяющий коэффициенты из следующего условия:

minimum (1.2.13)

с ограничениями

и. (1.2.14)

Здесь и - экспериментальное и рассчитанное по формуле (1.2.9) значения для эллиптичности на длине волны , - число точек в спектре.

Согласно теореме Гаусса-Маркова, среди линейных несмещенных оценок оценка, получаемая с помощью метода наименьших квадратов, является наиболее эффективной в том смысле, что рассчитанные с его помощью коэффициенты наиболее близки к своим истинным значениям. Однако, при больших значениях метод наименьших квадратов становится крайне неустойчивым к экспериментальной ошибке. Повышение стабильности метода за счет снижения величины , в свою очередь, также приводит к заметной ошибке.

Авторы метода [4] нашли выход в использовании вместо метода наименьших квадратов линейной смещенной оценки, определяемой следующим условием:

minimum. (1.2.15)

Эта оценка является смещенной и, следовательно, приводит к систематической ошибке. Тем не менее при больших значениях она дает значения более близкие реальным, чем получаемые с помощью метода наименьших квадратов. Очевидно, что уравнение (1.2.15) также необходимо дополнить условиями (1.2.14).

Рассмотрим критерий (1.2.15) более подробно. При a=0 мы получаем обычный метод наименьших квадратов, не пригодный в нашем случае. При a>0 второй член в левой части (1.2.15) является регуляризатором. Он стабилизирует решение, поддерживая коэффициенты малыми (близкими к 1/). Тем не менее, если некоторый спектр содержит компоненты, которые хорошо аппроксимируют , это ограничение не будет иметь такой силы, так как минимизация левой части уравнения (1.2.15) сможет быть достигнута в большей степени уменьшением первого члена, чем второго, что приводит к наиболее оптимальному значению . Таким образом получается очень гибкая, но стабильная модель, которая самостоятельно выбирает из большого набора базисных спектров те, которые аппроксимируют данные наилучшим образом. В случае анализа спектров КД белков уравнению (1.2.15) можно дать следующую интерпретацию. Поскольку априори нельзя сказать, какой из спектров будет аппроксимировать лучше, ни один из них не имеет преимущества, и все коэффициенты полагаются приблизительно равными, близкими к 1/ (смотри условия (1.2.14)).

При возрастании параметра a точность аппроксимации экспериментальных данных падает за счет уменьшения эффективного числа степеней свободы, соответствующего числу свободных параметров в обычном методе наименьших квадратов. Обычно при малых a это происходит медленно, но когда этот параметр становится слишком большим, число степеней свободы становится таким малым, что коэффициенты становятся равными 1/, и метод полностью теряет свою гибкость. Выбор параметра a определяется оптимальным компромиссом между гибкостью и стабильностью модели, тем самым давая наилучшие значения . Авторы данного метода осуществляли выбор a с помощью автоматического статистического теста на относительное увеличение отклонения аппроксимирующего спектра (реконструированного из спектров эталонных белков) от экспериментальных данных при увеличении этого параметра.

Если при анализе спектра КД белка нам известно, что среди белков базисного набора есть белки, структурно схожие с исследуемым, то в уравнение (1.2.15) можно ввести эти данные с помощью различного взвешивания отдельных членов второй суммы этого уравнения, тем самым давая соответствующим коэффициентам большую свободу изменения. Однако сделать это объективно и количественно довольно сложно, поэтому авторы метода не пользовались этим. Как показывают эксперименты, в случае структурной схожести белков соответствующие коэффициенты автоматически выбираются наибольшими без какой-либо дополнительной информации.

Метод "ортогональных спектров" [5,6]. Основой данного метода является метод собственных векторов многокомпoнентного матричного анализа. Он позволяет проводить быструю обработку больших наборов данных с помощью формирования из них ортогональных компонент в виде собственных векторов с соответствующими собственными значениями.

Страницы: 1, 2, 3, 4, 5, 6

В соцсетях