Большинство клинических исходов представляет собой итог сложного взаимодействия многих переменных. Например, ИБС развивается как комплексный результат взаимодействия нарушений липидного обмена, артериальной гипертензии, курения, наследственных факторов, сахарного диабета, гиподинамии и индивидуальных особенностей. Целесообразно вначале попытаться понять эти взаимосвязи путем изучения относительно простых сочетаний параметров, таких, которые представлены в четырехпольных таблицах (с одной зависимой переменной) или в многопольных таблицах сопряженности (анализ, оценивающий, как изменяется эффект одной переменной в присутствии или в отсутствие одной либо большего числа других переменных); такой способ представления данных облегчает их восприятие.

Однако при большом числе переменных этот метод обычно неприемлем, поскольку из-за отсутствия достаточного числа больных с каждым сочетанием факторов невозможно получить стабильные оценки показателей. Например, в исследование включено 120 больных, по 60 в каждой из групп с разным лечением. Даже если в расчет принимается только одна дополнительная дихотомическая переменная, в каждой подгруппе в лучшем случае окажется лишь по 15 больных, а при неравномерном распределении некоторые подгруппы будут содержать еще меньшее число больных.
В подобной ситуации в дополнение к построению таблиц сопряженности требуется метод оценки одновременного влияния нескольких переменных.
Включение в прогностическую модель одновременно нескольких переменных обеспечивает более точные предсказания, чем это позволяют отдельные переменные.
Основная структура многофакторной модели такова:
Переменная, характеризующая исход = константа + (Р, х переменная 1) + (fo х переменная2) +
где и р2 … — коэффициенты, которые определяются на основании имеющихся данных; переменная 1, переменная 2,… — прогностические переменные, связанные с исходом. Самые точные значения коэффициентов определяются математически, что в значительной мере зависит от вычислительной возможности современных компьютеров.
Моделирование включает в себя несколько этапов.
• Выявление и измерение всех переменных, которые могут быть
связаны с изучаемым исходом.
• Уменьшение количества рассматриваемых в модели переменных до приемлемого числа (обычно не более нескольких). Часто это делается путем отбора переменных, которые при одновременном их влиянии связаны с исходом наиболее сильно. Если статистический критерий используется на этой стадии, то обычно ошибка совершается при включении в модель переменных, у которых связь с изучаемым исходом имеет уровень значимости р<0,10. При отборе должны учитываться также сведения о биологическом значении переменной. • Если несколько переменных сильно связаны друг с другом, то следует включать в модель лишь одну из них, поскольку все эти переменные несут практически одинаковую информацию. • Включение в модель остальных переменных в определенной последовательности, в соответствии с изучаемым вопросом. Например, если при анализе причин некоторые переменные должны быть фиксированными, они включаются в модель первыми, далее следует переменная, представляющая наибольший интерес. Тогда модель позволит определить независимый вклад главной переменной. С другой стороны, если исследователь желает сделать прогноз, основанный на нескольких переменных, то они могут быть включены в порядке убывания силы их связи с исходом, что определяется самой моделью. Моделирование - постоянный атрибут современной медицинской литературы, оно присутствует примерно в 18% статей в основных медицинских журналах и почти во всех крупных исследованиях причинно-следственных связей. Широко используются такие виды моделей, как логистическая регрессия (для дихотомических исходов, имеющих место в исследованиях случай-контроль) и модель пропорционального риска Кокса (в исследованиях, где исходом является время наступления события). Многофакторное моделирование - неотъемлемая часть многих клинических исследований. Другого метода для одновременного учета или изучения многих переменных не существует. Однако эти методы имеют оборотную сторону. Модель - это "черный ящик", в который трудно заглянуть, чтобы понять, что в нем происходит. Достоверность моделей базируется на допущениях, которые могут не подтверждаться. На моделях плохо распознаются модификации эффекта (различия эффектов в разных подгруппах больных). Переменная, сильно связанная с исходом, может не появиться в модели из-за того, что она встречается редко; в результате модель оказывается нечувствительной к эффекту этой переменной по причине недостаточной информации. Наконец, на результаты моделирования сильно влияет случайная вариабельность характеристик больных в исследуемых выборках. Показано, например, что в разных случайных выборках из одного и того же массива данных модель часто идентифицировала разные прогностические факторы и распределяла их в разном порядке. Для того чтобы избежать этого, следует, пользуясь эмпирическим правилом, включать в модель лишь те прогностические факторы, с которыми связано не менее 10 случаев исхода. По этим причинам модели сами по себе не могут служить стандартом достоверности; их достоверность должна специально проверяться. Обычно для этого выясняют, предсказывает ли модель то, что выявляется в другой, независимой выборке больных. Результаты первой модели считаются гипотезой, которая должна быть проверена на новых данных. Если результаты первой модели обусловлены главным образом случайностью, то маловероятно, чтобы та же случайность имела место в выборке, используемой для проверки модели. В пользу достоверности модели свидетельствует также ее соответствие биологическим представлениям и согласованность ее результатов с результатами анализа данных, выполненного более простым и ясным способом. Резюме Основу клинической информации составляют наблюдения на выборках больных. Однако даже выборки, отобранные без систематической ошибки, могут давать искаженное представление о событиях в общей популяции из-за случайной вариации показателей у включенных в выборку пациентов. Есть два общих подхода для выявления роли случайности в клинических исследованиях - проверка гипотез и метод доверительных интервалов. При проверке гипотез с помощью статистических критериев производится оценка предположения, что наблюдаемый результат имел случайный характер. Когда в испытании сравниваются два метода лечения, возможны два рода ошибок: ошибочный вывод о предпочтительности одного метода перед другим, хотя на самом деле они не различаются по эффективности, и ошибочный вывод об отсутствии различий в эффективности при том, что в действительности один метод лучше другого. Вероятность одной и другой ошибки обозначается ра и соответственно. Мощность статистического критерия (1 -рр) - это вероятность выявления статистически значимого различия, когда оно действительно существует. Статистическая мощность зависит от числа больных в исследовании, величины лечебного эффекта, ра и частоты исходов, либо индивидуальной вариабельности реакции больных на воздействие. При прочих равных условиях статическую мощность можно повысить, увеличив число больных в исследовании, но это не всегда осуществимо. Метод доверительных интервалов заключается в использовании полученных данных для определения диапазона, который с заданной вероятностью включает в себя истинную величину эффекта. Используются точечные оценки и доверительные интервалы. Этот подход имеет много преимуществ перед методом проверки гипотез. Он позволяет сделать акцент на величине эффекта, а не на величине р - уровне статистической значимости; показывает диапазон правдоподобных величин эффекта, так что врач может соотнести представленные таким образом данные с клиническим значением эффекта; обеспечивает информацию о статистической мощности исследования. Риск ложноположительного результата возрастает при множественных сравнениях. Риск ложноотрицательного результата увеличивается, если статистическая мощность исследования невелика (обычно из-за небольшого числа включенных больных или малой распространенности изучаемого исхода). В большинстве клинических исследований рассматривается влияние многих взаимодействующих переменных. Однако результаты, полученные на этих моделях, следует интерпретировать с осторожностью, поскольку не вполне понятно, как эти модели работают, насколько они чувствительны к случайной вариации показателей и допущения, на которых эти модели основаны, могут быть не верны.