Эти взаимоотношения носят характер взаимного компромисса. В принципе для любого числа включенных в исследование пациентов существует определенный баланс между а- и р-ошибками: при прочих равных условиях, чем больше допускаемая величина ошибки одного рода, тем меньше должен быть риск ошибки другого рода. При этом по сути своей ни одна из них не «хуже» другой. Последствия принятия ошибочной информации за истинную зависят от клинической ситуации.

Если имеется острая необходимость в более эффективном методе лечения (например, болезнь очень опасна и нет эффективного альтернативного метода лечения) и предлагаемое лечение не опасно, то разумнее предпочесть относительно высокий риск вывода о том, что вмешательство эффективно, когда в действительности это не так (большая a-ошибка), минимизируя вероятность отвергнуть эффективный метод (p-ошибка мала). С другой стороны, если болезнь менее серьезна и существуют альтернативные методы лечения либо новый метод лечения более дорог или опасен, следует минимизировать риск применения нового вмешательства, которое может быть неэффективным (a-ошибка мала), даже за счет относительно высокой вероятности упустить действительно эффективное лечения (большая p-ошибка). Конечно, можно уменьшить обе ошибки — если число исследуемых больных велико, частота исходов высока, изучаемый показатель внутри групп варьирует мало, а предполагаемый лечебный эффект значителен.
Соотношение между величиной лечебного эффекта и необходимым числом пациентов для общепринятых уровней ра и иллюстрируют два приведенных ниже примера. Один из них представляет ситуацию, когда достаточно относительно малого числа больных, а другой — когда требуется очень большое их число.
где N — число пациентов Д — величина различия в исходах между группами Ра — вероятность a-ошибки те ложноположительного результата, Рр — вероятность P-ошибки те ложноотрицательного результата V-вариабельность наблюдений (для количественных данных), Р- доля больных с изучаемым исходом (для качественных данных)
Пример. Согласно наблюдениям серий случаев, нестероидный противовоспалительный препарат Сулиндак эффективен при полипах толстой кишки. Это предположение было проверено в рандомизированном испытании на 22 больных с семейным аденоматозным полипозом, 11 из которых получали сулиндак, а другие 11- плацебо. Через 9 месяцев у получавших сулиндак среднее число полипов было на 44% меньше, чем у получавших плацебо; различие статистически значимое (р=0,014). Поскольку лечебный эффект значителен, а на каждого пациента приходилось большое количество полипов (у некоторых более 100), для доказательства того, что лечебный эффект неслучаен, достаточно небольшого числа больных.
Пример. Исследование GUSTO, о котором упоминалось выше, было спланировано таким образом, чтобы при включении 41000 пациентов оно с вероятностью 90% обеспечивало бы обнаружение снижения летальности в экспериментальной группе на 15% или частоты летальных исходов на 1% по сравнению с контрольной группой, в зависимости от того, какой из этих показателей будет больше. При этом допустимый уровень р= 0,05, а предполагаемая летальность в контрольной группе не ниже 8%. Здесь необходим большой объем выборки, так как доля больных с неблагоприятным исходом (смерть) относительно мала, величина лечебного эффекта невелика (15%) и авторы хотели иметь относительно высокую вероятность обнаружить эффект терапии, если он присутствует (90%).
Для получения ответов на большинство возникающих в наше время вопросов относительно эффективности того или иного вмешательства требуется изучение результатов лечения очень большого числа больных. Вместе с тем эффективность таких действенных вмешательств, как введение инсулина при диабетическом кетоацидозе или хирургической операции при аппендиците, можно установить при анализе данных небольшого числа больных. Однако подобные методы лечения появляются редко и многие из них уже хорошо изучены. Теперь нам приходится рассматривать патологию с хроническим течением и с множественными взаимодействующими этиологическими факторами; эффективность предлагаемых новых методов лечения таких заболеваний, в общем, невелика. В подобной ситуации необходимо обращать особое внимание на то, достаточна ли численность больных в клиническом испытании для того, чтобы отличить истинный лечебный эффект от случайного результата.
Клиницисты должны иметь возможность оценить статистическую мощность опубликованных исследований. С этой целью мы помещаем здесь, который показывает соотношение между размером выборки и разницей в эффективности лечения для заранее известной частоты исходов.
Вообще, трудно обнаружить эффект вмешательства, если он меньше 25%. На практике статистическую мощность исследования можно оценивать с помощью доступных формул, таблиц, номограмм или компьютерных программ.