Величина эффекта (например, лечебный эффект в клиническом испытании или относительный риск в когортном исследовании), наблюдаемая в конкретном исследовании, называется точечной оценкой эффекта. Эта оценка лучше всего отражает истинную эффективность вмешательства и, кроме того, является обобщающим статистическим показателем, на который обычно делается основной акцент в научных публикациях.

Однако истинная величина лечебного эффекта обязательно отличается от наблюдаемой в исследовании. В каждом конкретном исследовании результат будет либо выше, либо ниже истинной величины из-за случайной вариации. Следовательно, нужна обобщающая оценка степени вариации, которую можно ожидать вследствие случайности.
Статистическая точность оценки наблюдаемой величины эффекта выражается доверительным интервалом (confidence interval), обычно 95%, охватывающим область по обе стороны от точечной оценки. Доверительный интервал величины эффекта интерпретируется следующим образом: если в исследовании отсутствовала систематическая ошибка, то этот интервал с вероятностью 95% включает в себя истинную величину лечебного эффекта. Чем уже доверительный интервал, тем ближе точечная оценка эффекта к истинной величине. Истинная величина с наибольшей вероятностью находится вблизи точечной оценки, менее вероятно — у границ доверительного интервала и с еще меньшей вероятностью (5 из 100) может выходить за пределы интервала. Статистическая точность возрастает с увеличением статистической мощности исследования.
Доверительные интервалы дают информацию, аналогичную статистической значимости. Если точка, соответствующая полному отсутствию лечебного эффекта (например, относительный риск, равный 1, или различие в эффективности лечения, равное 0), лежит за пределами 95% доверительного интервала наблюдаемого эффекта, то результаты скорее всего статистически значимы при уровне значимости 0,05. Если эта точка находится внутри доверительного интервала, то результаты статистически незначимы.
Доверительные интервалы имеют ряд преимуществ. Они позволяют сделать акцент на величине эффекта. Доверительные интервалы позволяют читателям увидеть диапазон правдоподобных оценок и с учетом этого решить, согласуется ли величина эффекта, которую они считают клинически значимой, с результатами исследования. Кроме того, доверительные интервалы дают представление о статистической мощности. Если размах доверительного интервала относительно велик и величина, соответствующая отсутствию эффекта, лежит на периферии интервала, то для установления статистически значимого различия следует увеличить мощность исследования. 
Пример. показаны точечные оценки и их доверительные интервалы для относительного риска развития трех заболеваний: рака эндометрия, рака молочной железы и перелома шейки бедра при приеме эстрогенов. (Обратите внимание, что риск представлен на логарифмической шкале, а это создает впечатление более узких, чем на самом деле, доверительных интервалов для более высоких рисков.) Наблюдаемый относительный риск развития рака эндометрия (после 8 и более лет лечения эстрогенами) составляет 8,22, но это не точно соответствует истинной величине, которая вполне может быть более высокой — 10,61 или более низкой — 6,25. В любом случае маловероятно, что она окажется равной 1,0 (отсутствие риска). Что касается рака молочной железы, то, согласно результатам исследования, прием эстрогенов вряд ли может быть фактором риска развития этого заболевания; точечная оценка относительного риска близка к 1,0. Данные также указывают на то, что либо вредное воздействие эстрогенов незначительно, либо их профилактическая эффективность мала. И наконец, прием эстрогенов вполне вероятно может предупреждать переломы шейки бедра. Верхняя граница доверительного интервала находится ниже 1,0, т.е. профилактический эффект статистически значим при р= 0,05.
Точечные оценки и доверительные интервалы используются для характеристики статистической точности любого показателя частоты (заболеваемости и распространенности), сравнения показателей частоты (относительных и добавочных рисков) и других обобщающих статистических показателей. Например, отдельные исследования показали, что 34% взрослых американцев пользовались нетрадиционными методами лечения (95% доверительный интервал от 31 до 37%), что при интенсивной терапии больных инсулинзависимым сахарным диабетом риск развития ретинопатии снижается на 76% (95% доверительный интервал от 62 до 85%) по сравнению с обычным лечением, что чувствительность клинического обследования для выявления спленомегалии составляет 27% (95% доверительный интервал от 19 до 36%).
Однако оценка все еще применяется — в силу традиции и из-за удобства использования в исследованиях, где представлено много данных и для всех трудно привести доверительные интервалы.