Основные методы исследований в эпидемиологии

Основные методы исследований в эпидемиологии Основные методы исследований в эпидемиологии.

Из книги : Campbell M. Machin D. Medical Statistics. A commonsense approach. John Wiley Sons, Ltd, Chichester, 2003. 203 p.

Целью данной главы является анализ различных исследовательских дизайнов и описание слабых и сильных сторон различных видов исследовательских планов. Значительные усилия, затраченные на стадии планирования, могут позволить избежать потенциальных проблем при проведении исследования, указать четкие направления для удовлетворительного анализа и суммирования результатов.

Определение целей исследования.

Таблица 2.1 суммирует основные положения, которые следует принимать во внимание при планировании исследования или при чтении научно-исследовательского отчета. Таким образом, прежде чем проводить клиническое испытание, вначале необходимо определить на какие вопросы оно будет пытаться дать ответ. В большинстве ситуаций достаточно сложным является идентификация одного единственного вопроса. Например, если бы нас попросили изучить эффективность нового лекарственного средства, то вопрос звучал бы таким образом: «Является ли новое лекарственное средство лучшим по сравнению с лекарственными средствами, которые используются в настоящий момент для лечения данного заболевания?» Второй вопрос может указывать на необходимость обнаружения нежелательных побочных эффектов (если они вообще существуют), кроме того, могут быть еще другие дополнительные, но в то же время важные вопросы. Однако всегда желательно иметь основную цель. Вторичные цели должны быть также четко определены, но их должно быть настолько мало, насколько это только возможно. Кроме того, необходимо также продумать насколько основные вопросы стоят того, чтобы на них искать ответы. Например, если тестовое лекарственное средство является всего лишь небольшой модификаций стандартного лекарственного средства, любые различия в эффективности, скорее всего, будут небольшими и, соответственно, они не будут иметь клинической значимости . Исследование нового лекарственного средства может показать, что эффективность нового лекарственного средства является статистически значимой по сравнению со стандартным лекарственным средством, однако очень незначительно. Подобные результаты, по всей вероятности, не приведут к изменению клинической практики. Вопросы, которые уже ставились, четкие и понятные из медицинской литературы ответы, как правило, не должны ставиться в новых исследованиях.

Таблица 2.1 Планирование исследования – определение целей.

(1) Что является основной целью исследования.

(2) Насколько однозначно она определена.

(3) Насколько значима она с клинической точки зрения.

(4) Насколько четко описаны дополнительные цели исследования.

На ранней стадии необходимо определить соответствующие конечные точки. Например, в исследовании по изучению нового лекарственного средства необходимо четко определить, что мы понимаем под эффективностью, причем таким образом, чтобы это было легко проверить у каждого пациента, вошедшего в данное исследование.

Медицинское исследование требует внимательного планирования и выполнения исследования, поэтому в формальном протоколе исследования описание дизайна является обычным. В протоколе необходимо определить все аспекты исследования — от дизайна, до указания формы конечного анализа. Протокол является документом, к которому можно обращаться по мере того, как исследование продвигается вперед. Более четко детали, связанные с содержанием протокола, описаны в разделе 8.3. Необходимо подчеркнуть, что форма статистического анализа определяется типом использованного дизайна.

Во многих случаях бывает важно отделить исследовательскую активность от повседневной клинической практики. Например, для перегруженной клиники не всегда является правилом очень аккуратно записывать артериальное давление пациента, да еще и удостоверяться в том, что до измерения артериального давления, пациент определенное количество времени находится в покое, поскольку в обычных условиях, целью измерения, в основном, является установление наличия выраженной гипертензии у пациента. Однако если пациент участвует в клиническом исследовании, в котором определяются изменения уровня артериального давления, вызванные лечением, потребуется значительно больше внимания к стандартизации техники измерения артериального давления и детализации записи этих измерений. Для клинических исследований обычно имеет смысл создавать специальные формы сбора данных, которые запрашивают от исследователя всю соответствующую информацию, вне зависимости от того, находится ли пациент в лаборатории, амбулатории, клинике или больничной палате.

Иногда прежде, чем будет продолжено чтение литературы, оказывается достаточно полезным провести классификацию исследовательских отчетов в типы исследования. Это поможет указать исследователям на важные вопросы, которые могут быть для них незнакомыми и указать на то, как правильно проводить соответствующий анализ. Сообщение, которое сложно классифицировать, может быть не смогло адекватно описать дизайны исследования, являющиеся неотъемлемой частью оценки и понимания исследования. Bailar и Mosteller (1986) создали классификацию биомедицинских исследований, представленную в таблице 2.2.

Таблица 2.2. Классификация биомедицинских исследований.

С. Изучение процесса заболевания.

Основное разделение в этой классификации проводится между лонгитюдными и кросс секционными исследованиями. Лонгитюдные исследования изучают процесс на протяжении некоего периода времени. Примерами являются клинические испытания, когортные исследования, или исследования по типу случай-контроль. Кросс секционные исследования описывают феномен на данный момент времени. Примером может служить описание различных стадий рака молочной железы. Большинство исследований, которые изучают эффекты внешних факторов на человека, являются лонгитюдными, в то время как лабораторные исследования биологических процессов очень часто являются кросс секционными. Лонгитюдные исследования делятся на проспективные и ретроспективные исследования. В проспективных исследованиях обследуемые группируются в соответствии с «воздействием» некоего фактора. Таким образом, общий период использования пероральных контрацептивов женщиной может определяться как «воздействие», а интересующим результатом может быть развитие (или какие-то другие формы диагностики) рака молочной железы у этой женщины. В ретроспективных исследованиях пациенты вначале делятся по результатам, например на женщин с раком молочной железы (случай) и женщин, у которых нет рака молочной железы (контроль). Эффекты «воздействия», такие как период использования пероральных контрацептивов, определяются ретроспективно.

Рандомизированные клинические испытания.

Клинические испытания определяются как проспективное исследование, которое изучает относительную эффективность лечения, или каких-либо других вмешательств на людях. Во многих случаях одним из воздействий является стандартная терапия (контрольная группа), а в других – новая терапия (тестовая группа). Рандомизация – это процедура, во время которой за счет случайных факторов происходит разделение обследуемых на изучаемые группы таким образом, чтобы то, в какую группу попадет тот или иной исследуемый не могло быть предсказано заранее. Основной причиной рандомизации является то, что она приводит к формированию исследуемых групп, сравниваемых по неизвестному, так же как и по известным факторам, которые могут воздействовать на результаты лечения. Рандомизация также гарантирует, что вероятности, полученные от статистических тестов, являются достоверными, хотя это скорее техническая характеристика. Необходимость рандомизации очень часто недооценивается, и поэтому важно отличать рандомизацию от неопределенного разделения и систематического разделения. Типичным систематическим методом разделения является разделение пациентов на группу вмешательства или группу контроля по мере того, как они появляются в клинике. Исследователь может утверждать, что факторы, которые определяют когда тот, или иной человек придет в клинику в данный момент времени, являются случайными и поэтому разделение на группы вмешательства, тоже случайно. Проблемой, однако, является то, что можно предсказать какое лечение будут получать пациенты сразу же после, или даже до того, как они прошли исследование для включения в клиническое испытание. Это знание может затем воздействовать на исследователя, который определяет, какие пациенты будут допущены к исследованию, а какие нет. Это, в свою очередь может привести к ошибкам при сравнении групп воздействия.

Рисунок 2.1 Клиническое испытание с параллельным дизайном. ( Population – популяция, Assessment – обследование, Eligible and willing subjects – подходящие и согласные на участие пациенты, Randomisation – рандомизация, Test – испытываемое лечение, Control – контрольная группа.

При параллельном дизайне одна группа получает тестовое лечение, другая группа является контрольной. Подобные характеристики представлены на рисунке 2.1.

Пример из литературы . Thomas (1987) случайным образом разделил пациентов, которые консультировались с ним по поводу незначительных заболеваний: на либо «положительную», либо «отрицательную» консультацию. Через две недели он обнаружил, что 64% из тех, кто получил «положительную» консультацию почувствовали себя лучше, в то же время среди тех, кто получил «отрицательную» консультацию только 39% почувствовали себя лучше, несмотря на тот факт, что обе группы получали одинаковое лечение. Был использован статистический анализ для того, чтобы продемонстрировать, что мало вероятно, чтобы эти различия возникли в результате действия случайных факторов. Вывод заключается в том, что те пациенты, которые получили «положительную» консультацию с большей вероятностью чувствуют себя лучше.

При перекрестном дизайне пациенты получают как контрольное, так и тестовое воздействие в рандомизированном порядке. Это противоположно дизайну с параллельными группами, при этом дизайне каждый пациент является основой для получения оценки различий между тестовым воздействием и контрольным воздействием. Ситуации, когда перекрестные исследования могут оказаться полезными, включают в себя хронические заболевания, остающиеся стабильными на протяжении длительного периода времени (такие, например, как диабет или артрит), и где целью лечения является палеативное воздействие, а не излечение.

Пример из литературы . Scott и соавторы (1984) провели исследование Акарбозы и плацебо (неактивного лечения) у больных с инсулин-независимым диабетом. После двухнедельного периода подготовки для того, чтобы пациенты познакомились с деталями исследования, 18% были случайно разбиты на группы, которые получали либо плацебо, либо активный препарат. Через один месяц пациенты поменялись местами, и одни стали получать активный препарат (вместо плацебо), а другие стали получать плацебо (вместо активного препарата) на протяжении еще одного месяца. В последнюю неделю каждого месячного периода измерялся процент гликозилированного гемоглобина ( HbA 1.

Двухпериодный дизайн с перекрестом приведен на рисунке 2.2. Различия между процентом HbA 1% после приема плацебо и Акарбозы были подсчитаны для каждого пациента. В среднем различия между активным периодом и периодом плацебо составляли 0,3% и стандартным отклонением 0,5%, что продемонстрировало крайне незначительный эффект Акарбозы на HbA 1.

Рисунок 2.2. Двухпериодное клиническое испытание с перекрестным дизайном. ( Population – популяция, Assessment – обследование, Eligible and willing subjects – подходящие и согласные на участие пациенты, Randomisation – рандомизация, Test – испытываемое лечение, Control – контрольная группа.

Двухпериодный дизайн с перекрестом и двумя воздействиями (2х2) при тестировании той же самой гипотезы имеет преимущество по сравнению с дизайном с параллельными группами, поскольку испытуемый действует как собственный контроль, и поэтому количество пациентов, которое требуется для проведения подобного исследования значительно меньше.

Однако имеется некоторое количество проблем. Одна из проблем испытания с перекрестными дизайнами заключается в возможности эффекта определенного воздействия лечения, используемого в первый период лечения, который будет сохраняться во втором периоде и поэтому может вмешиваться в действия, проводимые во втором периоде лечения. (И таким образом будет мешать финальному сравнению между двумя методами лечения). Для того чтобы исключить эту возможность используется период «вымывания», в который не дается никакого лечения, (он вставляется между двумя периодами воздействия). Другие сложности заключаются в том, что заболевание может и не оставаться стабильным на протяжении времени клинического испытания, поскольку существует достаточно длительный период лечения, большее количество пациентов будут выходить из исследования, по сравнению с дизайном параллельных групп. Senn (1993) обсудил эти вопросы с большей подробностью.

Перекрестные исследования приводят к тому, что проводится парный анализ. Неправильно будет анализировать исследование, игнорируя эти пары, поскольку такой анализ не будет принимать во внимание всю информацию, которая содержится в дизайне исследования. Дальнейшие вопросы дизайна и анализа рандомизированных клинических испытаний обсуждаются в 8 главе.

Кластерные рандомизированные исследования.

В виду природы планируемых вмешательств, в некоторых случаях может оказаться не возможным рандомизировать индивидуумов в данном исследовании. Например, исследователь может рандомизировать общины для того, чтобы протестировать различные типы методов профилактики и укрепления здоровья, или различные типы вакцины, когда проблема переноса эффекта на других означает, что лучше рандомизировать группу, а не индивидуума. С другой стороны кто-то может захотеть протестировать различные способы консультирования пациентов в соответствии с планом рандомизации, и профессионалу здравоохранения, который получил подготовку по новому подходу, сложно будет переключаться на различные методы для различных пациентов. Например, десять сотрудников здравоохранения могут стать участниками подобного исследования, а затем они будут рандомизированы по пять в каждой группе для того, чтобы получить обучение (или не получать обучения) по новой технике проведения консультаций. Затем эти профессионалы рекрутируют определенное количество пациентов, которые формируют соответствующие кластеры, и они все получают консультирование в соответствии с обучением, которое было у данного специалиста. Простейшим способом анализа этих исследований будет их анализ по группам, а не на основе каждого индивидуума ( Bland и Kerry. 1997.

Пример из литературы. Kinmonth и соавторы (1998) описали исследование «пациент центрированного ухода» для пациентов, у которых недавно был поставлен диагноз сахарного диабета. Сорок один врач общей практики были рандомизированы для того, чтобы: либо пройти трехдневный курс по новому пациент центрированному методу, или получить только руководство, выпущенное ассоциацией по борьбе с сахарным диабетом. В качестве результата измерялся индекс массы тела у пациентов, и уровень HbA 1с через один год после проведения вмешательства. В данном случае для врача общей практики было невозможно вернуться к старым методам ведения пациента, после того как он получил соответствующее обучение, и поэтому был выбран кластерный дизайн с единицей рандомизации в виде единицы обще врачебной практики.

Факториальные исследования используются для того, чтобы оценить два или более вмешательства одновременно. Обратите внимание на то, что факториальные исследования – это не исследования, которые балансирует прогностическими факторами, такими как возраст и пол, не являющиеся вмешательствами.

Пример из литературы. McMaster и соавторы (1985) описывают исследование, которое использовалось для оценки материалов по обучению женщин само обследованию молочных желез. В комнатах ожидания центров здоровья, в которых женщины ожидали приема у своего врача общей практики, были оценены четыре различных экспериментальных условия. Использовались следующие методы.

(А) Никаких брошюр, никаких записей или картинок (контрольная группа.

(В) Представлены брошюры.

(Д) Брошюры и видеопрограмма.

Два метода вмешательства – это брошюры и видеопрограмма. Оценка четырех экспериментальных условий проводилась на протяжении четырех рабочих дней (с понедельника по четверг), на протяжении трех недель. Для того чтобы удалить возможные ошибки, использовалась экспериментальная процедура с Латинскими квадратами, в которых каждое экспериментальное условие оценивалось в один из четырех рабочих дней.

Воздействия, которые известны под названием факторы, обычно применяются только на одном уровне (т.е. некое воздействие либо присутствует, либо отсутствует, и нет различных уровней одного и того же воздействия). Эти методы полезны в двух случаях: во-первых, клиницист может считать, что два воздействия вместе могут приводить к появлению эффекта, превышающего тот, который мы бы получили, если бы просто добавили два эффекта по отдельности ( синергия ) и очень часто подобная ситуация статистически выражается как взаимодействие . С другой стороны клиницист может считать, что взаимодействие является маловероятным. В данном случае для того, чтобы оценить эффект двух воздействий, потребуется меньше пациентов, чем количество пациентов из двух исследований с параллельными группами, каждая из которых изучает эффект одного из этих двух лечений.

Использование факториального дизайна 2х2 позволяет получить ответ сразу же на два вопроса. Таким образом группы А и В против С и Д измеряют значимость видеопрограммы, в то время как группы А и С против В и Д измеряют значимость брошюр.

Не рандомизированные исследования.

В обсуждении, связанном с клиническими испытаниями, мы указали на необходимость рандомизированного разделения людей на группы воздействия. В некоторых случаях, однако, рандомизация невозможна. Одним из подобных экспериментов является исследование, включающее трансплантацию сердца и последующее изучение выживаемости пациентов. Будет очень сложно вообразить рандомизацию между трансплантацией сердца и какой-то другой альтернативой, поэтому в подобной ситуации максимум, что можно сделать – это сравнить выживаемость после трансплантации, с предыдущим опытом от пациентов, которые страдали от того же самого заболевания, когда метод трансплантации отсутствовал. Подобные пациенты называются историческим контролем . Второй возможностью является выполнение сравнений с теми, кому не удалось найти донора до того, как пациент умер. Проблемы имеются с обоими подходами. Одной проблемой является то, что люди, с наиболее тяжелыми заболеваниями умирают быстрее. Наличие любого времени ожидания для соответствующего донора предполагает, что те люди, у которых имеется менее тяжелое заболевание, переживут это время ожидания. Это явно смещает результаты при сравнении кривых выживаемости в группе получивших трансплантацию, по сравнению с группой не получивших трансплантации.

Исследования пре тест / пост-тест.

Исследования пре тест / пост-тест – это исследование, в котором группы индивидуумов проходят через какое-то измерение, затем она подвергается воздействию, и показатели вновь измеряются. Целью этого исследования является выявление размера эффекта от лечения. Основной проблемой является то, что изменения в измерениях приписываются к воздействию, несмотря на то, что за временной интервал, который прошел между двумя измерениями, могли измениться и другие факторы.

Пример из литературы . Christie (1979) описывает пример, в котором сравнение до-и-после оказывается неправильным. Он описывает последовательную серию пациентов, которые были госпитализированы с инсультом в 1974 году и наблюдались проспективно до смерти, а затем подсчитывалось время их выживания. Затем, когда был установлен компьютерный томограф, в 1978 году исследование было проведено повторно с целью оценки эффективности томографа.

Таблица 2.3 Пример ошибочного исследования до-и-после.

Последовательная группа пациентов 1978 года, подвергнутая компьютерному сканированию, была сравнена с подобранной (по возрасту, диагнозу и уровню сознания) с группой пациентов в серии 1974 года. В качестве результата измерялась продолжительность выживания от момента развития заболевания. Результаты, приведенные в таблице 2.3 во втором столбце, как кажется, демонстрируют значительное улучшение у пациентов 1978 года, по сравнению с теми, кто принял участие в исследовании 1974 года. Предполагалось, что это является следствием применения компьютерного томографа, поскольку из 29 пар в 31% пациенты 1978 года имели лучший прогноз, чем пациенты 1974 года, в то время как в другой группе, лучший прогноз пациенты 1978 года имели только в 7% случаев.

Однако исследование было расширено, и в анализ были включены пациенты 1978 года, которые не были подвергнуты компьютерному томографическому сканированию (таблица 2, столбец 3) и они были сравнены с соответствующей группой 1974 года, с использованием идентичных критериев подбора групп. Это исследование снова обнаружило улучшение в 1978 году, поскольку при сравнении пар, 38% пациентов 1978 года имели лучший прогноз, чем пациенты 1974 года и только у 19% прогноз был хуже. Формальный статистический анализ обнаружил значительное улучшение в 1978 году в обоих случаях. Таким образом, вне зависимости от того, проходили или нет пациенты компьютерную томографию, на протяжении лет результаты улучшились.

В отсутствии исследования с группой контроля при сравнении пациентов, которые не подвергались компьютерной томографии, исследователи могли бы придти к выводу, что установка компьютерного томографа привела к увеличению выживаемости. Имеется два возможных объяснения этой кажущейся аномалии. Одно – это предположить, что между 1974 и 1978 годами в практику были введены другие методы улучшения лечения, не связанные с внедрением компьютерной томографии. Другим возможным объяснением является ответ на вопрос: «Как бы клиницист поступил с пациентом с инсультом, если бы он знал результаты компьютерной томографии?» Ответ, обычно, звучит так: «это бы мало что изменило». Поэтому возможно, что, несмотря на все попытки подобрать адекватные группы, пациенты 1978 года были на самом деле менее серьезно больны и поэтому жили дольше, чем пациенты, госпитализированные в 1974 году. Однако в некоторых случаях исследование до-и-после без контрольной группы являются незаменимыми.

Пример из литературы. Mills и соавторы (1986) оценили насколько образовательная кампания британского правительства увеличила знания общественности по вопросам СПИДа. Случайной выборке лиц, имеющих право на голосование, были разосланы опросники в Саутгемптоне, до-и-после кампании рекламных объявлений в газетах.

Исследователи обнаружили, например, что 33% популяции знали, как расшифровывается аббревиатура СПИД до начала кампании, и только 34% узнали об этом после кампании. Исследователи пришли к выводу, что по всей вероятности, кампания оказала небольшое воздействие на знание о СПИДе в популяции в целом, а поскольку правительственная кампания покрывала всю страну целиком, контрольную группу найти было невозможно.

Пример из литературы. Campbell и соавторы (1985а) оценивали кампанию по укреплению здоровья, которая организовывалась врачом общей практики. Случайной выборке пациентов до-и-после проведения данной кампании, были разосланы опросники, которые запрашивали информацию о количестве физической нагрузки, как в деревне, где данный врач работал, так и в контрольной деревне, в которой подобная кампания не проводилась.

В деревне, которая подверглась «воздействию», процент людей, увеличивающих физические нагрузки на протяжении более чем одной недели до того, как у них появлялась одышка, возрос с 39% до 51%. Однако и в контрольной деревне процент увеличился — с 38% до 45%. Вывод, к которому можно было придти — имелось некоторое увеличение физической нагрузки, по всей вероятности, в результате общей информации, которая была получена в обеих деревнях. Эффект влияния врача общей практики, если он и присутствовал, был достаточно небольшим. Из данного примера становится понятным, что данный дизайн исследования не позволял рандомизировать индивидуумов в деревне, которая подвергается некой кампании, и в контрольной деревне.

Проспективные исследования, имеющие как тестовую группу, так и контрольную группу, но в которых разделение на группы не осуществляется за счет закона случайных чисел, называется квази-экспериментальным дизайном. Этот дизайн очень часто используется для получения дополнительной информации о характеристиках нового лечения, применяемого в одной группе пациентов, когда рандомизация сложна или невозможна.

Основным недостатком квази экспериментального исследования является то, что в самом начале лечения невозможно установить сравнимость пациентов двух групп, поскольку воздействия не рандомизированы. Таким образом, например, при сравнении выживаемости у пациентов, которые подвергались различным типам хирургических вмешательств, выполненными различными хирургами, невозможно быть уверенным в том, что разные хирурги имеют одинаковые критерии для отбора пациентов на хирургию. Как следствие этого, любые различия в смертности, наблюдаемые между типами хирургических вмешательств, будут затушеваны систематическими различиями между пациентами, и поэтому они не будут отражать относительную смертность, связанную с данными хирургическими альтернативами.

Пример из литературы. Heartbeat Wales ( Tudor — Smith и соавторы, 1998) изучили большое количество координированных видов воздействий для укрепления здоровья в Уэльсе. Сравниваемая группа, сформированная на северо-востоке Англии, достаточно далеко для того, чтобы не произошло эффекта «загрязнения» рекламной кампанией Уэльса, служила контрольной группой (она не получала никаких дополнительных материалов, посвященных укреплению здоровья). В каждом районе были проведены два независимых кросс секционных опроса – первый был проведен до того, как началась кампания в Уэльсе, второй через шесть лет. Хотя в обоих регионах было обнаружено улучшение, однако, не было выявлено дополнительного улучшения в той области, которая подверглась воздействию.

Когорта – это часть популяции, которая идентифицирована так, что ее характеристики, например, причины смерти или количество людей, заболевших неким заболеванием, могут быть установлены с определенной степенью точности по мере того, как эта группа стареет.

Термин «когорта» очень часто используется для того, чтобы описать тех, кто родился в определенном году, но он может быть расширен для того, чтобы описать любую группу лиц, которые наблюдаются на протяжении определенного периода времени. Например, мы можем описывать когорту, рожденную в 1900 году или когорту людей, которые когда бы то ни было, работали на определенном заводе. Когортное исследование, (которое иногда также называется лонгитюдным или проспективным исследованием) – это исследование, в котором некие группы из определенной популяции идентифицируются на основании того, что они были подвергнуты воздействию некоего фактора, имеющего в свою очередь возможность воздействовать на вероятность возникновения данного заболевания, или на какие-то другие исходы. В данном исследовании можно наблюдать за двумя группами пациентов: одна группа, подвергшаяся потенциальному воздействию токсического вещества, а другая – не подвергшаяся, и затем посмотреть насколько данное воздействие влияет, например, на развитие определенных типов рака. Обычно когортные исследования используются в тех случаях, когда необходимо определить и изучить этиологические факторы, и они не имеют эквивалентного воздействия. Эти исследования очень часто называются обсервационными исследованиями . поскольку в них часто наблюдается за тем, что происходит с индивидуумами по мере их старения. Дизайн и развитие когортного исследования показан на рисунке 2.3.

Рисунок 2.3 Когортное исследование. ( Population – популяция, Disease – есть заболевание, Without disease – нет заболевания, Exposed – подвергшиеся воздействию, Not exposed – не подвергшиеся воздействию, Exposed with disease – заболевшие среди тех, кто подвергался воздействию, Exposed without disease – здоровые среди тех, кто подвергался воздействию, Not exposed with disease – заболевшие среди тех, кто не подвергался воздействию, Not exposed without disease – здоровые среди тех, кто не подвергался воздействию.

Интерпретация когортных исследований часто значительно более сложная, чем рандомизированного исследования, поскольку на интересующие нас показатели может оказывать воздействие систематическая ошибка. Например, для того чтобы определить в когорном исследовании насколько увеличивается частота сердечно-сосудистых заболеваний у мужчин, которые были стерилизованы при помощи операции вазэктомии, необходимо иметь сравнимую группу мужчин, не подвергшихся вазэктомии. Однако сравнение между этими двумя группами мужчин могут оказаться ошибочными, поскольку невозможно совершенно четко рандомизировать мужчин в группу стерилизации и не стерилизации. Мужчины, которые хотят, чтобы их стерилизовали, явно не будут принимать идею о том, что их «не будут стерилизовать». Таким образом, сравнение, которое делается на самом деле — это сравнение между теми людьми, которые хотят, чтобы их стерилизовали и теми, кто не хочет, чтобы их стерилизовали и при такой ситуации возможно большое количество систематических ошибок. Например, вазэктомированные мужчины могут оказаться лучше образованными или более спортивными, чем не вазэктомированные мужчины, что в свою очередь может оказать воздействие на частоту сердечно-сосудистых заболеваний.

В дизайне когортных исследований должен быть проведен внимательный анализ всех условий до проведения исследования для того, чтобы идентифицировать и, соответственно, измерить важные прогностические переменные, которые могут приводить к различиям между группами воздействия. Если все прогностические переменные регистрируются, различия в характеристиках между группами могут быть откорректированы для выполнения финального анализа.

Пример из литературы . Schatzkin и соавторы (1987) изучили 7188 женщин 25-74 лет, которые в 1971-1975 годах являлись обследуемыми в Национальном центре изучении здоровья и питания ( NHANES 1) в C ША. Были включены вопросы по потреблению алкоголя, затем за пациентками наблюдали с 1981 по 1984 годы и устанавливали все случаи рака молочной железы.

Исследователи обнаружили, что среди тех, кто пил значительное количество алкоголя, риск рака молочной железы был на 50% выше, чем среди тех, кто не пил. Даже предположив, что другие факторы риска такие, как менопаузальный статус, ожирение и курение могут воздействовать на риск развития рака молочной железы, исследователи, тем не менее, сумели установить связь между потреблением алкоголя и последующей заболеваемостью раком молочной железы.

В данном случае основной целью статистического анализа являлось установление факта, насколько в действительности потребление алкоголя вызывает увеличенное количество случаев рака молочной железы, или оно связано с большим количеством других факторов, связанных с потреблением алкоголя.

Пример из литературы. Campbell и соавторы (1985в) изучили 1438 женщин в возрасте 45-74 года, которые были обследованы в 1967 году и в момент обследования у них был определен уровень гемоглобина; после этого до 1979 года были зарегистрированы все случаи смерти от рака. Соответствующая информация имелась на 99%женщин.

Исследователи обнаружили, что средний уровень гемоглобина во время первого опроса у женщин, которые затем умерли от рака, составил 12,3 г/дл, по сравнению с12,8 г/дл у тех, кто к моменту окончания исследования был жив. Авторы сумели установить, что взаимоотношения между гемоглобином и раком с очень малой вероятностью было вызвано случайными факторами, оно не могло быть объяснено другими известными факторами риска, такими, например, как курение.

Ретроспективные когортные исследования.

Ретроспективные когортные исследования – это исследования, в которых группа пациентов, идентифицированная в прошлом, наблюдается до настоящего момента. Например, скажем, мы выявляем всех детей с низкой массой тела при рождении, которые были рождены в данном родильном доме 60 лет назад. Затем мы просматриваем их жизненный путь до настоящего момента, используя официальную информацию, такую как свидетельства о смерти. Затем сравнивается смертность от сердечно-сосудистых заболеваний детей, рожденных с низкой массой тела, с национальной частотой смертности.

Пример из литературы . Shaheen и соавторы (1996) изучили 391 ребенка в возрасте от 3 до 13 лет, которые жили в Гвинея-Вессау во время эпидемии кори. Спустя четыре года у этих детей авторы изучили клеточный иммунитет и сравнили тех, кто был инфицирован корью, с теми, кто был вакцинирован. Авторы продемонстрировали, что инфицированные дети в два раза чаще (по сравнению с вакцинированной группой) не реагировали на антигены.

Требуемые размеры когортного исследования не зависят не только от размера риска, не только от того, какой риск изучается, но и от распространенности определенного изучаемого состояния. В примере с вазэктомией, сердечно-сосудистые заболевания, которые не очень редко встречаются в группе мужчин в возрасте 40-50 лет, могут привести к тому, что изучаться будет группа мужчин среднего возраста. С другой стороны, если исследуется редкое состояние, когда среди большого количества пациентов наблюдается только небольшое количество случаев, вне зависимости от того были ли они подвергнуты воздействию или нет. Это обычно не позволяет использовать когортные исследования для изучения этиологических факторов при редких заболеваниях.

Когда формируется когорта из работающих людей, риск смерти в первые несколько лет наблюдения обычно несколько ниже, чем в популяции в целом. Это известно как эффект «здорового работника». Он появляется вследствие того факта, что больные люди с меньшей степенью вероятности работают. Известно также, что люди, которые отвечают на опросники, обычно более здоровы, чем те, кто не отвечает. Оба эти эффекта могут привести к проблемам с интерпретацией риска в работающей популяции. Еще одна проблема появляется, когда имеется не достаточно тщательное наблюдение за когортой, более внимательным оно проявляется за людьми, подвергавшимися воздействию, чем за людьми контрольной группы. Здесь мы должны задать вопрос: «Что произошло с теми людьми, которые потеряны при наблюдении, и не может ли повлиять плохое отслеживание пациентов на наши выводы.

Пост-маркетинговое наблюдение – это определенный тип когортного исследования, который проводится в популяции людей, получающих разрешенное лицензированное лекарство. В данном примере лекарство, которое обычно используется по всей стране, может мониторироваться не по причине своей эффективности, а по причине возможных побочных эффектов, которые возникают у пациентов, получающих испытуемое лекарственное средство. Частота подобных побочных эффектов у пациентов, получающих новое лекарство, затем сравнивается с частотой побочных действий у пациентов, получающих лекарственные средства, альтернативные этому новому лекарственному средству.

Исследования по типу случай-контроль.

Исследования по типу случай-контроль, известные также как ретроспективные исследования, начинаются с того, что выявляются люди, имеющие некое заболевание (или иную переменную результата), и затем к ним подбирается контрольная (референтная) группа лиц без данного заболевания. Связь между фактором риска и заболеванием изучается сравнением больных и здоровых по отношению к тому, насколько часто в обеи