Statistical aspects of the genetics of predispositios RUS 2013

12
Труды 3-й Московской Международной Научно-практической Конференции

Transcript of Statistical aspects of the genetics of predispositios RUS 2013

Труды 3-й Московской Международной Научно-практической Конференции

Immunophysiology: Autoimmunity in Health and Disease, Moscow, October 1-3, 2012 1

PROCEEDINGS OF THE 3RD INTERNATIONAL SCIENTIFIC AND PRACTICAL CONFERENCE

IMMUNOPHYSIOLOGY: AUTOIMMUNITY IN HEALTH AND DISEASE.

CONTRIBUTION TO PREDICTIVE AND PREVENTIVE MEDICINE

(Editors A.B. Poletaev, S.V. Skurydin)

MOSCOW OCTOBER 1-3, 2012

2 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

ТРУДЫ 3-Й МЕЖДУНАРОДНОЙ НАУЧНО-ПРАКТИЧЕСКОЙ КОНФЕРЕНЦИИ

ИММУНОФИЗИОЛОГИЯ: АУТОИММУНИТЕТ В НОРМЕ И ПАТОЛОГИИ И ВОПРОСЫ ПРЕДИКТИВНО-ПРЕВЕНТИВНОЙ

МЕДИЦИНЫ

(под редакцией А.Б. Полетаева и С.В. Скурыдина)

МОСКВА 1-3 ОКТЯБРЯ 2012

306 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

очередь, разделяли на подгруппы со стабильной стенокардией напряжения (III функцио-

нальный класс НI), с нестабильной стенокардией (НI) и с инфарктом миокарда (острая

стадия, НI).

Статистический анализ: сравнение независимых выборок проводили с помощью

U-критерия Манна-Уитни. Осуществляли корреляционный анализ (ранговая корреляция

по Спирмену).

Результаты и обсуждение. У здоровых лиц содержание гомоцистеина составило

4,5 [в скобках даны квартили; 4,0; 6,2], у больных гипертонической болезнью – 6,9 [6,2;

8,0], у пациентов со стабильной стенокардией – 9,0 [8,5; 9,5], с нестабильной стенокарди-

ей – 23,7 [19,0; 43,3], у больных с инфарктом миокарда 26,0 [16,4; 41,8].

При гипертонической болезни содержание о-ЛПНП существенно не отличалось от

контроля, однако содержание антител у больных было ниже контроля на 48,9%. Пони-

женный уровень антител к о-ЛПНП при гипертонии был отмечен также Garcia-Fuentes et

al (2009). Это может быть обусловлено либо снижением иммунной реакции на о-ЛПНП,

либо усилением потребления антител из-за связывания их с антигенами на ранних стади-

ях развития атеросклероза.

У лиц с ИБС наблюдалось повышение о-ЛПНП, пропорциональное тяжести забо-

левания. При стабильной стенокардии содержание о-ЛПНП было на 15,5% выше кон-

троля, а антител – на 57,1% ниже. При нестабильной стенокардии концентрация о-ЛПНП

превышала контроль на 60,6%, и таковую у пациентов со стабильным течением заболе-

вания – на 39,0%; при этом регистрировался существенный разброс в значениях антител.

У пациентов с ИМ величины о-ЛПНП еще более увеличились и составляли 403,1% от

контроля, значимо превышая цифры больных со стенокардией. А уровень антител у них

был ниже контроля на 35,6%, но выше, чем при стабильной стенокардии на 50,0%, и при

нестабильной – на 71,4%.

СТАТИСТИЧЕСКИЕ АСПЕКТЫ ГЕНЕТИКИ ПРЕДРАСПОЛОЖЕННОСТЕЙ

Хромов-Борисов Н.Н.1, Рубанович А.В. 2 1Санкт-Петербургский государственный медицинский университет им. акад. И.П. Павлова; Российский

научно-исследовательский институт гематологии и трансфузиологии; Российский научно-

исследовательский институт травматологии и ортопедии им. Р.Р. Вредена, Санкт-Петербург; 2Институт общей генетики им. Н.И. Вавилова РАН, Москва

Результаты, получаемые в генетике предрасположенностей, и их интерпретации

характеризуются противоречивостью. Основной причиной раздирающих эту науку про-

тиворечий является плохая воспроизводимость результатов. Основной причиной плохой

Immunophysiology: Autoimmunity in Health and Disease, Moscow, October 1-3, 2012 307

воспроизводимости является статистически высоко значимая гетерогенность распределе-

ний частот изучаемых генотипов (даже в одной и той же популяции). Это едва ли не

наиболее фундаментальный результат геногеографии. Так, например, анализ данных, со-

бранных в книге «Генофонд и геногеография народонаселения» [1] о распределениях ча-

стот групп крови системы AB0 из примерно 2000 источников, показывает, что среди них

очень часто наблюдается статистически высоко значимая неоднородность даже между

выборками, извлеченными из одной и той же местности или одной и той же этнической

принадлежности. Неоднородность сохраняется, даже если изъять из рассмотрения вы-

борки, не согласующиеся с равновесием Харди-Вайнберга (РХВ).

По определению, вероятностно-статистической моделью случайной выборки, т.е.

моделью получения данных, является (конечная) последовательность независимых и оди-

наково распределенных случайных величин, а сами наблюдаемые данные (выборка) рас-

сматриваются как реализации каждой из этих случайных величин. Обе указанные харак-

теристики модели: независимость и одинаковая распределенность – имеют принципи-

альное значение. Можно сказать несколько по-иному и рассматривать выборку как по-

следовательность 1,..., nx x из n реализаций одной и той же случайной величины, полу-

ченных в серии из n независимых одинаковых опытов, проводимых в одинаковых услови-

ях (см., например, [2]). Это означает, что традиционная статистика построена на идеали-

зированных моделях и ее выводы надежны тогда и только тогда, когда исходные данные

удовлетворяют условиям независимости и однородности изучаемых данных.

В современном мета-анализе делаются попытки учитывать неоднородность. Для

этого используются такие показатели (меры неоднородности), как статистика Q-критерия

Кохрана и статистика I2. При существенной неоднородности (I2 > 50%) для оценки сред-

него эффекта в мета-анализе используется так называемая «модель со случайным эффек-

том», которая безжалостно ликвидирует статистическую значимость в случае гетероген-

ных данных. Однако отношение к идеологии мета-анализа остается достаточно противо-

речивым. В этой связи не следует забывать мнение о мета-анализе известных специали-

стов: «Мета-анализ – статистическая алхимия 21-го века» [3]; «Если медицинское вмеша-

тельство дает настолько непонятный эффект, что для его проявления требуется мета-

анализ, то я не хотел бы применять это вмешательство по отношению к себе» (Г.Ю. Ай-

зенк). См. также критический обзор Иоаннидиса [4]. Одно из решений проблемы неодно-

родности и/или расслоенности (стратификации) анализируемых групп дано в работе [5].

В простейшем и наиболее распространенном варианте выявления связи с болезнью для

одного маркера с двумя аллелями, которое сводится к анализу таблицы сопряженности

2×2, грубую поправку на неоднородность можно ввести, деля наблюдаемое значение ста-

308 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

тистики критерия хи-квадрат ( 2obsχ ) на критическое значение этой статистики ( 2

αχ ) для

выбранного значения уровня значимости α:

2

22

αχχχ obs

true =

Для традиционно используемого уровня значимости α = 0,05 критическим значением бу-

дет 841,32 =αχ .

Основная причина статистически высоко значимой гетерогенности распределений

частот изучаемых генотипов – неслучайность выборок. Одно из последствий неслучай-

ности выборок – статистически высоко значимые отклонения от равновесия Харди-

Вайнберга (РХВ) [6]. Генетика в этом отношении уникальна – у нее есть возможность

проверять случайность выборок, проверяя согласие генотипических данных с РХВ. При-

чинами значимых отклонений от равновесия Харди –Вайнберга могут быть: Ошибки при

формировании выборки, Пренебрежение рандомизацией, Расслоенность (стратификация)

популяций (эффект Валунда), Ошибки генотипирования, Игнорирование «нулевых» (не-

амплифицируемых) аллелей, Трудность определения редких аллелей, Включение несу-

ществующих аллелей, Эпигенетические эффекты типа геномного импринтинга.

Уже относительно давно сформулированы повышенные требования к данным в

генетике предрасположенностей. Так, например, констатируется, что большинство опуб-

ликованных ассоциаций никогда не воспроизводится и что повторяющаяся невоспроиз-

водимость – хороший повод, чтобы отвергнуть связь (ассоциацию) генотип-болезнь. И

далее говорится: Мы будем предъявлять высокие требования к представляемым работам:

объемы выборок должны быть большими; P-значения должны быть малыми; должны

быть представлены результаты независимых повторностей; ассоциации должны быть

изучены как в семьях, так и в популяциях; значения отношения шансов (odds ratios – OR)

и (или) привносимого (attributable) риска (PAR) должны быть высокими; для сообщаемых

ассоциаций должны быть изложены разумные биологические и физиологические объяс-

нения [7]. Аналогичные требования высказываются и в других работах: Доля ложнопо-

ложительных связей (ассоциаций) между генетическими вариантами и болезнью в опуб-

ликованных работах составляет более 95%! Четыре фактора определяют вероятность то-

го, что статистически значимые результаты в действительности являются ложноположи-

тельными: недостаточно малые P-значения; низкая статистическая мощность (чувстви-

тельность к отклонениям от предположений нулевой гипотезы); практически (клиниче-

ски) несущественные значения отношения шансов (в подавляющем числе случаев они не

Immunophysiology: Autoimmunity in Health and Disease, Moscow, October 1-3, 2012 309

превышают OR = 2); большая доля проверяемых (нулевых) гипотез, которые в действи-

тельности верны [8].

Р-значение. Р-значение является наиболее противоречивой концепцией в стати-

стике [9]. Концепция Р-значения столь далека от интуитивного понимания, что ни один

простой человек не может удержать ее в памяти. Не могут этого даже многие статистики.

Итак, по определению, P-значение (Pval) есть вероятность получить наблюдаемые данные

(Dobs) и все остальные еще менее вероятные, или еще более отклоняющиеся от ожидае-

мых (D ≥ Dobs) при условии, что верна нулевая гипотеза (H0):

Pval = P(D ≥ Dobs|H0)

C точки зрения бейзовского подхода односторонне P-значение можно интерпре-

тировать всего лишь как вероятность того, что истинное различие имеет направление

(знак), противоположное наблюдаемому. Давно известно, что P-значение ничего не гово-

рит нам ни о вероятности нулевой гипотезы, ни о размере эффекта. За этот недостаток P-

значение с момента своего появления подвергается жесточайшей критике. Это нашло

свое отражение и в Международных «Единых требованиях к рукописям, представляемым

в биомедицинские журналы»: «Не следует полагаться исключительно на проверку стати-

стических гипотез, например, на использование Р-значений, которые не содержат важ-

ную информацию о размере эффекта» (Единые требования, раздел IV.A.6.c. Статистика)

[10]. Более подробно: явно не следует слепо применять инструментарий процедур про-

верки значимости нулевой гипотезы и основывать свои выводы исключительно на полу-

чаемых Р-значениях. Осмысленные выводы должны основываться на разумном взвеши-

вании Р-значений и на использовании дополнительной информации о других не менее

важных показателях, таких как мощность, размер эффекта, количество наблюдений, о

результатах предшествующих работ, предсказаниях действующей теории и т.п.

Бейзов фактор и вероятность статистических гипотез. Альтернативой Р-значе-

нию в современной статистике служит бейзов фактор (BF01), который есть отношение

вероятности получить наблюдаемые данные (Dobs) при условии, что верна нулевая гипо-

теза (H0) к вероятности получить эти данные при условии, что верна альтернативная ги-

потеза (H1):

)|(

)|(

1

010 HDP

HDPBF

obs

obs=

Бейзов фактор позволяет сравнивать, во сколько раз более правдоподобно получить

наблюдаемые данные при условии, что верна нулевая гипотеза, чем при условии, что

верна альтернативная гипотеза [11,12]. Он является коэффициентом пропорциональности

между априорными и апостериорными шансами в пользу нулевой гипотезы H0 против

310 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

альтернативной гипотезы H1 при условии, что обе гипотезы являются взаимоисключаю-

щими, несовместными, т.е. P(H0) + P(H1) = 1. Использование бейзовского подхода в гене-

тике предрасположенностей описано в аботах: [13-17]. Разработаны соответствующие

программы: SNPTEST [18]; LearnBayes (скрипт ctable) для системы R [19]; BayesCatego-

ries [20].

«Заблуждение обвинителя». Принципиально важно осознавать, что условные ве-

роятности наподобие Р-значения, чувствительности диагностического теста и т.п., необ-

ращаемы. В общем виде: вероятность события A при условии, что осуществилось собы-

тие B, не есть вероятность события B при условии, что произошло событие A:

В частных случаях вероятность получить наблюдаемые данные D при условии,

что верна нулевая гипотеза H0, не есть вероятность гипотезы H0:

Чувствительность генетического (или иного диагностического) теста, т.е. вероят-

ность наличия у субъекта с данной болезнью S генотипа G, предрасполагающего к мно-

гопричинной болезни, не равна апостериорной (предсказательной) вероятности наличия

болезни у носителя такого генотипа:

При высокой чувствительности теста предсказательная вероятность заболевания при

наличии предрасполагающего генотипа может быть сколь угодно мала для редких забо-

леваний (см. неравенство и условный пример, приведенный ниже). В судебной генетике

подобные заблуждения называют «заблуждением обвинителя (прокурора)».

Вероятность статистических гипотез. Калибровка P-значений. Итак, Р-

значение не может быть вероятностью нулевой гипотезы P(H0). Но именно вероятность

нулевой гипотезы, очевидно, должна интересовать исследователя более всего. К сожале-

нию традиционная частотническая статистика не способна вычислять эту веротяность.

Это может делать бейзовская статистика. Уже относительно давно статистики-бейзовцы

предложили калибровать Р-значения относительно вероятности P(H0) [21]. В простейшем

варианте удается оценить не P(H0), а лишь ее нижнюю границу (минимально достижимое

значение) P(H0) по формуле (при ePval /1< ):

1

0 ln

11)|(

⎟⎟⎠

⎞⎜⎜⎝

⎛−≥

valval PePDHP

где e = 2,718121812… – основание натурального логарифма.

Immunophysiology: Autoimmunity in Health and Disease, Moscow, October 1-3, 2012 311

Тонкость заключается в том, что a priori нулевая и альтернативная гипотезы (в си-

лу действия принципа недостаточного основания Лапласа) предполагаются равновероят-

ными: P(H0) = P(H1) = 1/2. Результат представлен в Табл. 2.

Р-значение,

Pval

Нижняя граница для вероятности

нулевой гипотезы P(H0)

Верхняя граница для вероятности

воспроизведения Рrepr

0,05 >29% <50%

0,01 >11% <73%

0,001 >1,8% <90%

Таблица 2. «Цена» Р-значения [21-24]

Можно видеть, что при Pval = 0,05 нижняя граница для вероятности нулевой гипо-

тезы P(H0) = 0,29, т.е. в этом случае P(H0) не может быть больше 29%. Очевидно, что та-

кая высокая вероятность не может служить стимулом для сомнения в гипотезе H0. Прак-

тически столь же мало убедительным доводом против гипотезы H0 является и Pval = 0,01.

При нем минимальное значение для вероятности нулевой гипотезы может достигать

11%: P(H0) = 0,11. Наконец, при Pval = 0,05 вероятность P(H0) может достигать 2%. Такую

вероятность уже наверное можно признать малой настолько, чтобы зародилось сомнение

в H0. При этом не надо только забывать, что P(H0) есть всего лишь минимально дости-

жимое значение, и в реальных ситуациях значения P(H0) могут быть неопределенно

больше указанных в таблице нижних границ. Доступна также интерактивная номограм-

ма, позволяющая наглядно демонстрировать калибровку Р-значений при разных априор-

ных вероятностях нулевой гипотезы [22].

В последнем столбце Табл. 2 приведены ориентировочные значения для верхней

границы вероятности воспроизведения наблюдаемого результата в последующей повтор-

ности эксперимента [23,24]. Можно видеть, что опять-таки только при Рval = 0,001 веро-

ятность того, что этот результат воспроизведется, может достигать приемлемо высокого

значения 90%.

Бейзов фактор помогает выявлять ложно малые P-значения. Когда при больших

объемах выборок (например, тысячи случаев и тысячи контролей) и BF01 и Pval малы, и,

например, BF01 < 10-5, тогда такое значение бейзова фактора становится дополнительным

сильным свидетельством в пользу наличия изучаемой связи генотип-болезнь. Когда же

наблюдаемые значения BF01 и Pval противоречат другу другу: Pval мало, но значение BF01

> 1, тогда такое малое P–значение следует признать ложным свидетельством против ну-

левой гипотезы H0 [13,25].

Предсказательные вероятности. Даже если генетическая ассоциация оказывает-

ся статистически высоко значимой, то непременно встает вопрос, насколько полезной

будет эта информация для оценки риска и предсказания болезни? Необходимо измерять

312 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

чувствительность (Se), специфичность (Sp), ценность положительного предсказания

(PPV) и ценность отрицательного предсказания (NPV) [26]. При наличии оценок популя-

ционной встречаемости заболевания предсказательную вероятность PPV для исследова-

ний по схеме "случаи – контроли" можно вычислить по формуле:

)1))((1()(

)(

)|())(1()|()(

)()|()|(

SpDPSeDP

SeDP

DgPDPDgPDP

DPDgPgDPPPV

−−+=

−+==

Здесь P(D) – распространенность болезни, т.е. вероятность ее наличия у случайно

выбранного субъекта в данной популяции; P(D|g) – вероятность наличия или возникно-

вения диагностируемой болезни у носителя генотипа g; P(g|D) = Se – доля носителей ге-

нотипа g среди субъектов с болезнью; SpDgP −= 1)|( – доля носителей генотипа g сре-

ди субъектов без диагностируемого заболевания.

В подавляющем большинстве выявляемых генетических предрасположенностей

значения PPV мало отличаются от распространенности болезни в популяции и фактиче-

ски не имеют клинического значения. Это заведомо так в случае очень редких заболева-

ний. Можно показать, что всегда PPV < P(D)·OR. Отсюда следует, что при P(D) = 10-4

даже «очень хороший» генетический маркер (скажем, OR = 100) будет иметь предсказа-

тельную вероятность менее 1%.

Условный пример: Пусть распространенность многопричинной болезни в некото-

рой популяции равна P(D) = 1%. Допустим, что среди больных доля носителей генотипа

(аллели, гаплотипа) g, предрасполагающего к данной болезни, равна P(g|D) = 20% и она в

2 раза выше, чем у индивидуумов без этой болезни: %10)|( =DgP . Этому соответству-

ют значения OR = 2,25 и относительного риска RR ≈ 2,225. По формуле Бейза вероят-

ность болезни у носителя генотипа g примерно в 2 раза превышает ее распространен-

ность: PPV = P(D|g) = 1,98%. Вряд ли на основе столь малой предсказательной вероятно-

сти при наличии данного предрасполагающего генотипа у конкретного индивидуума

честный врач станет запугивать пациента неизбежным развитием у него данной болезни.

Сильная статистическая связь между генотипом и многопричинной болезнью не

может служить показателем предсказательной ценности. Субъекты с высоким генетиче-

ским риском наличия или развития многопричинной болезни очень редки.

Проблема множественных сравнений, множественных проверок гипотез. Эта

проблема игнорируется излишне часто и неоправданно. Для анализа множественных

сравнений без каких-либо оговорок и поправок почти повсеместно используются двух-

Immunophysiology: Autoimmunity in Health and Disease, Moscow, October 1-3, 2012 313

выборочные критерии. В действительности же, если мы извлечем 100 пар выборок из од-

ного и тоже модельного распределения, то по двухвыборочному критерию с вероятно-

стью, близкой к 1, примерно (в среднем) пять пар будут различаться значимо на уровне

5%. Это фактически есть наглядная демонстрация смысла Р-значения. Проблема множе-

ственных сравнений – это кошмар практически всех ассоциативных генетических иссле-

дований. Для ее решения используют коррекцию Р-значений по Бонферрони, FDR-метод

и перестановочные компьютерные тесты. Общеизвестно, что коррекция по Бонферрони

катастрофически снижает мощность теста, и, как правило, исследователи пытаются ис-

пользовать более щадящие методы. Однако на практике это приводит к успеху, если хотя

бы одно из сравнений проходит «сито Бонферрони». В этом смысле обойти поправку

Бонферрони невозможно.

Размер эффекта. Как уже говорилось, в Международных «Единых требованиях к

рукописям, представляемым в биомедицинские журналы» рекомендуются: «Не полагать-

ся исключительно на проверку статистических гипотез, например, на использование

Р-значений, которые не содержат важную информацию о размере эффекта» [10]. Это

очень важное понятие в статистике. Эффект может быть статистически высоко значи-

мым, но его эффект может быть практически (клинически) ничтожным. Поэтому для

размера эффекта формулируются некие их вербальные шкалы. В генетике предрасполо-

женностей в качестве меры эффекта, т.е. связи генотип-болезнь, наиболее часто исполь-

зуется отношение шансов OR. Наши исследования показывают, что при OR < 2,2 маркер

обладает заведомо низкой прогностической эффективностью во всех смыслах и при лю-

бых частотах встречаемости заболевания и маркера. Маркер может быть хорошим клас-

сификатором, если OR > 5,4 , при условии что, его популяционная частота достаточно

высока (pM > 0,3) [27]. На практике это означает, что указанным неравенствам должны

удовлетворять нижние границы )1(100 α− доверительного интервала для оцениваемого

значения ORL, т.е. ORL < 2,2 в первом случае и ORL > 5,4 – во втором случае. Ранее близ-

кие значения критических уровней наблюдаемых эффектов предлагались для относи-

тельных рисков: RR < 2 и RR > 5 [28,29].

Литература

[1] Генофонд и геногеография народонаселения / под общей ред. Ю.Г. Рычкова. – Т.1 Генофонд населения России и сопредельных стран. – СПб.: Наука, 2000. – 611 с.

[2] Кибзун А.И., Горяинова Е.Р., Наумов А.В., Сиротин А.Н. Теория вероятностей и математическая ста-тистика. Базовый курс с примерами и задачами / Учебное пособие. – М.: ФИЗМАТЛИТ, 2002. – 224 с.

[3] Feinstein A.R. Meta-analysis: statistical alchemy for the 21st century // J. Clin. Epidemiol., 1995. – Vol. 48. – P. 71–79.

[4] Ioannidis J.P.A. Interpretation of tests of heterogeneity and bias in meta-analysis // J. Eval. Clin. Pract., 2008. – Vol. 14. – No. 5. – P. 951–957.

314 Иммунофизиология: Аутоиммунитет в Норме и Патологии, Москва, 1-3 Октября, 2012

[5] Reich D.E., Goldstein D.B. Detecting association in a case-control study while correcting for population strati-fication // Genetic Epidemiology, 2001. – Vol. 20. – No. 1. – P. 4–16.

[6] Хромов-Борисов Н. Н., Лаззаротто Г. Б., Кист Т. Б. Л. Биометрические задачи в популяционных иссле-дованиях. Методы популяционной биологии (Материалы докладов VII Всероссийского популяционно-го семинара (Часть 2). 16-21 февраля 2004 г. Сыктывкар. С. 62-86.

[7] Editorial. Freely associating // Nature Genet., 1999. – Vol. 22. – No. 1. – P. 1-2. [8] Wacholder S., Chanock S., Garcia-Closas M. Assessing the probability that a positive report is false: An ap-

proach for molecular epidemiology studies // J. Natl. Cancer Inst., 2004. – Vol. 96. – No. 6. – P. 434-442. (http:jncicancerspectrum.oupjournals.org/jncn/content/vol96/issue6)

[9] Хромов-Борисов Н.Н Синдром статистической снисходительности или значение и назначение P-значения // 16.02.2011 г. (http://tele-conf.ru/aktualnyie-problemyi-tehnologicheskih-izyiskaniy/sindrom-statisticheskoy-snishoditelnosti-ili-znachenie-i-naznachenie-p-znacheniya.html).

[10] Международный комитет редакторов медицинских журналов. Единые требования к рукописям, пред-ставляемым в биомедицинские журналы: правила написания и редактирования материалов // Межд. журн. мед. Практики, 2005. – № 5. – С. 10–23. (http://www.mediasphera.ru/mjmp/2005/5/10.pdf)

[11] Гудман С.Н. На пути к доказательной биостатистике. Часть 1: обманчивость величины р // Translated, with permission of the ACP — ASIM, from: Goodman S.N. Towards evidence-based medical statistics: 1: The P value fallacy. Ann Intern Med 1999;130:995—1004. (http://www.mediasphera.ru/mjmp/2002/1/r1-02con.htm)

[12] Гудман С.Н. На пути к доказательной биостатистике. Часть 2: байесовский критерий // Translated, with permission of the ACP — ASIM, from: Goodman S.N. Towards evidence-based medical statistics: 1: The Bayes factor. Ann Intern Med 1999;130:1005—1013. (http://www.mediasphera.ru/mjmp/2002/2/r2-02con.htm)

[13] Sawcer S. Bayes factors in complex genetics // Eur. J. Hum. Genet., 2010. – Vol. 18. – P. 746-750. [14] Wakefield J. Bayes factors for genome-wide association studies: comparison with P-values // Genet. Epidemi-

ol., 2009. –Vol. 33. P. 79-86. [15] Stephens M., Balding D.J. Bayesian statistical methods for genetic association studies // Nat. Rev. Genet.,

2009. – Vol. 10. – No. 10. – P. 681-690. [16] Wellcome Trust Case Control Consortium (WTCCC). Genome-wide association study of 14,000 cases of sev-

en common diseases and 3,000 shared controls // Nature, 2007. – Vol. 447. – P. 661-678. [17] Balding D.J. A tutorial on statistical methods for population association studies // Nature Rev. Genetics,

2006. – Vol. 7. – No 10. – P. 781-791. [18] Marchini J., Howie B., Myers S., McVean G., Donnelly P. A new multipoint method for genome-wide asso-

ciation studies by imputation of genotypes // Nature Genetics, 2007. – Vol. 39. – P. 906 – 913. SNPTEST – a program for the analysis of single SNP association in genome-wide studies. (https://mathgen.stats.ox.ac.uk/genetics_software/snptest/snptest.html)

[19] LearnBayes: a collection of functions helpful in learning the basic tenets of Bayesian statistical inference (http://cran.r-project.org/web/packages/LearnBayes/index.html)

[20] BayesCategories: bayes tests for R by C contingency tables and other categories problems (http://www.toad.net/~jkaplan2/bayesCategories.htm).

[21] Sellke T., Bayarri M.J., Berger J.O. Calibration of p values for testing precise null hypotheses // Am. Statist., 2001. – Vol. 55. – No. 1. – P. 62-71.

[22] Held L. A nomogram for P values // BMC Medical Research Methodology, 2010. – Vol. 10. – P. 21. (http://www.biostat.uzh.ch/static/pnomogram/)

[23] Chow S.C., Shao J., Wang, H. Sample Size Calculations in Clinical Research. 2nd ed., Chapman Hall/CRC Press, Taylor & Francis, New York, 2008. – 465 pp.

[24] Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях. – 2-е изд. – М.: ГЭОТАР-Медиа, 2006. – С. 165.

[25] Zheng G., Yuan A., Jeffries N. Hybrid Bayes factors for genome-wide association studies when a robust test is used // Comput. Stat. Data Anal., 2011. – Vol. – 55. – No 9. – P. 2698-2711.

[26] Khoury M.J., McBride C.M., Schully S.D. et al. The scientific foundation for personal genomics: Recommen-dations from a national institutes of health–centers for disease control and prevention multidisciplinary work-shop // Genet. Med., 2009. – Vol. 11. – No. 8. – P. 559 –567.

[27] Хромов-Борисов Н.Н., Рубанович А.В. Основные причины неизбежной неопределенности и низкой прогностичности в генетике предрасположенностей // Cб. тезисов Российского конгресса с междуна-родным участием «Молекулярные основы клинической медицины – возможное и реальное». – СПб.: Изд-во «Человек и его здоровье», 2012. – С. 233-236.

[28] Zhang H., Liu L., Wang X. Gruen J.R. Guideline for data analysis of genomewide association studies // Cancer Genomics & Proteomics, 2007. – Vol. 4. – P. 27-34.

[29] Ioannidis J.P. Commentary: Grading the credibility of molecular evidence for complex diseases // Intern. J. Epidemiol., 2006. – Vol. 35. – P. 572-578.