Репозиторий OAI—PMH
Репозиторий Российская Офтальмология Онлайн по протоколу OAI-PMH
Конференции
Офтальмологические конференции и симпозиумы
Видео
Видео докладов
Реферат RUS | Реферат ENG | Литература | Полный текст |
УДК: | 617.7 DOI: https://doi.org/10.25276/0235-4160-2022-3-68-74 |
Пашенцев Я.Е.
Особенности статистического анализа количественных данных парных глаз, непараметрический случай
Актуальность
Надлежащий статистический анализ медицинских данных является критически важным этапом для правильной интерпретации результатов исследований с точки зрения доказательной медицины. Природа самих же данных исследования, в свою очередь, имеет первостепенное значение при выборе тех статистических методов, которыми эти данные должны обрабатываться.
Одним из частых типов данных, возникающих в исследованиях, в частности в медицинских исследованиях, являются кластерные данные (англ. clustered data). Под кластерными данными понимают такие данные, которые формируются из нескольких сущностных групп или кластеров (англ. cluster – гроздь, пучок, скопление), причем данные из одного кластера более схожи между собой, чем данные из разных кластеров [1]. Классическим примером возникновения кластерных данных является изучение средней успеваемости в школе, когда в анализ включаются оценки нескольких случайных учеников одного класса школы вместо того, чтобы случайно выбрать по одному ученику из нескольких классов.
Примером из медицины можно взять эксперименты с мышами, когда в одну группу включают несколько измерений у одной мыши, чтобы увеличить количество наблюдений, не требуя большого количества мышей. Или назначение сходного лечения при сходной симптоматике пациентам, наблюдаемым одним и тем же терапевтом. Либо когда в анализ включаются данные парных органов одного и того же пациента.
Кластерные данные в медицинских исследованиях могут возникать в результате совершенно различных сценариев, например: повторяющиеся в динамике измерения у конкретного пациента; кластеризация по различным специалистам, проводящим некоторое вмешательство. Кластеризация также возникает из-за того, что различные больницы/практикующие врачи могут привлекать разные типы пациентов; по степени тяжести заболевания или по социально-демографическим условиям; кластеризация появляется в группах пациентов с одинаковыми условиями труда и т.д. Кластеры могут накладываться друг на друга, образовывать иерархию.
Необходимо также отметить, что не следует путать проблему анализа кластерных данных с широко известным в статистике кластерным анализом (cluster analysis), целью которого является упорядочивание объектов исследования в однородные группы.
Все стандартные широко применяемые статистические критерии (параметрические и непараметрические), предназначенные для сравнения групп по количественным признакам, требуют наличия независимых наблюдений внутри каждой группы. Очевидно, что при включении в одну группу обоих парных глаз пациентов это требование нарушается, так как независимость наблюдений предполагает невозможность по наблюдению «А» получить информацию о наблюдении «Б». Например, измеряя уровень внутриглазного давления (ВГД) левого глаза случайного пациента «А», невозможно ничего достоверно сказать об уровне ВГД левого глаза (как и правого) пациента «Б». И наоборот, значения ВГД левого и правого глаз пациента «А» будут, скорее всего, близки друг к другу. Эти наблюдения не являются независимыми, они, скорее всего, будут похожи друг на друга сильнее, чем на показатели глаз пациента «Б».
Зачастую проблема усугубляется еще и тем, что эти парные глаза не просто коррелируют друг с другом, а имеют хорошую или даже отличную внутригрупповую корреляцию, ICC≥0,75 (intraclass correlation coefficient).
Анализируя наиболее частые ошибки применения статистических методов в российских офтальмологических журналах, профессор А.А. Шпак (2016) вполне обоснованно ставит на первое место проблему включения показателей парных глаз без учета их корреляции в одну группу исследования [2]. При этом он указывает на наличие специальных методов и программ, позволяющих учесть (внести поправку на) корреляцию между парными глазами.
Итак, данные правого и левого глаз одного и того же пациента очень часто коррелируют между собой. Но в то же время перед исследователем возникает вопрос: как правильно обрабатывать эти данные, какие методики необходимо при этом применять? Проблема статистической обработки кластерных данных представляет чрезвычайный интерес, но при этом в русскоязычной медицинской, и в частности офтальмологической, литературе существуют лишь единичные работы подобной направленности. Поэтому хотелось бы остановиться на проблемах, возникающих в офтальмологических исследованиях, базирующихся на сравнении количественных показателей групп пациентов, при включении в них кластерных данных их парных глаз.
В данной работе подробно рассмотрены вопросы статистического анализа данных офтальмологических исследований при сравнении количественных показателей групп с включением в них кластерных данных обоих парных глаз пациентов.
Цель
Сравнение различных подходов статистического анализа показателей парных глаз с описанием технологии его корректного проведения непараметрическими методами в программной среде R.
Материал и методы
Проанализировано множество вариантов статистического анализа показателей парных глаз, представленных в специальной литературе. Выделены три подхода [3–7]:
1) в основе первого подхода лежит игнорирование проблемы кластерных данных, т.е. происходит включение парных глаз в одну группу с использованием стандартных методов статистического анализа, не учитывающих корреляцию между такими глазами;
2) второй подход предполагает включение в одну группу исключительно по одному глазу от каждого пациента с последующей обработкой полученных данных стандартными статистическими методами;
3) третий подход к планированию дизайна исследования предусматривает возможность включения в одну группу обоих парных глаз пациентов с использованием специально разработанных («нестандартных») методов статистического анализа, учитывающих наличие корреляции между парными глазами.
Проведено сравнение этих подходов, анализ их применимости, продемонстрирован конкретный пример корректного статистического анализа количественных показателей парных глаз в непараметрическом случае с помощью пакета clusrank в программной среде R.
Результаты
Существенным недостатком первого подхода является то, что он приводит к значительному (иногда в десятки и более раз!) занижению p-значений при сравнении групп. Поэтому повышается риск отвержения правильной нулевой гипотезы, т.е. совершения ошибки первого рода [1, 3, 4, 8, 9]. В большинстве случаев этот подход является недопустимым, так как нарушает условия использования стандартных статистических критериев, требующих наличия только независимых наблюдений внутри каждой группы. Полученные при подобном исследовании выводы по меньшей мере спорны. По мнению W.A. Ray и D.M. O'Day (1985), применять первый подход возможно только при наличии четких медицинских и статистических данных об отсутствии корреляции (ICC должна значимо не отличается от 0) между парными глазами по какому-то конкретному исследуемому показателю, что в действительности наблюдается очень редко [4].
При втором подходе данные парного глаза либо вовсе не учитываются, либо включаются в контрольную группу (хотя это возможно далеко не всегда). В случаях, когда такое включение невозможно, возникает вопрос, что делать с уже полученными данными, зачастую ценными и дорогостоящими, как в плане материальных, так и временных затрат. Но их приходится не учитывать, попросту откидывать в сторону. Соответственно, исследователям приходится добирать недостающий материал, тратя свои ресурсы на дополнительные исследования, вместо того чтобы правильно использовать уже имеющиеся данные парных глаз.
Стратегия включения в анализ только одного глаза пациента также ставит перед исследователем вопрос выбора такого глаза. Например, может быть выбран правый, левый, случайный, лучший, худший, ведущий, ведомый и т.д. глаз. Далеко не всегда такой выбор является простым и очевидным [3, 10, 11]. Существуют также рекомендации включать в анализ не данные конкретного глаза, а среднее арифметическое показателей правого и левого глаза [4, 10, 12]. Недостатком такого усреднения данных является всё та же потеря информации, хотя и меньшая, чем в случае, когда парный глаз вовсе не учитывается в анализе [10].
Отдельно стоит остановиться на случаях, когда парный глаз включается в контрольную группу. В работе А.А. Шпака [2] отмечено, что включение в анализ обоих глаз испытуемых без учета их корреляции не является ошибкой в тех случаях, когда парные глаза либо служили контролем, либо их доля была невелика – до 10%. Но исследователю нужно помнить, что при наличии парного глаза в контроле обе группы не будут являться независимыми, поскольку показатели парных глаз, включенные в различные группы, коррелируют друг с другом [3, 12]. И, следовательно, для их анализа из стандартных критериев возможно применение только парных статистических тестов, таких как, например, критерий знаковых рангов Вилкоксона. Однако такие критерии, в свою очередь, требуют наличия исключительно лишь парных наблюдений в группах. Поэтому данное ограничение, по сути, делает невозможным включение в любую из групп наблюдений случаев без наличия пары в другой группе. Это сильно ограничивает дизайн и возможности подобного исследования.
Наличие же небольшого числа парных глаз в одной группе при использовании стандартных методов статистики (до 10% наблюдений) также нельзя считать оправданным и обоснованным, поскольку стандартные статистические критерии требуют независимости абсолютно всех наблюдений внутри группы, а не только их части (пусть даже и подавляющей) [3–5].
В целом второй подход может применяться на практике, но вследствие того, что анализируются не все доступные данные, понижается потенциальная статистическая мощность такого исследования.
И, наконец, применение третьего подхода является наиболее оптимальным, поскольку он позволяет использовать полный объем полученной информации, доступной исследователю, а также сформулировать на основании анализа результатов проведенных исследований правильные выводы. Но, к сожалению, он используется крайне редко, так как малоизвестен широкому кругу исследователей в РФ. Причиной этого является отсутствие русскоязычных руководств по практическому применению таких «нестандартных» методов статистического анализа, в которых бы детально описывались примеры их применения. Существуют лишь единичные упоминания о применении таких методов в русскоязычной офтальмологической литературе (без детализации, лишь констатируется факт применения таких продвинутых методов). Так, Е.В. Гурова (2018) при исследовании нейродегенерации сетчатки при болезни Альцгеймера использовала линейную смешанную модель [13]. Н.И. Курышева и соавт. (2018) при изучении прогрессирования глаукомной оптической нейропатии применяли модифицированный критерий суммы рангов для кластерных данных [14, 15].
Но каким образом выполнять анализ по третьему подходу? Известны два типа различных методов для сравнения групп с кластерными данными в случае наличия распределений, отличных от нормальных: 1) методы, модифицирующие стандартные критерии с учетом кластеризации, и 2) регрессионные методы, такие как обобщённые оценочные уравнения (GEE) и обобщенные линейные смешанные модели (GLMM) [1]. Регрессионные методы, хотя и являются мощнейшим инструментом в руках профессиональных статистиков, но отличаются намного большей степенью сложности для неспециалистов по сравнению с модифицированными методами. Методы GEE и GLMM требуют в каждом случае построения двух моделей. Одна из них учитывает как фиксированные, так и случайные эффекты, вторая – учитывает только случайные эффекты. Затем необходимо выполнять сравнение этих моделей для оценки p-значения гипотезы равенства групп. Кроме того, исследователю необходимо в любом случае самостоятельно оценить и выбрать тип распределения (гамма, Пуассона, обратное Гаусса и т.д.), что достаточно затруднительно. Кроме того, возможны также проблемы со сходимостью моделей и необходимостью перемасштабирования независимой переменной.
Всех этих сложностей лишены методы, модифицированные под кластеризацию данных. Для исследователя их использование технически ничем не отличается от применения хорошо знакомых критериев Вилкоксона. Примером таких продвинутых статистических методов анализа кластерных данных при сравнении групп по количественным признакам являются методы RGL и DS. Важно также отметить, что компьютерные симуляции для различных модельных данных показывают, что методы RGL и DS по статистической мощности не уступают методам GEE и GLMM [1, 16]. Простая и доступная для непрофессионалов-статистиков реализация этих методов выполнена в пакете clusrank в статистической программной среде R.
R – это язык программирования и программная среда, в которой доступны практически все актуальные средства статистического анализа (R Core Team (2020). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL: https://www.R-project.org/ [Ссылка активна на 04.03.2022]). R широко используется в качестве программного обеспечения для статистической обработки данных, является бесплатным, свободно распространяемым программным обеспечением. R довольно прост, но в то же время допускает неограниченное расширение своего функционала с помощью подключаемых пакетов, т.е. специальных свободно распространяемых модулей для решения конкретных задач и постоянно совершенствуется энтузиастами.
Пакет clusrank был разработан Y. Jiang и соавт. [16] и предназначен для сравнения количественных данных групп с учетом наличия кластерных данных при помощи модифицированных критериев Вилкоксона.
Отметим, что к стандартным (немодифицированным) критериям Вилкоксона относят критерий суммы рангов (Wilcoxon rank-sum test, он же U-критерий Манна–Уитни) и критерий знаковых рангов (Wilcoxon signed-rank test, он же критерий Вилкоксона). Первый используется для сравнения двух независимых выборок, второй – для сравнения двух связных выборок или повторных измерений. Оба критерия не требуют наличия нормально распределенных данных и являются непараметрической альтернативой t-критериям Стьюдента.
B. Rosner, R.J. Glynn, M.L.T. Lee модифицировали критерий суммы рангов и критерий знаковых рангов на случай наличия кластерных данных [17, 18]. Почти одновременно с ними S. Datta и G.A. Satten предложили свои модификации тех же критериев [19, 20]. Эти модификации Y. Jiang и соавт. [16] программно реализовали в пакете clusrank, назвав их по именам авторов RGL и DS соответственно.
Метод RGL для независимых выборок предполагает, что корреляционная структура внутри кластеров является однотипной в группах исследования. Метод RGL, в отличие от DS, также позволяет осуществлять дополнительную стратификацию данных, например, по возрасту/полу.
Метод DS, в отличие от RGL, допускает наличие произвольных корреляционных структур для каждого кластера и остается пригодным даже в тех случаях, когда лечение или какое-либо другое воздействие на группы способно привести к изменению такой структуры. Кроме того, этот метод позволяет также сравнивать три (и более) группы одновременно, аналогично критерию Краскела–Уоллиса. Ограничением для использования метода DS являются случаи, когда парные глаза всех пациентов поровну распределены в разные группы.
Полный список и описание параметров, а также примеры использования методов RGL и DS представлены Y. Jiang и соавт. [16].
Рассмотрим конкретный пример обработки кластерных данных с помощью пакета clusrank в R версии 4.0.3. Сравним две независимые группы пациентов, например, по показателю длины передне-задней оси глаза (ПЗО). В каждую группу включим по 10 человек (20 глаз), всего – 20 человек (40 глаз). Различия будем считать статистически значимыми при p<0,05. Данные глаз пациентов введем в какую-либо электронную таблицу, например, в Microsoft Excel(рис. 1). Выделим фрагмент данных, как показано на рисунке 1, и скопируем его в буфер обмена. Первый выделенный столбец содержит значения ПЗО, второй – номера кластеров (правый и левый глаз одного пациента образуют один кластер), третий – номера групп.
Запустим программу R и в командной строке выполним установку и подключение пакета clusrank для дальнейшего использования:
>install.packages(“clusrank”)
>library(clusrank)
Далее осуществим перенос данных из буфера обмена в R. Для этого выполним команду:
>Data<-read.table(“clipboard”, h=FALSE, dec=”,”, sep=” ”)
Параметр «dec=”,”» указывает на то, что в качестве разделителя целой и дробной частей в анализируемых данных используется запятая. После выполнения этой команды в переменную Data будут записаны все 3 столбца подготовленных нами данных. Тогда данные показателя ПЗО будут находиться в переменной Data$V1, номера кластеров в Data$V2, номера групп в Data$V3.
Наконец, сравним показатели ПЗО в двух группах методами RGL и DS, используя функцию clusWilcox.test пакета clusrank. Для этого выполним команду:
>clusWilcox.test(x=Data$V1, group=Data$V3, cluster=Data$V2, paired=FALSE, method=”rgl”)
Параметр «method=”rgl”» указывает на то, что используется метод RGL. Параметр «paired=FALSE» указывает на то, что выполняется сравнение двух независимых групп, т.е. непарный модифицированный тест суммы рангов Вилкоксона. Сравнение связных выборок (например, при сравнении одних и тех же глаз до и после лечения) осуществляется функцией clusWilcox.test с параметром «paired=TRUE».
Результат сравнения групп представлен ниже:
Clustered Wilcoxon rank sum test using Rosner-Glynn-Lee method
data: $ group: $; cluster: $; Data group: Data; cluster: Data; V1
group: V3; cluster: V2;
number of observations: 40; number of clusters: 20
Z=1.8267, p-value=0.06774
alternative hypothesis: true difference in locations is not equal to 0
Итак, метод RGL показывает то, что две сравниваемые группы не имеют статистически значимых различий по параметру ПЗО, так как p=0,068, при этом p-значение довольно близко к выбранному критическому уровню 0,05 и поэтому для надежных выводов желательно увеличение числа пациентов в группах.
Затем выполним сравнение тех же групп методом DS:
>clusWilcox.test(x=Data$V1, group=Data$V3, cluster=Data$V2, paired=FALSE, method=”ds”)
Параметр «method=”ds”» указывает на то, что используется метод DS. Результат сравнения групп представлен ниже:
Clustered Wilcoxon rank sum test using Datta-Satten method
data: $ group: $; cluster: $; Data group: Data; cluster: Data; V1
group: V3; cluster: V2;
number of observations: 40; number of clusters: 20
Z=1.8742, p-value=0.0609
alternative hypothesis: true difference in locations is not equal to 0
Как видно, метод DS показал почти такой же результат, как и RGL, p=0,061.
Теперь сравним эти же группы с помощью стандартного критерия суммы рангов Вилкоксона (U-критерий Манна–Уитни), не учитывающего кластеризацию данных, в любом статистическом пакете, например, в IBM SPSS Statistics 20. Вычисленное p-значение составит 0,011, т.е. это примерно в 6 раз меньше, чем при использовании критериев, учитывающих наличие корреляции между парными глазами. На этом основании исследователь вынужден отвергнуть нулевую гипотезу и сделать вывод о наличии статистически значимых отличий между группами, тогда как на самом деле отличия отсутствуют. То есть исследователь совершит ошибку первого рода.
Наконец, попробуем «исправить» данную ситуацию путем включения в анализ только по одному случайно выбранному глазу каждого пациента. Так как левый/правый глаз выбирается случайно, то такая выборка также будет носить случайный характер, например, как на рисунке 2. Вновь с помощью любого статистического пакета выполним сравнение групп U-критерием Манна– Уитни и получим значение p=0,19, что примерно в 3 раза больше p-значений, полученных при сравнении полных данных критериями RGL и DS.
Заключение
Таким образом, дизайн офтальмологических исследований достаточно часто предполагает статистический анализ показателей парных глаз одного и того же пациента. Но при этом выбор статистических методов для данного анализа далеко не всегда проводится адекватно. Необоснованное применение стандартных статистических подходов в случаях наличия кластерных данных приводит к существенному завышению или занижению p-значений проверки статистических гипотез, не позволяет в полной мере учесть весь имеющийся материал и сделать правильные выводы. Оптимальными методами для обработки кластерных данных в таких ситуациях являются продвинутые методы, позволяющие учитывать корреляцию между парными глазами, например, RGL и DS пакета clusrank в программе R.
Для цитирования: Пашенцев Я.Е. Особенности статистического анализа количественных данных парных глаз, непараметрический случай. Офтальмохирургия. 2022;3: 68–74. https://doi.org/10.25276/0235-4160-2022-3-68-74
Автор, ответственный за переписку: Ярослав Евгеньевич Пашенцев, naukakhvmntk@mail.ru
Благодарность. Автор выражает особую благодарность Максиму Александровичу Медведеву за техническую помощь в поиске литературы, ценные советы и поддержку.
Информация об авторе
Ярослав Евгеньевич Пашенцев, младший научный сотрудник, naukakhvmntk@ mail.ru, https://orcid.org/0000-0001-5446-0633
Information about the author
Yaroslav E. Pashentsev, research assistant, naukakhvmntk@mail.ru, https://orcid.org/0000-0001-5446-0633
Вклад автора в работу:
Я.Е. Пашенцев: существенный вклад в концепцию и дизайн работы, сбор, анализ и обработка материала, статистическая обработка данных, написание текста, редактирование, окончательное утверждение версии, подлежащей публикации.
Author's contribution:
Ya.E. Pashentsev: significant contribution to the concept and design of the work, collection, analysis and processing of material, statistical data processing, writing the text, final approval of the version to be published.
Финансирование: Авторы не получали конкретный грант на это исследование от какого-либо финансирующего агентства в государственном, коммерческом и некоммерческом секторах.
Согласие пациента на публикацию: Письменного согласия на публикацию этого материала получено не было. Он не содержит никакой личной идентифицирующей информации.
Конфликт интересов: Отсутствует.
Funding: The authors have not declared a specific grant for this research from any funding agency in the public, commercial or not-for-profit sectors.
Patient consent for publication: No written consent was obtained for the publication of this material. It does not contain any personally identifying information.
Conflict of interest: Тhere is no conflict of interest.
Поступила: 13.04.2022
Переработана: 30.06.2022
Принята к печати: 25.08.2022
Originally received: 13.04.2022
Final revision: 30.06.2022
Accepted: 25.08.2022
Страница источника: 68
OAI-PMH ID: oai:eyepress.ru:article56285
Просмотров: 5494
Каталог
Продукции
Организации
Офтальмологические клиники, производители и поставщики оборудования
Издания
Периодические издания
Партнеры
Проекта Российская Офтальмология Онлайн