Актуальность

Рис. 1. Развитие искусственного интеллекта
Fig. 1. Development of Artificial Intelligence

Рис. 2. Процесс отбора исследований в соответствии с требованиями PRISMA
Fig. 2. Process for selecting studies in accordance with PRISMA requirements
Искусственный интеллект – это новые теоретические подходы, методы, технологии и прикладные системы для моделирования и расширения человеческого интеллекта. Машинное обучение, появившееся в 1980-х гг., является подмножеством искусственного интеллекта и через имитацию процесса обучения обеспечивает передачу машине новых знаний или навыков. Новой областью машинного обучения, появившейся в 2000-х гг., является глубокое обучение, концепция которого берет свое начало из исследований в области разработки искусственных нейронных сетей. Глубокое обучение направлено на моделирование человеческого мозга и способно интерпретировать такие сложные данные, как изображения, звуки и тексты (рис. 1).
Если говорить об эволюции искусственного интеллекта, то процесс усложнения алгоритмов происходил от наименее сложных систем, работающих согласно простейшим правилам «И/ИЛИ», к наиболее сложным системам, которые сами определяют правила и закономерности в обучающих наборах данных и далее позволяют использовать эти правила для вывода результата задачи.
В настоящее время медицинская диагностика в основном сосредоточена на применении инструментальных методов исследований. Различные приборы собирают большое количество данных, что вместе с развитием математических методов, позволяющих оптимизировать алгоритмы обучения, приводит к появлению автоматизированных систем скрининга пациентов [1–3]. Новая эра клинической диагностики и терапии срочно требует интеллектуальных инструментов для безопасного и эффективного управления медицинскими данными. В офтальмологии искусственный интеллект является одним из инструментов, способствующих повышению эффективности процесса лечения за счет более точной диагностики [4], оценки новых биомаркеров заболеваний [5], автоматизации процессов принятия решений и помощи в других аспектах повседневной деятельности врача. Кроме того, одним из наиболее важных факторов внедрения в нашу повседневную жизнь искусственного интеллекта является децентрализация опыта специалиста на более широкие географически распределенные области.
Целью настоящего обзора является описание имеющихся на сегодняшний день разработок в области искусственного интеллекта применительно к процессу диагностики и хирургии кератоконуса.
Материал и методы.
Поиск литературы проводился согласно рекомендациям PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analysis) [6]. Поиск включал все доступные исследования, опубликованные до 9 ноября 2021 г. включительно. Базы данных, которые использовали для поиска литературы, включали: Google и Google Scholar, PubMed, Embase, MEDLINE и Web of Science.
Критериями включения для данного обзора являлись статьи, которые представляли результаты применения алгоритмов искусственного интеллекта в ведении пациентов с кератоконусом, информацию о любой из метрик оценки, таких как точность, чувствительность или специфичность модели, информацию о базе данных пациентов и тип используемого алгоритма машинного обучения. Исследования исключались, если они дублировались, были опубликованы в форме обзора, редакционной статьи, исследовательского письма, письма редактору или короткого сообщения, не имели полного текста, были написаны не на английском языке, использовали тренировочный набор данных для оценки точности алгоритма.
Поиск по базам данных всех оригинальных статей проводился с помощью такого поискового запроса, как: (((artificial intelligence) OR (machine learning)) AND (keratoconus) AND ((diagnosis) OR (surgery) OR (keratoplasty) OR (crosslinking) OR (CXL) OR (ICRS) OR (rings)).
Первый этап отбора состоял в анализе заголовков и аннотаций, после чего оставшиеся статьи были включены в список для полнотекстового анализа. Данные, извлеченные из каждой такой статьи, включали: первого автора, год публикации, группы пациентов, размер выборки, прибор, тип данных, алгоритм выделения наиболее значимых параметров, алгоритм обучения модели, наибольшую точность, способ валидации.
Результаты.

Рис. 3. График количества публикаций, в зависимости от года публикации
Fig. 3. Graph of the number of publications depending on the publication year

Рис. 4. Методы машинного обучения, которые были использованы при разработке алгоритмов диагностики и хирургии кератоконуса
Fig. 4. Machine learning methods that were used in the development of algorithms for the diagnosis and surgery of keratoconus
Разработка алгоритмов искусственного интеллекта в диагностике и хирургии кератоконуса имеет общую схему, которая включает следующие этапы:
1. Получение и обработка данных.
2. Маркирование данных.
3. Выделение наиболее значимых параметров.
4. Тренировка и тестирование модели с использованием алгоритмов искусственного интеллекта.
5. Оценка полученной модели.
6. Разворачивание модели для ее использования в клинической среде.
В связи с этим настоящий обзор разделен на соответствующие части, которые содержат информацию о каждом из этапов в соответствии с анализируемыми работами.
Общая информация
График количества статей в зависимости от года публикации приведен на рисунке 3.
Среди исследований, которые были выбраны для полнотекстового анализа, 68 представляли собой разработку алгоритмов диагностики кератоконуса, 3 – включали создание алгоритмов сегментации и моделирования изображений роговицы для диагностики кератоконуса и 5 исследований были сосредоточены на разработке алгоритмов для хирургии кератоконуса.
Получение данных
Первым этапом разработки алгоритмов машинного обучения является получение набора данных, который используется для тренировки и тестирования моделей. Данные выгружают из источника, далее проводят их очистку и обработку, а также маркируют согласно поставленной задаче.
На сегодняшний день существует множество устройств диагностики кератоконуса. В большинстве исследовании [7–21] данные были получены с прибора Pentacam (Oculus) в виде файлов CSV, которые содержали численные значения измерений роговицы и индексов. Кроме численных данных, некоторые модели были обучены с помощью карт толщины, сагиттальной (аксиальной) и тангенциальной кривизны, преломляющей силы и элевации передней и задней поверхностей [1, 13, 22–25]. Численные измерения топографии роговицы и изображения в анализируемых работах были также получены с помощью кератотопографов Oculyzer [26], Galilei [27, 28], Precisio [29], Sirius [30–34], кератотомографа Orbscan [2, 35–38], TMS [39–43], а также видеокератоскопа EyeSys (EyeSys Laboratory, Houston, TX) [44].
Картирование толщины эпителия роговицы с помощью оптической когерентной томографии (ОКТ) также может быть полезно для ранней диагностики кератоконуса. Сканы ОКТ, полученные с помощью различных томографов (Bioptigen) [45] и топографов (EyeSys) [46], были использованы для разработки алгоритмов диагностики кератоконуса, сегментации и моделирования строения роговицы [47–49], а также алгоритмов прогнозирования исхода хирургии [50]. Обучение моделей проводили на изображениях (картах передней элевации, передней кривизны, задней элевации, задней кривизны, преломляющей силы и толщины) [51, 52], численные данные в виде параметров [53, 54], полученных с прибора ОКТ (CASIA SS-1000, Tomey) или же на изображениях и на численных данных [55].
При кератоконусе нарушение регулярности поверхности роговицы приводит к значительному увеличению оптических аберраций, в том числе и высших порядков, в основном за счет вертикальной комы, следствием чего является снижение остроты и качества зрения [53]. В анализируемых исследованиях использовали полиномиальные коэффициенты Zernike полученные на топографах, использующих технологию Placido [54, 56, 57], а также на аберрометрах OPD-Scan (NIDEK) [58] и Eyesys [59, 60].
Структурные изменения у пациентов c кератоконусом также влияют на измерение внутриглазного давления (ВГД) при тонометрии. В исследовании Leao и соавт. использовали данные тонометра Corvis ST [61] для разработки автоматизированного алгоритма диагностики кератоконуса.
В целом на практике диагностика кератоконуса сложна и представляет собой комбинацию измерений, полученных с различных приборов. Поэтому использование данных нескольких приборов для обучения модели машинного обучения может привести к появлению более объективного алгоритма [58, 62–65]. В некоторых работах обучение проводили на топографических и биомеханических параметрах [56, 66, 67], топографических и ОКТ параметрах [21, 64], топографии и пахиметрии [65].
Изображения латерального отрезка глаза (LSPI), снятые на камеру смартфона [68], использовали в работе Rachana Chandapura и соавт. Согласно авторам, полученный алгоритм позволит проводить диагностику без дорогостоящего и труднодоступного оборудования.
Маркировка данных

Рис. 5. Схемы строения алгоритмов в зависимости от типа машинного обучения
Fig. 5. Diagrams of the structure of algorithms depending on the type of machine learning

Таблица Сводная таблица включенных в обзор исследований по применению искусственного интеллекта в диагностике и хирургии кератоконуса
Table Summary table of studies included in the review of the use of artificial intelligence in the diagnosis and surgery of keratoconus
При оценке стадии кератоконуса наиболее часто использовали классификацию Amsler-Krumeich [11, 19, 39, 51, 66]. В работах JoseM. Bolarin и Jose S. VelazquezBlazquez применяли классификацию RETICS [32, 34]. Еще одним вариантом классификации данных являлась оценка с помощью приборов. Так, данные маркировали на легкую, среднюю и продвинутую стадии относительно индекса TKC (Pentacam) [17, 67] и с помощью программного обеспечения для автоматической классификации роговицы Corneal Navigator на приборе OPD-Scan (NIDEK) [58]. В других исследованиях данные классифицировали на 3 стадии с помощью томографии и биомикроскопических признаков [12, 13, 25, 71].
В трех анализируемых работах была поставлена задача определения прогрессии кератоконуса [14, 20, 52].
Маркировка данных в исследованиях по разработке моделей машинного обучения для хирургии кератоконуса в основном представляла собой исход операции [50] или назначение на оперативное вмешательство [63]. В исследовании M.A. Valdes-Mas были использованы значения Astigmatism и К1, измеренные после имплантации интрастромальных колец [65].
Нужно также отметить, что разработка модели неконтролируемого машинного обучения не требует проведения процедуры маркировки данных, что значительно упрощает процесс разработки алгоритма. В исследовании S. Yousefi и соавт. [72, 73] параметры, полученные из ОКТ-изображений роговицы, использовали для оценки стадий кератоконуса, а также прогнозирования вероятности необходимости будущей кератопластики с помощью метода кластеризации, без предварительного разделения данных на группы.
Выделение наиболее значимых параметров
На производительность системы машинного обучения влияет несколько факторов, включая представление и актуальность данных, используемых этой системой. Во многих случаях разработка такой системы затруднена из-за большого количества шума, который содержат данные. Решением подобного рода проблемы является выбор наиболее значимых параметров. Данная процедура позволяет ускорить обучение, снизить сложность и улучшить точность модели [74]. В сравнительном исследовании выявления прогрессии кератоконуса были использованы методы классификации без предварительного выбора наиболее значимых параметров и с выбором параметров, а также оценены различные типы алгоритмов выбора параметров [75]. Кроме того, в работе T.K. Yoo и соавт. было показано, что выделение наиболее значимых параметров и использование данной комбинации при разработке модели обеспечивает большую точность конечного алгоритма [62].
Среди таких алгоритмов при разработке диагностических алгоритмов использовали T-тест Стьюдента [44], логистический регрессионный анализ [30, 34], программное обеспечение WEKA [16, 29], ранжирование функций и выбор подмножества функций [55], алгоритм рекурсивного выделения функций [19, 75, 76], дискриминантный коэффициент Фишера [21]. Значимые параметры, выбранные с помощью данных алгоритмов, использовались далее для разработки моделей.
Методы машинного обучения
В исследованиях, направленных на разработку алгоритмов искусственного интеллекта для диагностики и хирургии кератоконуса, был использован широкий набор методов. Так, 38 работ включали алгоритмы контролируемого обучения, 10 работ – алгоритмы неконтролируемого обучения, 40 работ – нейросети, а в 2 работах сообщалось о создании системы принятия решений [71] и экспертной системы [41] (рис. 4).
В большинстве анализируемых исследований для классификации нормальных глаз, субклинического кератоконуса, стадий кератоконуса, а также других заболеваний использовали методы контролируемого машинного обучения(рис. 5 А), такие как метод опорных векторов (SVM) [3, 7, 9, 12, 17, 26, 31, 66, 76], метод случайного леса (RF) [7, 8, 18, 20, 56, 62, 64, 67, 71] и дискриминантный анализ (DA) [2, 7, 19, 41, 58, 60, 67].
Алгоритмами неконтролируемого машинного обучения (рис. 5 Б)в анализируемых работах являлись модель Гауссовых смесей (GMM) [11], анализ главных компонент (PCA) [8, 72, 73], метод tSNE и кластеризация на основе плотности (HDBSCAN) [38, 72, 73]. Глубокое обучение, включающее нейронные сети, является самым передовым и перспективным направлением в разработке алгоритмов машинного обучения. Наиболее часто использующимся типом нейронной сети в анализируемых исследованиях является сверточная нейронная сеть. Сверточная нейронная сеть (CNN) – это сеть прямого распространения, которая часто используется в обработке изображений. Она включает сверточный (convolution), объединяющий (pooling) и полностью связанный (fully connected) слои(рис. 5 В).
Другие типы нейронных сетей включали многослойную нейронную сеть персептронов [7, 10, 11, 13, 15, 25, 60, 65, 77], GAN сеть [22], Ensemble of Deep Transfer Learning (EDTL), который объединяет несколько сетей в один алгоритм [69], а также Variational autoencoder (VAE) [11].
Измерение точности и проверка работоспособности (валидация) модели
После тренировки и тестирования полученной модели следует этап ее валидации и измерения точности. Обязательным этапом валидации модели является разделение набора данных на тренировочный и тестовый наборы. В некоторых случаях данные делят на 3 набора – тренировочный, тестовый и валидационный, причем последний может включать как данные из общего набора, так и данные из других источников (других клиник, приборов и т.д.) [25].
Метриками точности для задач регрессии являются средняя абсолютная ошибка (MAE), cреднеквадратическая ошибка (MSE) и среднеквадратическое отклонение (RMSE) [65].
Метриками оценки производительности машинного обучения в задачах классификации являются матрица путаницы (confusion matrix), метрика AUC, а также показатели accuracy, error rate, sensitivity, specificity, precision, recall и F1.
При использовании нейронных сетей проблема интерпретации полученной модели стоит наравне с оценкой ее точности. Карты значимости – самый старый и наиболее часто используемый метод интерпретации прогнозов сверточных нейронных сетей [23, 66]. Еще одной категорией методов интерпретации является «Карта активации класса» (class activation map, CAM) [1, 23, 40, 66].
Несмотря на то что в большинстве исследований используют одни и те же способы проверки точности и оценки модели, сравнение моделей, полученных на разных наборах данных, вызывает сомнение, так как на значения точности влияют такие параметры, как количество и качество данных, способы их маркировки, а также используемые алгоритмы. В связи с этим обычно сравнивают точность определения отдельных классов данных (групп), различных алгоритмов, комбинаций отдельных параметров, приборов, классификаций и т.д. (таблица). Наибольшая точность при сравнении классов в отдельных исследованиях обычно была показана для определения нормы, относительно всех глаз с кертоконусом [12, 13, 21, 23, 25, 58, 76]. При сравнении точности алгоритмов, включающих разные параметры, наилучший результат был показан для карт пахиметрии [1], сагитальной карты [69], задней элевации [52], аксиальной карты совместно с картой пахиметрии [78], использования данных топографии вместе с измерениями ОКТ [64] и использования данных элевации с индексами поверхности и кератометрией [27]. Также в ряде работ было приведено сравнение различных алгоритмов. Так, наибольшую точность относительно остальных алгоритмов имели алгоритмы: RF [7, 18], NB [10, 16, 33, 77], MLP [11], SVM [55], kNN [54], DT [57], NN [79], DA [60], и архитектуры нейронных сетей KerNet [24] и ResNet152 [40].
Применение разработок в практике
Заключительным этапом разработки моделей искусственного интеллекта является их применение в практике. Тем не менее из 75 исследований только в 4 сообщалось о создании графического интерфейса, который позволяет врачу использовать данное решение на новых данных [2, 19, 32, 34], и только в одном исследовании приводилось сравнение решений, полученных с помощью разработанного алгоритма с решениями врача [63].Также только один алгоритм находится в открытом доступе и может быть использован с любого устройства [19].
Заключение
Методы машинного обучения представляют собой перспективный подход, который может стать дополнительным инструментом диагностики и принятия решения для офтальмолога, позволяя классифицировать пациентов с кератоконусом, субклиническим кератоконусом, а также определить стадию или прогрессирование заболевания.
Точность алгоритмов, которые были получены в анализируемых работах, составила в основном более 90%. Тем не менее сравнивать точность между исследованиями не представляется возможным ввиду различий в типе и количестве данных, их маркировке, алгоритмах обучения моделей и оценке точности.
Все рассмотренные исследования рассчитывали точность относительно тестового или валидационного набора данных. Оценка согласованности результата применения алгоритма к новым данным с решением врача приводилась только в одном исследовании и составляла 92,7% [63].
Методы классического машинного обучения были использованы в половине исследований, включенных в обзор, в то время как авторы другой части применяли нейронные сети для разработки алгоритмов. Наиболее часто встречающимися методами классического машинного обучения являлись SVM и RF. Наиболее часто используемым типом нейронных сетей являлась конволюционная нейронная сеть.
Не менее важной частью разработки систем, основанных на алгоритмах машинного обучения, является обеспечение возможности их применения в клинической среде, тем не менее только 4 исследования из 75 сообщили о создании графического интерфейса.
Таким образом, применение алгоритмов искусственного интеллекта может стать полезным инструментом автоматической классификации пациентов с таким заболеванием как кератоконус, обеспечив тем самым своевременную и качественную диагностику. Кроме того, даже такие сложные процессы, как предсказание результата хирургического вмешательства, становятся возможным благодаря техническим решениям на основе искусственного интеллекта.
Информация об авторах:
Борис Эдуардович Малюгин, д.м.н., профессор, boris.malyugin@gmail.com, https://orcid.org/0000-0001-5666-3493
Сергей Николаевич Сахнов, кандидат медицинских наук, кандидат экономи-ческих наук, доцент, s_sakhnov@inbox.ru, https://orcid.org/0000-0003-2100-2972
Любовь Евгеньевна Аксенова, магистр биологии, axenovalubov@gmail.com, https://orcid.org/0000-0003-0885-1355
Виктория Владимировна Мясникова, д.м.н., доцент, vivlad7@mail.ru, https://orcid.org/0000-0003-1748-7962
Information about the authors:
Boris E. Malyugin, PhD, MD, Professor, boris.malyugin@gmail.com, https://orcid.org/0000-0001-5666-3493
Sergey N. Sakhnov, Candidate of Medical Sciences, Candidate of Economic Sciences, Associate Professor, s_sakhnov@inbox.ru, https://orcid.org/0000-0003-2100-2972
Lyubov‘ E. Axenova, Master of Biology, axenovalubov@gmail.com, https://orcid.org/0000-0003-0885-1355
Viktoriya V. Myasnikova, MD, Associate Professor, vivlad7@mail.ru, https://orcid.org/0000-0003-1748-7962
Вклад авторов в работу:
Б.Э. Малюгин: существенный вклад в концепцию и дизайн работы, редактирование, окончательное утверждение версии, подлежащей публикации.
С.Н. Сахнов: существенный вклад в концепцию и дизайн работы, окончательное утверждение версии, подлежащей публикации.
Л.Е. Аксенова: существенный вклад в концепцию и дизайн работы, сбор, анализ и обработка информации, статистическая обработка данных, написание текста.
В.В. Мясникова: существенный вклад в концепцию и дизайн работы, редактирование.
Authors‘ contribution:
B.E. Malyugin: significant contribution to the concept and design of the work, editing, final approval of the version to be published.
S.N. Sakhnov: significant contribution to the concept and design of the work, final approval of the version to be published.
L.E. Axenova: significant contribution to the concept and design of the work, collection, analysis and processing of material, statistical data processing, writing the text.
V.V. Myasnikova: significant contribution to the concept and design of the work, editing.
Финансирование: Авторы не получали конкретный грант на это исследование от какого-либо финансирующего агентства в государственном, коммерческом и некоммерческом секторах.
Согласие пациента на публикацию: Письменного согласия на публикацию этого материала получено не было. Он не содержит никакой личной идентифицирующей информации.
Конфликт интересов: Отсутствует.
Funding: The authors have not declared a specific grant for this research from any funding agency in the public, commercial or not-for-profit sectors.
Patient consent for publication: No written consent was obtained for the publication of this material. It does not contain any personally identifying information.
Conflict of interest: Тhere is no conflict of interest.
Поступила: 20.06.2021
Переработана: 11.09.2021
Принята к печати: 24.12.2021
Originally received: 20.06.2021
Final revision: 11.09.2021
Accepted: 24.12.2021