
Рис. 1. Архитектура и параметры модели искусственной нейронной сети с тремя сверточными слоями и параметры ее компиляции. Первая цифра в Conv2D — число используемых фильтров в слое свертки, две следующие цифры — размер фильтра в пикселях. Активационные функции нейронов сети — relu, в выходном слое классификации — softmax. Первая цифра в полносвязном слое Dense — число нейронов
Fig. 1. Architecture and parameters of the artificial neural network model with three convolutional layers and its compilation parameters. The first digit in Conv2D is the number of filters used in the convolution layer, the next two digits are the filter size in pixels. The activation functions of the network neurons are relu, in the output classification layer — softmax. The first digit in the fully connected Dense layer is the number of neurons

Рис. 2. Характеристики модели. Размеры карт и число оптимизируемых параметрам по слоям нейронной сети
Fig. 2. Model Summary. Map sizes and the number of optimized parameters by neural network layers
Актуальность
Катаракта является одной из основных причин слепоты в глобальном масштабе [1]. Согласно данным Всемирной организации здравоохранения (ВОЗ), на ее долю приходится приблизительно 50% всех случаев потери зрения в мире [2]. В связи с этим автоматизированная диагностика катаракты на основе анализа изображений, полученных с помощью современных офтальмологических методов визуализации, таких как фотощелевая лампа (ФЩЛ), с применением алгоритмов глубокого машинного обучения (Deep Learning) приобретает значительную научную и клиническую актуальность.
Разработка эффективных компьютерных систем для раннего выявления катаракты способна существенно улучшить диагностику, снизить нагрузку на медицинских специалистов и минимизировать субъективные ошибки при интерпретации результатов [3–5]. ФЩЛ является ключевым офтальмологическим прибором в диагностике катаракты, сочетающим в себе высокую информативность, точность и безопасность [6].
Для нее характерны: высокая степень детализации снимков, позволяющая визуализировать мельчайшие помутнения хрусталика, которые не видны при обычном осмотре; обеспечение оптического среза тканей, дающее возможность определить глубину и структуру катарактальных изменений, вид катаракты (ядерная, кортикальная, субкапсулярная), оценки степени зрелости (начальная, незрелая, зрелая, перезрелая), что важно для планирования операции, дифференцирования катаракты от других патологий (например, дистрофии роговицы, изменений стекловидного тела), выявления сопутствующих заболеваний (глаукомы, увеита), которые могут влиять на тактику лечения. Доступность и безопасность диагностического обследования также могут быть отнесены к достоинствам использования щелевой лампы как прибора диагностики, что делает его основным инструментом в офтальмологической диагностике.
Имеются работы, посвященные вопросам использования систем искусственного интеллекта для идентификации снимков катаракты [7–12]. В работе В.В. Нероева и соавт. (2024) [7] показано, что в настоящее время медицинская отрасль подвергается активной цифровой трансформации, включающей создание электронных баз данных, систем облачной безопасности, мобильных устройств для контроля здоровья и инструментов телемедицины. Одним из важнейших технологических достижений последнего десятилетия является искусственный интеллект (ИИ), все больше находящий свое применение в различных разделах практической медицины.
Наиболее часто применяемым инструментом ИИ принято считать нейронные сети, использование которых в офтальмологии является перспективным подходом, повышающим качество клинического обследования.
В обзоре приведены результаты применения инструментов ИИ в диагностике наиболее распространенных офтальмонозологий, в том числе катаракты. Аналитическая работа Д.Д. Гарри и соавт. [8] представляет собой обзор современных работ, опубликованных в различных изданиях по проблемам машинного обучения при решении различных задач в офтальмологии. Делается вывод о том, что материалы, представленные в обзоре, показывают результаты по точности, чувствительности, специфичности, значениям ошибки, превышающие соответствующие показатели для среднего врача-офтальмолога. Основной вывод — внедрение технологий ИИ, в частности машинного обучения, в рутинную клиническую практику повысит профессиональные возможности врача-специалиста. В статье зарубежных коллег (Gutierrez и соавт.) [9] обсуждаются различные возможности использования систем ИИ в офтальмологии. В частности указано, что лечение катаракты — еще одна область, которая может выиграть от более широкого применения ИИ.
Указывается, что, во-первых, ИИ можно применять в качестве теледиагностической платформы — компьютерного зрения для скрининга и диагностики пациентов с катарактой с использованием ФЩЛ и фотографий глазного дна; во-вторых, в новых формулах расчета ИОЛ для повышения точности прогнозирования, достигая превосходных послеоперационных рефракционных результатов по сравнению с традиционными формулами; в-третьих, ИИ можно использовать для улучшения навыков хирургического лечения катаракты путем идентификации различных фаз операции по удалению катаракты на видео и для оптимизации рабочих процессов в операционной путем точного прогнозирования длительности хирургических процедур; в-четвертых, некоторые модели ИИ сверточных нейронных сетей (СНС, convolutional neural networks, CNN), способны эффективно прогнозировать прогрессирование помутнения задней капсулы и возможную необходимость в лазерной капсулотомии YAG. Эти достижения в области ИИ могут трансформировать процесс управления катарактой и обеспечить предоставление эффективных офтальмологических услуг. Целью исследования X. Wu, Y. Huang, Z. Liu и соавт. (2019) [10] являлось создание и проверка универсальной платформы ИИ для совместного лечения катаракты, включающую многоуровневые клинические сценарии.
При этом наборы данных были маркированы с использованием трехэтапной стратегии: распознавание режима захвата (I); диагностика как нормального хрусталика, так и наличие любого типа катаракты, подлежащей лечению (II), с учетом этиологии и степени тяжести (III).
Агент ИИ был интегрирован с реальной многоуровневой схемой направления, включающей самоконтроль на дому, первичную медицинскую помощь и специализированные больничные услуги. Универсальная платформа ИИ и многоуровневая схема продемонстрировали надежную диагностическую производительность в трехэтапных задачах: распознавание режима захвата (площадь под кривой (AUC) 99,28%; диагностика катаракты (нормальный хрусталик, катаракта или послеоперационный глаз с AUC 99,82, 99,96 и 99,93% для режима мидриатической щелевой лампы и AUC >99% для других режимов захвата) и обнаружение катаракты, подлежащей направлению (AUC >91% во всех тестах).
В исследовании K.Y. Son и соавт. (2022) СНС обучалась и тестировалась с использованием фотографий с щелевой лампы и ретроиллюминационной линзы. Датасет включал 1335 изображений щелевой лампы и 637 изображений ретроиллюминационной линзы от 596 пациентов. Наборы данных изображений были помечены и разделены на обучающие, проверочные и тестовые наборы данных. Производительность платформы была усилена ансамблем из 3 алгоритмов от: ResNet18, WideResNet50-2 и ResNext50. Платформа ИИ показала надежную диагностическую производительность (площадь под кривой рабочей характеристики приемника [AUC], 0,9992 [95% доверительный интервал (ДИ) 0,9986e0,9998] и 0,9994 [95% ДИ 0,9989e0,9998]; точность, 98,82% [95% ДИ 97,7%e99,9%] и 98,51% [95% ДИ 97,4%e99,6%]). В работе российских авторов сообщается, что регулярный скрининг катаракты может быть эффективным способом предотвращения слепоты и определения пациентов, нуждающихся в операции [12].
Разработка модели скрининга катаракты была выполнена авторами на основе открытого набора данных, а ее валидация — на клинических данных. Набор данных содержал 9668 изображений, полученных с помощью камеры смартфона, из которых 4514 изображений относились к классу «катаракта», а 5154 — к здоровым глазам.
Набор для внешней валидации был получен в клинических условиях и содержал 51 изображение с катарактой и нормой. Для создания модели машинного обучения авторы использовали СНС. Значение точности классификации данных составило 0,97 для внутреннего валидационного набора и 0,75 — для внешнего.
Таким образом, обзор современной литературы по данной проблеме указывает на актуальность и перспективность разработки отечественного алгоритмического и программного обеспечения для скрининга катаракты с использованием ИИ на основе искусственных нейронных сетей (ИНС).
Цель
Изучить возможности использования СНС для автоматической классификации изображений (АКИ) глазного яблока, полученных с помощью ФЩЛ, на изображения с признаками катаракты и нормальные, с прозрачным хрусталиком.
Материал и методы
Набор данных, содержащий изображения, полученные при помощи ФЩЛ, включал 937 обезличенных файлов пациентов (левого и правого глаза), из них: норма — 369 и катаракта — 568. Изображения получены в результате совместной работы в данной области Краснодарского, Тамбовского и Оренбургского филиалов ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России (далее — Учреждение).
Из Краснодарского филиала — 389 файлов (178 норма и 211 катаракта), Тамбовского филиала — 319 файлов (129 норма и 190 катаракта) и Оренбургского филиала — 229 файлов (62 норма и 167 катаракта).
На предварительном этапе для работы над изображениями, полученными с использованием ФЩЛ, а также их АКИ с применением СНС, нами были сформулированы и стандартизированы оптимальные рабочие условия для получения изображений: затемненное помещение; щелевая лампа с возможностью фотофиксации; расположение прибора удалено от окон, так как в противном случае на окнах необходимы блэкаут шторы, а не жалюзи с горизонтальными и вертикальными ламелями.
Установочные параметры для ФЩЛ при фотосъемке: увеличение — 16×; положение осветителя ФЩЛ — с височной стороны от исследуемого глаза, в пределах 35– 45°; минимальная ширина световой щели — не более ≈ 1,5 мм; фокусировка на зрачковой кайме радужки, луч ФЩЛ центрирован по центру зрачка. Требования к обследуемому: комплаентность пациента на приеме; способность фиксировать взор в прямом положении; отсутствие медикаментозного мидриаза, широкоразмашистого нистагма, косоглазия с углом косоглазия более 15°; прозрачность роговицы и влаги передней камеры (отсутствие помутнений, рубцов роговицы в оптической зоне, рубцов после радиальной кератотомии; отсутствие выпота и опалесценции влаги передней камеры); отсутствие бликов, артефактов в области зрачка; отсутствие грубых задних синехий, приводящих к выраженной эктопии зрачка; исходя из пункта выше, из исследования исключаются увеальные катаракты с выраженной экссудацией в передней камере, травматические катаракты с повреждением радужки.
Для обучения

Рис. 3. Обучение и валидация нейронной сети с тремя сверточными слоями: а) график увеличения точности; б) график уменьшения функции потерь
Fig. 3. Training and validation of a neural network with three convolutional layers: а) graph of increasing accuracy; б) graph of decreasing loss function

Таблица Показатели точности, достигнутые при обучении, валидации и тестировании нейронных сетей с различным числом сверточных слоев
Table Accuracy rates achieved during training, validation, and testing of neural networks with different numbers of convolutional layers
Все файлы имели формат .JPG. Для АКИ применяли СНС.
При обучении ИНС-моделей использовали следующие параметры компиляции: оптимизатор Adam — один из самых эффективных алгоритмов оптимизации, использующий при адаптации скорости обучения параметров первый и второй моменты градиента; функция потерь categorical_crossentropy — категориальная перекрестная энтропия, метрика accuracy — доля правильных ответов алгоритма. Все технологические процессы с моделями проводили с использованием средств языка Python в Google Colaboratory.
Результаты
В ходе вычислительных экспериментов тестировали различные архитектуры многослойных последовательных (sequential) СНС: несколько сверточных слоев Conv2D, на выходе каждого из которых имелся слой подвыборки MaxPooling2D, слой, осуществляющий преобразование в одномерный тензор Flatten, и два полносвязных слоя Dense, последний из которых имел передаточную функцию нейронов softmax, удобную для решения задачи классификации. Для разрешения нормализованного снимка 512×512 пикселей, к которому приводили все изображения датасета с использованием инструмента rescale, предельное число сверточных слоев составляет 7. Тестировали структуры CNN с числом таких слоев от 2 до 7, одновременно подбирая размер и количество фильтров в слоях. Для всех вычислительных экспериментов проводили обучение (как правило, с числом эпох epochs = 20).
Результаты вычислительных экспериментов представлены в таблице 1. Исходя из прохождения моделью этапов обучения, валидации и дополнительного тестирования рассчитывали значения точности на них, а также важные для офтальмологов показатели чувствительности и специфичности.
Из таблицы 1 видно, что точность, достигнутая при обучении всех моделей, достаточно высока, и составляет 95–100%, что является свидетельством хорошей генерализуемости набора обучающих данных. Указанный показатель снижается вместе с увеличением числа сверточных слоев и соответствующим уменьшением количества оптимизируемых параметров. При этом величина потерь составляет от 0,0049 до 0,1.
Важным показателем, существенным образом, влияющим на точностные и прогностические свойства модели нейронной сети, является число эпох ее обучения на обучающем наборе данных. При малом числе эпох обычно наблюдается неполное обучение модели, т.е. она может не учитывать важные особенности объекта, при большом напротив — учитывает несущественные детали изображений (переобучение), что также влечет снижение прогностических свойств модели. Оптимальное число эпох обучения нейронной сети определяли следующим образом. Поскольку методы обучения являются стохастическими, то использование стандартного инструмента ранней остановки для настройки количества эпох нежелательно по следующей причине: вслед за эпохой, на которой показано ухудшение метрики, может наступить эпоха, на которой эта метрика будет улучшена. Поэтому первоначально осуществляли обучение сети на достаточно большом числе эпох (в нашем случае это число было равно 20), затем определяли, на какой эпохе были получены лучшие значения метрик (точности и потерь), т.е. определяли оптимальное число эпох, такое, чтобы исключить переобучение сети, а после этого осуществляли повторное обучение при найденном оптимальном числе эпох. Следует отметить, что оптимальное число эпох обучения моделей плохо коррелирует с числом сверточных слоев, что это, по всей видимости, является проявлением начальных условий, особенностей структуры связей нейронных сетей и стохастического метода обучения.
Точность, полученная на валидации моделей, хорошо коррелирует с точностью обучения и составляет 72–100%, что является приемлемым результатом для такого класса задач. Причем для моделей с числом сверточных слоев 2–6 этот показатель близок или равен 100%.
Наиболее важными результатами, приведенными в таблице 1, являются общая точность АКИ, чувствительность и специфичность. Видно, что с точки зрения данных показателей оптимальной является нейронная сеть, имеющая три сверточных слоя и обеспечивающая значение чувствительности по отношению к катаракте — 95%, специфичность по отношению к норме — 72,5% и общую точность классификации — 86%. Данные значения получены в ходе тестирования модели на фотоснимках (изображениях), которые не участвовали ни в обучении, ни в валидации модели.
На рисунке 1 показана архитектура используемой модели оптимальной сверточной сети, а на рисунке 2 — ее основные характеристики.
Процесс обучения и валидации нейронной сети показан на рисунке 3, из которого следует, что наибольшая точность для этих процессов имеет место на 10-й эпохе. При этом на дополнительном тесте достигаются наилучшие значения предсказательной способности модели, показанные в таблице.
Необходимо отметить, что достижение лучшей точности АКИ возможно лишь при переучивании модели на больших по объему датасетах (≥ 5 тыс. изображений), учитывающих значительное количество особенностей объектов.
Обсуждение
Близкой к нашему исследованию является работа K.Y. Son и соавт. (2022), посвященная разработке автоматизированной платформы ИИ на основе глубокого обучения для диагностики и оценки катаракты с использованием фотографий щелевой лампы и ретроиллюминационной линзы на основе системы классификации помутнений хрусталика [11], а также модель скрининга катаракты выполненная российскими авторами [12], в которой при создании модели машинного обучения авторы использовали СНС. Нами, в процессе исследования, при выполнении подбора оптимальной архитектуры структуры СНС для АКИ, на основе глубокого обучения СНС и использования оптимизатора Adam, определена оптимальная нейронная сеть, имеющая три сверточных слоя и обеспечивающая достижение высокой точности АКИ, чувствительности по отношению к катаракте — 95%, при общей точности классификации — 86%. Для такого класса задач это приемлемый результат.
Заключение
Изучены и представлены возможности использования СНС для автоматической классификации изображений глазного яблока, полученных с помощью ФЩЛ, на снимки с признаками катаракты и нормальные, хрусталики прозрачны. Разработана оптимальная архитектура модели на основе глубокого обучения сверточной нейронной сети с использованием библиотек Python Keras и Tensorflow в Google Colaboratory. Уровень точности заключений АКИ соответствует точности интерпретации снимков хрусталика врачом-офтальмологом средней квалификации.
Информация об авторах
Ольга Алексеевна Кужавская, врач-офтальмолог диагностическо-реабилитационного центра Тамбовского филиала ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России, kuzhavskaya@list.ru, https://orcid.org/0009-0001-7810-2205
Александр Валерьевич Усов, к.м.н., директор Краснодарского филиала ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России, usvrh@mail.ru, https://orcid.org/0000-0002-0285-1728
Александр Григорьевич Заболотний, к.м.н., доцент, главный научный сотрудник научного отдела Краснодарского филиала ФГАУ «НМИЦ «МНТК «Микрохирургия глаза» им. акад. С.Н. Федорова» Минздрава России, доцент кафедры глазных болезней ФГОУ ВО «КубГМУ» Минздрава России, nok@mail.ru, https://orcid.org/0000-0002-6022-1708
Information about the authors
Olga A. Kuzhavskaya, Ophthalmologist at the Diagnostic and Rehabilitation Centerkuzhavskaya@list.ru, https://orcid.org/0009-0001-7810-2205
Alexander V. Usov, PhD in Medicine, Director of Krasnodar branch, usvrh@mail.ru, https://orcid.org/0000-0002-0285-1728
Alexander G. Zabolotniy, PhD in Medicine, Associate Professor, Chief Researcher of the Scientific Department, nok@mail.ru, https://orcid.org/0000-0002-6022-1708
Вклад авторов в работу:
О.А. Кужавская: сбор, анализ и обработка материала, статистическая обработка данных, написание текста.
А.В. Усов: существенный вклад в концепцию и дизайн работы, сбор, анализ и обработка материала, редактирование, окончательное утверждение версии, подлежащей публикации.
А.Г. Заболотний: существенный вклад в концепцию и дизайн работы, сбор, анализ и обработка материала, написание текста, редактирование.
Authors’ contribution:
O.A. Kuzhavskaya: collection, analysis and processing of the material, statistical data processing, writing.
A.V. Usov: significant contribution to the concept and design of the work, collection, analysis and processing of the material, editing, final approval of the version to be published.
A.G. Zabolotniy: significant contribution to the concept and design of the work, collection, analysis and processing of the material, writing, editing.
Финансирование: Авторы не получали конкретный грант на это исследование от какого-либо финансирующего агентства в государственном, коммерческом и некоммерческом секторе.
Согласие пациента на публикацию: Письменного согласия на публикацию этого материала получено не было. Он не содержит никакой личной идентифицирующей информации.
Конфликт интересов: Отсутствует.
Funding: The authors have not declared a specific grant for this research from any funding agency in the public, commercial, or non-profit sector.
Patient consent for publication: No written consent was obtained for the publication of this material. It does not contain any personally identifying information.
Conflict of interest: There is no conflict of interest.
Поступила: 02.06.2022
Переработана: 28.09.2023
Принята к печати: 31.10.2025
Received: 02.06.2022
Revision: 28.09.2023
Accepted: 31.10.2025



















