Информация – понятие, которое может иметь различные значения в зависимости от отрасли человеческой деятельности. Так написано в Википедии. Информация в медицине - это явление, которое является ключевой составляющей, определяющей профессиональный уровень специалиста. Согласно расчетам компании IBM, известной сегодня своими достижениями в области анализа «больших данных», свыше 90% информации, накопленной с момента появления письменности до конца 2014 г., было собрано всего за два последних года (2012–2014 гг.), при этом рост ее объемов имеет стабильный экспоненциальный характер. В то же время несложные арифметические подсчеты показали, что на механическое чтение всех статей, опубликованных, например, в 15-ти журналах с кераторефракционным профилем, требуется порядка 28-ми часов в сутки. Это значит, что сегодня информация генерируется в объемах, очевидно не позволяющих специалисту быть в курсе всего происходящего даже в практикуемой области, что вынуждает его быть селективным в выборе и что, в свою очередь, предполагает абсолютную вероятность наступления ошибки даже при условии наличия феноменальной памяти. В то же время, общемировая урбанизация и улучшение качества жизни влечет за собой и повышение требований к качеству оказания медицинской помощи, включающей в себя точность диагностики и лечения, их скорость, своевременность и т.д. Несоответствие растущих общественных ожиданий и действительности ведет за собой рост недовольства, увеличение количества судебных исков, ужесточение правового регулирования для медицинских работников, ухудшение их психологического здоровья и качества диагностики и лечения. Конец. Эпилога.
«For every action, there is an equal and opposite reaction» (третий закон Ньютона). На каждое «отрицательное» явление мы можем сформировать уравновешивающее его решение, что означает возможность создания условий, при которых невозможные для человеческого мозга объемы информации, вероятно, могут быть скомпенсированы. Единственным на сегодняшний день инструментом, способным обрабатывать колоссальные объемы информации и выдавать на выходе полезный результат, является использование компьютерных технологий. За время своего существования человечество пережило три промышленные революции, каждая из которых была болезненной для устоявшихся в обществе правил, но, в конечном итоге, приводила к полезным изменениям, без которых трудно представить сегодняшнее благополучие. Сегодня же мы переживаем четвертый этап, более известный как «Индустрия 4.0», который был впервые сформулирован в 2011 году на Ганноверской выставке. «Индустрия 4.0» определяется как массовое внедрение вычислительных процессов в физические процессы, для офтальмологии сегодня это такие направления, как дополненная и виртуальная реальности в диагностике и хирургии, а также использование искусственного интеллекта (ИИ) в различных его эволюционных модификациях.
Самой очевидной и успешно развивающейся областью применения ИИ на сегодняшний день является анализ изображений, который берет свое начало в диагностической радиологии онкологических состояний, что было связано с острой необходимостью решения вопроса рисков наступления неоперабельных состояний по причине «низкой проходимости диагностических кабинетов / несвоевременной диагностики / ошибочных идентификаций патологических изменений». Получив в работе IBM «Watson» точность машинного выявления на МРТ-снимках патологических очагов свыше 80%, данное направление получило активное развитие и в других областях медицины, диагностика которых во многом основана на визуальных проявлениях, в таких как дерматология и офтальмология.
Задача распознавания изображений является необходимой в области медицины, так как возможность автоматического распознавания компьютером изображений приносит множество новых возможностей в развитии науки и техники, таких, как разработка систем поиска и диагностики заболеваний глаз на фотографиях, контроль качества применяемого лечения без участия человека, автоматическое управления функциональной диагностики глазных состояний в общем. В последние годы алгоритмы и методы машинного обучения получают все большее развитие в связи со значительным повышением вычислительных мощностей доступных компьютеров и повсеместном распространении применения графических карт для вычислений, что позволяет обучать нейронные сети (НС) гораздо большей глубины и сложности структуры чем раньше, которые, в свою очередь, показывают значительно лучшие результаты по сравнению с другими алгоритмами для многих задач, в особенности для задачи распознавания изображений. Данное направление развития НС получило название “глубокое обучение” и является одним из наиболее успешных и быстро развивающихся в настоящее время.
Собственно, о нейронных сетях. В истории развития нейронных сетей выделяют 3 основных периода их подъема: искусственный интеллект (1950 – 1980 гг.), машинное обучение (1980 – 2011 гг.) и глубокое обучение (с 2011 г.). Первые исследования в области искусственных НС относятся к 40-м годам 20 века, когда в 1954 году Дж. Маккалок и У. Питтс опубликовали работу «Логическое исчисление идей, относящихся к нервной деятельности», в которой были изложены основные принципы построения искусственных НС. Тогда, в 1949 году была опубликована книга Д. Хебба «Организация поведения», где автор рассмотрел теоретические основы обучения НС и впервые сформулировал концепцию их обучения как настройку весов между нейронами, а в 1954 году В. Кларк впервые осуществил попытку реализовать аналог сети Хебба с помощью компьютера. В 1958 году Ф. Росенблатт предложил модель персептрона, который представлял собой, по сути, НС с одним скрытым слоем. Принципиальный вид персептрона Росенблатта представлен на рис. 1.
Данная модель обучалась с помощью метода коррекции ошибок, который заключался в том, что веса остаются неизменными до тех пор, пока выходное значение персептрона корректно, в случае же ошибки вес связи изменяется на 1 в сторону, обратную знаку произошедшей ошибки. Данный алгоритм, как было доказано Росенблаттом, всегда сходится. Используя такую модель, удалось создать компьютер, распознающий некоторые буквы латинского алфавита, что, несомненно, было большим успехом в то время.
Рис. 3. Пример снимков глазного дна для анализа с применением нейронных сетей
Рис. 4. Снимок пользовательского интерфейса ПО от DeepMind
Последним на сегодня эволюционным этапом развития НС является «глубокое обучение» (deep learning), которое обучается «без учителя», т.е. алгоритму не предоставляется никакой дополнительной информации от экспертов кроме самого набора исходных данных. Наиболее популярным примером задачи обучения «без учителя» является задача кластеризации. Суть задачи кластеризации состоит в следующем: на вход алгоритму подается некоторое количество объектов, принадлежащих разным классам (но какому классу принадлежит какой объект неизвестно, может быть неизвестно также само количество классов), и цель работы алгоритма – разбить это множество объектов на подмножества «схожих» объектов, то есть принадлежащих одному классу. Качество анализа с применением нейронных сетей во многом зависит от объема базы данных, на которых они «обучаются», т.е. чем больше снимков, тем точнее диагностика. Глубокое обучение использует алгоритм сверточных нейронных сетей, который был предложен командой, состоящей из Пьером Серманет и Яном ЛеКун из университета Нью Йорка. Данный алгоритм был подробно описан в статье “Traffic Sign Recognition with Milti-Scale Convolutional Networks”. В данном алгоритме все исходные изображения были масштабированы до размера 32*32 пикселя и преобразованы в оттенки серого, после чего к ним была применена нормализация контраста. Также размер исходного обучающего множества был увеличен в 5 раз путем применения к исходным изображениям небольших случайных трансформаций. Результирующая сеть была составлена из двух «этапов», как представлено на рис. 2, при этом в итоговой классификации были использованы выходные значения не только второго этапа, но и первого. Данная сеть показала точность 98,31%. В настоящее время имеется множество работ, демонстрирующих впечатляюще высокий уровень диагностики офтальмологических заболеваний, основанных на анализе фотографий глазного дна, данных оптической когерентной томографии и т.д.
Нейронные сети в офтальмологии. Если говорить об офтальмологии, то уже сегодня это впечатляющие результаты при анализе таких патологических состояний глаз как диабетическая ретинопатия (ДРП), возрастная макулярная дегенерация, макулярный отек, глаукома, катаракта и др. При этом анализу подвергаются цветные снимки глазного дна, снимки, полученные при проведении флюоресцентной ангиографии и аутофлюорисцентные, сканы оптической когерентной томографии (ОКТ), поля зрения.
«Пилотной» патологией для апробирования возможностей нейронных сетей была ДРП, поскольку в своем развитии она приобретает ряд четко визуализируемых изменений, на которых удобно «обучать» НС. Так в работе "Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs", обученное на 128 000 снимках глазного дна (рис. 3) программное обеспечение (ПО), продемонстрировало 0,95 уровень F-меры (комбинированный параметр чувствительности и специфичности, где максимум составляет 1,0), практическую значимость чего трудно игнорировать.
На рис. 4 продемонстрирован результат работы программного обеспечения, разработанного подразделением «DeepMind» компании Google, которое является одним из пионеров в области глубокого обучения в области офтальмологии. Анализ 15 тысяч ОКТ-сканов позволил разработчикам написать ПО, которое выполняет параллельный анализ сразу по нескольким заболеваниям сетчатки и на выходе предоставляет доктору информацию о степени вероятности наличия того или иного, исходя из соотношения патологических признаков, которые могут быть характерны для нескольких заболеваний. На данном примере показано обнаружение изменений, которые на 99,5% (согласно внутренним критериям программы) соответствуют хриоидальной неоваскуляризации, а также степень неотложности данного заболевания, что может быть использовано при скрининговых обследованиях. В этой же работе была продемонстрирована возможность и значимость параллельного анализа нескольких параметрических факторов, что позволяет значительно снизить вероятность ошибки за счет отсечения случайно обнаруженных одиночных переменных, которые могут быть характерны для конкретного заболевания.
Перспективы. Доступные на сегодняшний день вычислительные возможности позволяют реализовывать на практике расчеты в объемах, которые не были доступны никогда ранее. Так, например, компиляция в расчётах нескольких диагностических данных по такому заболеванию как глаукома, может позволить выявлять не только наличие самого заболевания, но и прогнозировать возможный исход, агрессивность течения заболевания, эффект от конкретного вида лечения и т.д. а также выявлять ранее неизвестные критерии, присущие заболеванию, которые могут иметь критическое значение в ведении пациента, что реализуемо при применении алгоритмов глубокого обучения. Подобные решения могут быть применены фактически во всех направлениях офтальмологии, что позволит вывести возможности здравоохранения на принципиально новый уровень.