Диагностика
опухолей — один из примеров, когда искусственный интеллект может
оказаться крайне полезным. Прохождение маммографии с целью
предотвращения рака груди является (или должно быть) регулярной
практикой для взрослых женщин. Маммография — это всего лишь радиография
молочных желез, позволяющая распознать аномалии, которые могут быть
злокачественными опухолями. Поэтому всякий раз, когда радиолог при
маммографии выявляет подобную аномалию, он проводит более подробный
анализ, для которого требуется биопсия, или изъятие тканей из организма —
намного более дорогостоящая и болезненная процедура, чем маммография. Положительные
результаты биопсии в 10 % случаев оказываются ложными — иными словами,
при маммографии обнаруживается аномалия, однако биопсия не показывает
никаких следов опухоли. Поэтому врачам крайне важно иметь в своем
распоряжении средства, позволяющие свести к минимуму эти 10 %
ложноположительных результатов, — чтобы снизить не только расходы на
здравоохранение, но и стресс от обследования. С
другой стороны, наблюдаются и ложноотрицательные результаты, когда
маммография не показывает никаких аномалий, но у пациента уже развилась
опухоль. Крайне важно, чтобы новые средства диагностики позволяли
снизить число как ложноположительных, так и ложноотрицательных случаев.
Как вы узнаете чуть позже, снизить число ложноотрицательных случаев
намного сложнее, чем ложноположительных, при этом последствия
ложноотрицательных случаев намного серьезнее. Представьте,
что онколог анализирует результаты маммографии пациента, чтобы
определить наличие признаков опухоли. В общем случае он выполняет
следующие действия. 1. Анализ
результатов маммографии и выявление наиболее важных параметров с целью
определения новой проблемы. Множество выявленных параметров позволяет
описать сложившуюся ситуацию. 2. Поиск
иных результатов маммографии, обладающих похожими свойствами, которые
были ранее получены самим врачом или приведены в специальной литературе. 3. Установление диагноза с учетом диагнозов для множества схожих результатов маммографии. 4. Наконец, при необходимости консультация с коллегами для подтверждения диагноза. 3. Запись диагноза в базу для последующего использования в будущем. Описанная
процедура полностью совпадает с одним из самых популярных методов
прогнозирования, используемых в искусственном интеллекте, называется он
«рассуждение по прецедентам», или CBR (от англ. Case-Based Reasoning).
Рассуждение по прецедентам заключается в решении новых задач путем
поиска аналогий с уже решенными задачами. После того как выбрано
наиболее схожее решение, оно адаптируется к особенностям новой задачи,
поэтому рассуждение по прецедентам помогает не только анализировать
данные, но и достигать более общей цели — интеллектуального решения
задач на основе анализа данных. * * * ХАРАКТЕРИСТИКИ, ИСПОЛЬЗУЕМЫЕ ПРИ ОБНАРУЖЕНИИ ОПУХОЛЕЙ ГРУДИ Рассуждение
по прецедентам, подобно другим интеллектуальным методам, может
применяться для обнаружения злокачественных опухолей при маммографии.
Так как входными данными в любом из подобных методов являются числа,
необходим промежуточный этап, который заключается в автоматическом
извлечении числовых данных из медицинских изображений. При обнаружении
опухолей груди обычно производятся измерения некоторых часто
встречающихся элементов молочных желез, называемых микрокальцинатами,
которые представляют собой микроскопические скопления кальция в тканях.
Для обнаружения злокачественных микрокальцинатов в молочных железах
обычно используются следующие характеристики: площадь, периметр,
компактность (соотношение между площадью и периметром), число отверстий,
неровность (величина, описывающая неправильную форму микрокальцината),
длина, ширина, вытянутость (соотношение между длиной и шириной) и
положение центра тяжести микрокальцината. * * * Подобно
тому как эксперт хранит накопленные знания в памяти или в блокнотах, в
рассуждении по прецедентам используется структура данных под названием
«память прецедентов», где хранятся ранее проанализированные случаи.
Схема рассуждения по прецедентам представлена на следующем рисунке. Первая
фаза рассуждения по прецедентам, извлечение, состоит в поиске в памяти
прецедентов решений задач, наиболее схожих с текущей. В нашем примере
цель извлечения — найти прошлые результаты маммографии, по своим
характеристикам схожие с полученными при обследовании. Далее
проводится адаптация — попытка адаптировать обнаруженное решение к
рассматриваемому случаю. Предположим, что логистической компании
необходимо перевезти груз из Лиссабона в Рим, и для оптимизации маршрута
используется рассуждение по прецедентам. На первом этапе в памяти
прецедентов будет произведен поиск ранее выполненных перевозок по
наиболее похожим маршрутам. Допустим,
в памяти прецедентов содержится уже оптимизированный маршрут между
Мадридом и Миланом. Следовательно, большая часть нового маршрута будет
уже известной, и останется лишь оптимизировать путь от Лиссабона до
Мадрида и от Милана до Рима. Оптимизацию этих двух небольших частей
общего маршрута можно провести другими, классическими методами.
Использование уже известного маршрута Мадрид — Милан при прокладке
нового маршрута Лиссабон — Рим и представляет собой суть этапа
адаптации. Далее
выполняется проверка, в ходе которой эксперт-человек анализирует
диагноз, поставленный машиной. На этом этапе человек и машина работают
вместе, что способствует непрерывному улучшению качества работы машины и
повышению точности результатов. Диагностирование раковых опухолей
крайне важно, поэтому руководители системы здравоохранения не передают
решение этой задачи автоматическим средствам, не требующим участия
человека. На
последнем этапе рассуждения по прецедентам следует определить, стоит ли
включать решение, утвержденное экспертом, в память прецедентов? Иными
словами, достаточно ли оно репрезентативно, чтобы включить его в набор
результатов маммографии, которые будут использоваться для диагностики
опухолей в будущем? Итог
рассуждений по прецедентам (и рассуждений эксперта) будет успешным
только при корректном прохождении всех четырех перечисленных этапов. На
каждом из этапов необходимо учитывать следующие основные аспекты. — Критерий извлечения: не все предыдущие результаты одинаково полезны. Следует
определить, какие прецеденты нужно выбрать при рассмотрении нового
случая. Для этого необходимо ввести метрики, или расстояния, позволяющие
оценить схожесть нового случая и тех, что хранятся в памяти. К примеру,
при анализе результатов маммографии для нового случая с помощью этих
математических метрик определяется, какой из уже известных результатов
больше всего схож с анализируемым. — Критерий достоверности:
для каждой предметной области характерны определенная сложность и
уровень риска. В примере с диагностированием опухолей очевидно, что
цена, которую необходимо заплатить в случае ложноотрицательного
результата, намного выше, чем если врач посчитает доброкачественную
опухоль злокачественной. Поэтому крайне важно иметь механизмы
определения критериев, позволяющих гарантировать достоверность
результата. — Критерий проверки:
проверка предложения требует вмешательства эксперта. В примере с
анализом результатов маммографии в силу особой важности процедуры
проверку производит эксперт-радиолог. — Критерий сохранения знаний:
способность решать задачи напрямую связана с имеющимся опытом их
решения. Следовательно, необходимо четко обеспечить непротиворечивость
знаний как при включении новых случаев, так и при устранении уже
имеющихся, вносящих противоречия. Все
перечисленные выше аспекты имеют общую основу — накопленный опыт
системы. Желательно, чтобы память прецедентов обладала следующими
свойствами: — компактность: память
не должна содержать ни избыточных случаев, ни шума, иначе
рассматриваемая ситуация будет искажена, а при подборе случаев, наиболее
схожих с рассматриваемым, возникнут ошибки; — репрезентативность:
нельзя решить задачу, о которой ничего не известно, поэтому необходимо
иметь репрезентативные примеры всех возможных аспектов предметной
области. Только так мы гарантируем, что наше видение реальности при
решении задачи будет полным; — ограниченность:
скорость работы системы напрямую зависит от того, с каким числом
элементов она работает. Размер памяти определяет, способна ли система
дать ответ в разумное время. Три
вышеперечисленных свойства можно свести к следующей предпосылке:
необходимо располагать минимально возможным множеством независимых
инцидентов, полностью описывающих предметную область.
|