Информационные основы диагностики

Познание окружающего мира неразрывно связано с изучением принципов организации и развития живой материи. Понимание процессов, протекающих в живом организме, опознание определенных функциональных состояний и прогнозирование развития представляется чрезвычайно важной задачей. С позиции медицинской практики, накопленные и осмысленные в этой области знания, позволяют формулировать определенные понятия о механизмах и принципах развития биологических систем, а в рамках большого числа математических концепций — создавать модели, описывающие поведение таких систем в реальных условиях окружающего мира.

В самом общем понимании медицинская диагностика строится на двух уровнях. Первый уровень представляют инструментальные методы исследования состояния живого организма. Перечень методов этого направления достаточно большой. На практике хорошо известны кардиографический, энцефалографический, рентгеновский, изотопный, ультразвуковой и другие методы исследования. Отдельную позицию в этом списке занимают методы клинического лабораторного анализа. Такие методы позволяют установить функциональное состояние живого организма на основе биохимических исследований крови, мочи, клеточных фрагментов биологической ткани.

На основе инструментальных методов исследования получают специальные пакеты данных, анализируя которые формируется диагностическое заключение. Форма представления данных в таких методах различна и определяется техническими параметрами медицинской аппаратуры. Однако на современном этапе все большее количество методов исследования ориентировано на использование компьютерной техники в целях проведения математического анализа получаемых данных.

Другой уровень формирования медицинского заключения строится на возможности врача сформировать некоторое словесное описание состояния организма. Это так называемая вербальная форма, характеризующая состояние биологической системы. Существуют специальные методы, которые такое описание также переводят в форму цифровой записи. Это намного упрощает процесс построения результирующего диагностического правила.

С точки зрения системного подхода, в медицинской практике два уровня представления медицинского решения о состоянии организма чрезвычайно важны. Именно объединение этих диагностических уровней после соответствующего анализа данных позволяет построить адекватное представление о текущем состоянии живого организма.

Медицинская диагностика — это своего рода классификационная задача. В простейшем случае рассматривается вопрос о нормальном состоянии организма или об имеющемся отклонении от нормы. По современным медицинским представлениям понятие “нормы” или “не нормы” формируются на основе большого количества реальных фактов. Это так называемый статистический показатель, который в отдельных случаях может значительно изменяться. В связи с этим возникает проблема описания промежуточных состояний организма между этими крайними категориями, которые с учетом индивидуальных особенностей организма могут быть использованы при формировании диагностического заключения.

Именно этот аргумент является главным при стремлении медицинского персонала активнее использовать средства вычислительной техники.

Персональный компьютер и соответствующие математические пакеты программ анализа данных позволяют не только повысить эффективность поиска и построения диагностического решения, но и создают необходимые условия для понимания мельчайших деталей возникновения нарушения в организме.

Таким образом, представить исходные данные медицинского обследования в форме удобной для дальнейшего анализа с помощью компьютера сегодня не представляется сложной задачей. Практически любой материал, полученный при обследовании, может быть представлен в цифровом виде. Вопрос о форме отображения — в виде графика, фрейма или цифровой последовательности — решается отдельно, с учетом требований специалистов.

Анализ данных обследования неразрывно связан со временем. Время и информационные параметры, характеризующие функциональное состояние биологической системы, имеют неразрывную связь. Каждый информационный параметр имеет определенную значимость при формировании диагностического решения. Ранг — значимость параметра для диагностики состояния проявляется в определенное время, в течение некоторого периода обследования. Известно, что на относительно коротком интервале наблюдения некоторые информационные показатели состояния организма не могут быть замечены. Напротив при длительном наблюдении происходит накопление избыточной информации, в которой информационный параметр представляется в скрытой форме.

Прежде чем приступить к диагностической процедуре требуется найти информационные параметры изучаемого процесса. Отыскание информационных параметров происходит с использованием некоторой априорной информации, основу которой составляют анатомические, биофизические и биохимические данные, различные модели поведения изучаемой системы или процесса. На всем этом многоплановом поле возможных представлений о поведении системы необходимо построить свою модель выбора информационных параметров, указать момент времени, когда такие параметры становятся значимыми и могут быть обнаружены. Это достаточно сложная задача.

Обычно такую задачу начинают решать последовательно, этап за этапом. Вначале определяют продолжительность регистрации исследуемого процесса, изучение и анализ которого позволят в будущем построить диагностическое решение о состоянии живого организма. Одновременно с этим определяются требования к точности регистрируемого сигнала и форма — вид его представления исследователю. После того как эти проблемы оказываются решенными, приступают к построению алгоритма отыскания информационных параметров в зарегистрированном массиве данных.

В большинстве случаев на практике одиночное (разовое) исследование биологической системы позволяет сформировать так называемую выборку. Количество выборок, которое позволяет уверенно проводить построение диагностического решения, различно для каждого вида медицинского исследования.

Надо отметить, что формирование выборки происходит в течение некоторого промежутка времени. Каждое значение выборки оказывается элементом некоторой временной последовательности, которая, как утверждалось выше, формируется по заранее установленному правилу. Так например, временная последовательность амплитудных значений сигнала при кардиологическом исследовании образует исходную выборку. Это так называемый двухмерный массив данных. При радиоизотопном исследовании формируется сцинтиграфическое изображение, структура которого представляется временной последовательностью значений регистрируемого сигнала, но в трехмерном пространстве. Специфичность временного формирования исходной выборки должна приниматься во внимание при отыскании информационных параметров.

В процедуре формирования исходной выборки важно выделить элемент связи появления отдельного значения регистрируемого сигнала с текущим временем. Понятно, что произвольное изменение расположения во времени текущих значений выборки недопустимо, потому что может изменить наше представление о характере процессов, протекающих в системе. Поэтому независимо от методов последующего анализа данных структура выборки должна оставаться неизменной.

Поиск информационных параметров на выборке проводят с использованием различных математических методов. Несмотря на широкую возможность выбора методов отыскания информационных параметров все они должны удовлетворять определенным условиям. Например, позволять исследовать случайные, непериодические или условно периодические сигналы.

Действительно, жизнедеятельность организма подтверждается наличием большого числа информационных показателей, которые непрерывно изменяются в определенных допустимых пределах. Это соответствует нашим представлениям о гомеостазисе. Поддержание своих существенных параметров в строго определенных пределах изменения характерно для биологических систем. Однако надо помнить, что область допустимых значений для каждого параметра может отражать как индивидуальные, так и возрастные особенности организма. Кроме этого, область допустимых значений того или другого параметра может существенно меняться от географических координат местности, времени суток, и, наконец, образа жизни. Принимая это во внимание, на практике оказывается трудной задачей сформировать набор очень похожих выборок. Другими словами, приступая к формированию некоторого однородного класса, например, выборок, характеризующих нормальное состояние организма, трудно получить устойчивые однотипные оценки. Эта трудная, но интересная задача привлекает многих исследователей.

В этой области существует немало перспективных направлений. Одним из таких направлений является метод структурного координатного анализа (СКА). В основу метода положены следующие постулаты:

 

  1. Исходная выборка — последовательность значений исследуемого сигнала, представленная по заранее определенному правилу временных событий, происходящих в изучаемой системе.

 

  1. Размерность выборки — количество элементарных событий, представленных соответствующими значениями сигнала, характеризует полный пространственно-временной континуум возможных изменений, происходящих в системе.

 

  1. Информационные параметры, характеризующие состояние системы, могут быть найдены посредством соответствующего алгоритма, устанавливающего функциональную связь между отдельными фрагментами исходной выборки.

 

  1. Размер фрагментов, оцениваемый по количеству элементов, и их местоположение в текущей выборке может меняться, но количество фрагментов сохраняется постоянным для однородного класса изучаемых событий.

 

  1. Исходная выборка может быть эквивалентным образом представлена набором фрагментов разного размера, не искажающих информационное содержание изучаемого процесса.

Такую процедуру отыскания информационных параметров, а вслед за этим и построение диагностического решения, можно проиллюстрировать схемой, представленной на рис. 3.1.

На этапе СКА осуществляются процедуры:

 

  • поиск информативных параметров в исходной выборке;

 

  • поиск временных интервалов, содержащих информативные параметры;

 

  • формирование фрагментов выборки.

На этапе формирования оценки — диагностического правила, осуществляются процедуры:

 

  • построение функциональной зависимости фрагментов выборки;

 

  • формирование диагностического решения о функциональном состоянии системы.

Таким образом, метод СКА позволяет сократить размерность исходной выборки посредством создания фрагментарного описания. С другой стороны, набор фрагментов, объединенных некоторым общим функциональным описанием, может представлять объект для дальнейшего дробления. Как будет описано ниже, это представляется исключительно полезным при использовании фрактальных методов анализа данных.

Поиск фрагментов выборки осуществляется на некоторой последовательности значений исходного сигнала. В свою очередь, временная последовательность значений изучаемого сигнала характеризуется некоторой формой представления, которая отражает состояние изучаемой системы. Взаимная связь формы сигнала и состояния системы представляется чрезвычайно важной при построении диагностического решения. При изучении различных процессов, протекающих внутри биологического организма, приходится иметь дело с сигналами очень сложной формы.

В таком понимании выборка может быть охарактеризована динамическим образом, отражающим поведение биологической системы на ограниченном интервале времени. Для того чтобы не потерять элементы такого образа при анализе поведения системы, требуется знать правило формирования последовательности исходных значений выборки. Это трудная задача, которая носит название “проблемы Гильберта”.

В математическом отношении формулировка этой проблемы имеет свою историю. В 1900 г. немецкий математик Давид Гильберт в своем докладе на Международном конгрессе математиков в Париже сформулировал 23 нерешенные задачи, которые он считал наиболее важными в математике того времени. Эти задачи получили название “проблемы Гильберта” и оказали огромное влияние на развитие всей математики 20 в. До сих пор не все проблемы Гильберта полностью решены, а многие из них побудили ученых к созданию совершенно новых теорий. Как выяснилось в последние годы, теория нейронных сетей также связана с одной из этих проблем, а именно с тринадцатой.

Тринадцатая проблема Гильберта формулируется так: “... Верно ли, что существует непрерывная функция от трех переменных, которая не может быть представлена в виде композиции непрерывных функций от двух переменных?”

Под композицией функций понимается подстановка одной функции в качестве аргумента другой. Например, функция трех переменных F (x, y, z) = xz + yz может быть представлена в виде композиции функций двух переменных:

F (x, y, z) = S (M (x, z), M (y, z)),
(*)

где M (x, z) = xz, а S (a, b) = a + b.

Как нам сегодня известно, тринадцатая проблема Гильберта была решена в 1957 г. студентом мехмата МГУ, а ныне академиком Владимиром Игоревичем Арнольдом. Он показал, что любая непрерывная функция трех переменных представляется в виде композиции непрерывных функций двух переменных. Таким образом, гипотеза Гильберта была опровергнута.

В том же 1957 г. математик Андрей Николаевич Колмогоров доказал гораздо более сильную теорему.

Теорема Колмогорова: Любая непрерывная функция от n переменных F (x 1, x 2,..., xn) может быть представлена в виде

,
(**)

где gj и hij — непрерывные функции, причем hij не зависят от функции F.

Эта теорема означает, что для реализации функций многих переменных достаточно операций суммирования и композиции функций одной переменной. Удивительно, что в этом представлении лишь функции gj зависят от представляемой функции F, а функции hij универсальны.

Заметим, что формула (**) очень похожа на формулу (*). Если перевести эту теорему на язык нейронной сети, то она будет звучать так.

Если известны функции hij, то любую непрерывную функцию от n переменных можно точно реализовать с помощью простой нейросети на основе трехслойного персептрона. Для этого достаточно подобрать 2 n +1 передаточных функций gj нейронов скрытого слоя.

Эта сеть не будет персептроном в строгом смысле, так как на входах второго слоя к сигналам необходимо применить функции hij, а не просто умножить их на веса.

К сожалению, при всей своей математической красоте теорема Колмогорова малоприменима на практике. Это связано с тем, что функции hij — негладкие и трудно вычислимые; также неясно, каким образом можно подбирать функции gj для данной функции F. Роль этой теоремы состоит в том, что она показала принципиальную возможность реализации сколь угодно сложных зависимостей с помощью относительно простых автоматов типа нейронных сетей.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: