ВЫДЕЛЕНИЕ ИНФОРМАТИВНЫХ ХАРАКТЕРИСТИК БИОЛОГИЧЕСКОГО ОБЪЕКТА ИЗ РЕГИСТРИРУЕМОГО СИГНАЛА

Артеменко М.В. 1 Сотникова А.Д. 1

1 ФГБОУ ВО Юго-западный государственный университет

В работе рассматриваются перспективные методы формирования множества прямых и латентных информативных характеристик при анализе регистрируемых сигналов о состоянии биологического объекта в процессе мониторинга, представленных в виде временных трендов или таблиц «признак - значение». Предлагается применять: концепции системного анализа и самоорганизационного моделирования, анализ матрицы иерархий, синхронное математическое моделирование упреждающих и прогнозируемых значений сигнала от биологического объекта. В качестве способов формирования множества информативных характеристик биообъекта рассматривается: методика определения весовых коэффициентов информативных характеристик при вычислении латентных показателей, интегрально отражающих расстояния до центра определенного исследователем базового класса нормированных по дисперсии и основанная на вычислении критерия Стьюдента; специфический способ формирования матрицы предпочтительности; применение нелинейной дискриминантной функции, идентифицируемой на основе полинома Колмогорова-Габора и метода группового учета аргументов (МГУА) и анализа рангов; критерий относительной погрешности отличий; критерий качества классификации в гипер-пространстве; применение опорных импульсов. Исследования в предлагаемых направлениях представляются перспективными для решения задач классификации или диагностики состояния анализируемого биообъекта.

Статья в формате PDF

0 KB

биологический объект

информативные характеристики

матрица предпочтительности

самоорганизационное моделирование

анализ сигнала

1. Авдеева Д. К., Вылегжанин О. Н., Рыбалка С. А. Метод выделения полезного сигнала при помехе//Успехи современного естествознания. – 2010. -№1. – С. 132-135.

2. Артёменко Н.М. Распознавание состояний легких человека по издаваемому ими акустическому шуму // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2015. № 2 (15). стр. 94-98.

3. Артеменко М.В., Бабков А.С. Классификация методов прогнозирования поведения систем // Современные проблемы науки и образования. – 2013. – № 6.;URL: http://www.science-education.ru/ru/article/view?id=11527 (дата обращения: 10.12.2016)

4. Артеменко М.В., Добровольский И.И., Мишустин В.Н. Информационно-аналитическая поддержка автоматизированной классификации на основе прямых и обратных решающих правил на примере прогноза тромбоэмболии. // Современные наукоемкие технологии. – 2015. №12 (часть 2). – стр.199-205.

5. Артеменко М.В., Калугина Н.М. Диагностический анализ состояния биообъекта по хронометрическим параметрам регистрируемых сигналов. //Международный научно-исследовательский журнал. 2016. № 4-2 (46). стр. 30-35.

6. Артеменко М. В., Калугина Н. М., Шуткин A. Н. Формирование множества информативных показателей на основании аппроксимирующего полинома Колмогорова–Габора и максимального градиента функциональных различий // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение, 2016, №1, стр. 116-223

7. Артеменко М.В., Подвальный Е.С., Старцев Е.А. Метод комплексной оценки и выборка состава информативных признаков в задачах оценки состояния биотехнических систем //Биомедицинская радиоэлектроника, 2016, №9, стр.38-44

8. Калугина Н. М. Система диагностики состояния организма по спектральным характеристикам биомедицинского сигнала. //Лучшая статья 2016: сборник статей III Международного научно-практического конкурса / Под общ. ред. Г. Ю. Гуляева – Пенза: МЦНС «Наука и Просвещение». – 2016. – 200 с.

9. Кобринский В.А Телемедицина в системе практического здравоохранения. -М.: Директ-Медиа, 2016. – 238 с.

10. Лбов Г.С., Старцева Н.Г. Логические решающие функции и вопрос статистической устойчивости решений Новосибирск: Изд-во Ин-та математики, 1999. 212 с.

11. Орлов А.А. Принципы построения архитектуры программной платформы для реализации алгоритмов метода группового учета аргументов / А.А. Орлов // Управляющие системы и машины.-2013. - №2. -стр.65-71

12. Превентивная медицина: Опыт работы информационного полипараметрического комплекса / Под ред. Н.В. Дмитриевой. –М.: Книжный дом «ЛИБРОКОМ», 2010. – 248 с.

13. Саати Томас Л. Принятие решений при зависимостях и обратных связях: аналитические сети. Пер. с англ./Науч. ред. А.В. Андрейсиков, О.Н. Андрейчикова. Изд. 4-е. – М.: ЛЕНАНД, 2015. – 360 с.

14. Сотникова А. А., Писарев М. В., Калугина Н.М. Выделение информативных признаков //Медико-экологические информационные технологии – 2016: сборник научных статей по материалам XIX Международной научно-технической конференции / редкол.: Н. А. Кореневский [и др.]; Юго-Зап. гос. ун-т. – Курск, 2016. – 308 с.

15. Способ измерения сигналов произвольной формы в присутствии случайных шумов/Д.К. Авдеева. Пат. 2133474 РФ, МКИ 19/02. Заявл. 30.10.97; Опубл. 20.07.99, Бюл. №20.

16. Справочник по типовым программам моделирования / А.Г. Ивахненко, Ю.В. Коппа, В.С. Степашко и др.; под ред. Ивахненко А.Г. – К.: Техника,1980.- 184 с.

17. Цифровая обработка сигналов и изображений в радиофизических приложениях. / Под ред. В. Ф. Кравченко, - M.:ФИЗМАТЛИТ, 2007. -544 с.

18. Р. Хэгглин. Дифференциальная диагностика внутренних болезней –М.: Триада – Х, 2015, -800 с.

19. Artemenko M.V., Kalugina N.M., Dobrovolsky I.I. The formation of a set of informative features based on the functional relationships between the data structure field odservations // European Journal of Natural History. 2016. № 6. С. 43-48.

20. Differential Diagnosis: Methodological Instructions for Students // URLL: http://zavantag.com/docs/index-16795051.html?page=13 (дата вхождения – 20.12.2016)

Актуальной проблемой проектирования систем поддержки принятия классификационных решений соотнесения состояния биологического объекта к определенной страте (классу) является задача выделения маломощного сигнала на фоне большой зашумленности и характеристик с приемлемым уровнем адекватности значений диагностирующих состояние. Это касается и сложности выделения маломощных сигналов из шумов и формирования информативных множеств, достоверно характеризующих биообъект. С целью повышения эффективности диагностики заболеваний на ранних стадиях и улучшения качества медицинского обслуживания населения в целом.

Одним из наиболее распространенным подходом к построению классификационных систем является распознавание образов, начальным этапом которого является формирование множества информативных характеристик, характеризующих альтернативные классы. В дальнейшем, при построении систем дифференциальной диагностики (например, в медицине [18, 20]), что характерно для иерархических деревьев принятия решений, достаточно на каждом этапе бинарного дерева осуществить соотнесение объекта к одному из альтернативных классов w0 и w1.

Для выбора множества характеристик, обладающих необходимой степенью классификационных возможностей, предлагается следующая методика. Пусть задано некоторое исходное множество характеристик {Pr} g , где g – исходное количество, g?0. Требуется сформировать множество характеристик {Prо}gо , 1≤go≤g, обладающее наибольшими классификационными возможностями. Из разницы между множествами {Pr}g и {Prоэ}gоэ возникает задача отбора характеристик, обладающих наибольшими классификационными возможностями, апробированными, статистически доказуемыми, формализованными методами.

Для этого необходимо иметь по каждому из альтернативных классов некоторые множества численных данных. Речь идет, в данном случае, о разведочном анализе и априорной принадлежности к нормальному закону распределения (в этом случае приемлемые результаты могут быть получены на выборках малого объема).

Наряду с регистрируемыми характеристиками (множеством {Х}) для повышения качества классификации предлагается формировать дополнительное множество интегральных (множество {Y}), расчет элементов которого проводится по формуле (1).

artemenko2_f1.eps (1),

Yk - интегральная характеристика, k - индекс интегральной характеристики, artemenko2_f2.eps - соответственно, модальное значение (в случае нормального распределения совпадает с математическим ожиданием и средним значениями) и средне-квадратичное отклонение (СКО) , полученное на обучающей выборке для некоторого класса «базовый», artemenko2_f3.eps - весовые коэффициенты, определяющие информационный вклад характеристики xi в формирование интегральной Yk.

Весовые коэффициенты artemenko2_f3.eps в указанной формуле предлагается определять следующими способами:

1. Путем назначения экспертами, исходя из личного опыта и анализа информационных источников.

2. Автоматически – на основе применения определенного статистически обоснованного математического аппарата.

3. Смешанным способом.

Во всех трех способах необходимо иметь единые шкалы измерений и ограничений. Принимаем ограничения:

artemenko2_f4.eps (2),

где n – количество частных показателей множества {Х}, k – номер интегральной характеристики Y (k≥0).

Предлагается следующая методика определения рассматриваемых весовых коэффициентов αi,k информативности (действительна только при наличии двух альтернативных классов):

1. Регистрируются для каждого альтернативного класса значения элементов множеств artemenko2_f5.eps (где n – количество характеристик).

2. По значениям коэффициента Стьюдента на заданном уровне значимости (ошибки первого рода) осуществляется селекция с предположительно незначительными классификационными возможностями. В результате селекции для дальнейшего формирования информативного признакового пространства используется множество artemenko2_f6.eps , где mx – количество характеристик, оставшихся после селекции.

3. По каждому показателю (признаку) artemenko2_f6.eps вычисляются коэффициенты Стьюдента различий между двумя альтернативными классами – формируется множество artemenko2_f7.eps , элементами которого ( artemenko2_f8.eps ) являются значения коэффициентов Стьюдента.

4. Элементы полученного множества artemenko2_f7.eps ранжируются (по убыванию или возрастанию). Строится диаграмма значений полученного ряда, по которой исследователь определяет необходимое количество (my ,my≤mx) и «состав» интегральных характерестик путем выделения кластеров близких (по некоторой мере исследователя) значений ранжированных коэффициентов Стьюдента.

5. Каждому кластеру k (k=1,…,my) ставится в соответствие определенная интегральная характеристика Yk и соответствующее подмножество artemenko2_f6.eps . Формула (2) модифицируется в формулу:

artemenko2_f9.eps (3).

6. Для каждой интегральной характеристики Yk с учетом вычисленных в п.2 значений коэффициентов Стьюдента и выделенных в п.3 кластеров определяются значения соответствующих весовых коэффициентов в (3) по формуле:

artemenko2_f10.eps (4).

Полученные величины весовых коэффициентов позволяют в дальнейшем формировать значения множества {Y}.

Таким образом, множество информативных характеристик {Pr}g для решения задачи обучения системы классификации (диагностики) формируется по формуле:

artemenko2_f11.eps (5),

где artemenko2_f12.eps - соответственно: множество отобранных характеристик по изложенной выше методике, множество отобранных интегральных характеристик, множество отобранных экспертом характеристик, - элементами всех множеств являются «идентификаторы».

Для формирования информативного множества и принятия решении о включении в него признака так же рекомендуется использовать методологию принятия решений Саати Т.Л. [13]

Формируется матрица предпочтительности W, элементы которой для показателей i и j различаются по 9 степеням (признак i предпочтительнее j): wi,j=1 - равная степень предпочтительности, wi,j=2 - слабая wi,j=3 - средняя, wi,j=4 - предпочтение выше среднего, wi,j=5 - умеренно сильное, wi,j=6 - сильное, wi,j=7 - очень сильное (очевидное), wi,j=8 - очень, очень сильное (абсолютное), wi,j=9 – абсолютное.

Анализ матрицы позволяет после преобразования группировать признаки по кластерам предпочтительности с помощью предлагаемого IJ-преобразования. Строки I меняются местами со строками J до тех пор, пока сумма произведений значений элемента матрицы W* на расстояние этого элемента до главной диагонали не станет минимальной (формула (6)). Таким образом, вокруг главной диагонали модифицированной матрицы предпочтений W* сгруппируются элементы с максимальными значениями.

artemenko2_f13.eps (6)

artemenko2_f14.eps

где N– количество анализируемых признаков до селекции.

Упорядочивание признаков по убыванию рангов информативности позволит определить степень предпочтения.

Целесообразно полагать, что для минимизации ошибки и принятия ложных решений из уже сформированного множества следует выделить ряд наиболее информативных характеристик, которые бы наиболее достоверно охарактеризовали исследуемый биологический объект.

Например, информативность отдельной характеристики из множества {Х} в работах [6, 7, 19] предлагается определять следующими методами [15].

Первый метод основан на нелинейной дискриминантной функции, определённой для классов (подразумевается бинарное иерархическое дерево решений). Он подразумевает:

– задание функции отклика для каждого класса w0 и w1;

– структурно-параметрическую идентификацию полинома Габора, с помощью алгоритма МГУА [6, 11];

– вычисление мультипликанта для каждого аргумента;

– определение аддиативно-мультипликативного влияния показателя xi на функцию отклика;

– введение «относительной погрешности отличий» (ОПО) (рекомендуется 0,01≤ε<0,1) и пересчёт значений величины мультипликативного влияния с учётом ОПО;

– упорядочивание xi по мере убывания в диапазоне, заданным ОПО;

– формирование кортежей признаков для классов: artemenko2_f15.eps и artemenko2_f16.eps ;

– формирование множества рангов artemenko2_f17.eps и artemenko2_f18.eps по кортежам;

– формирование итогового множества информативных признаков;

– вычисление информативности признака Inf(xj) по формуле:

artemenko2_f19.eps (7)

где artemenko2_f20.eps – значение ранга показателя xi в w0 и w1, соответственно.

Во втором методе формирование множества информативных характеристик и вычисление значения Inf(xj), основывается на предварительной идентификации аппроксимирующего полинома Габора для каждой характеристики из начального множества {X}. В этом случае, процедура идентификации повторяется N раз для каждого класса w0 и w1, последовательно формируя множества {Z}={Х}–xj и отклики Y(Z)=xj.

В результате формируются множества аппроксимантов для каждого класса. Аппроксиманты, значения коэффициента детерминации которых меньше определенного порогового значения, не учитываются. Минимальный объем множества аппроксимантов устанавливается исследователем - рекомендуется не менее 3.

Для каждого альтернативного класса формируются матрицы значений artemenko2_f21.eps , по которым строятся векторы значений artemenko2_f22.eps и artemenko2_f23.eps .

Кортежи показателей artemenko2_f15.eps и artemenko2_f16.eps формируются для каждого класса по мере убывания xi по вектору значений с учётом ОПО.

Далее вычисление информативности осуществляется аналогично действиям, рассмотренным в способе 1.

В третьем методе переменные принимают значения «true» («1») либо «false» (0). С определенной точностью для возможности применения подходов, изложенных в способе 1 и 2, используют аналог полинома Габора Yв*(Zв*) для логических функций в виде формулы (8), на основании аналогов арифметических операций логическим функциям [10].

artemenko2_f24.eps ,(8)

Далее расчеты аналогичны 1 и 2 методам.

В четвёртом методе осуществляется упорядочивание характеристик с последующим вычислением рангов, включением в информативный кортеж и вычислением информативности аналогично ранее рассмотренными способами на основании гипер- объемов H. При этом проводятся процедуры разведочной кластеризации с вычислением величины изменения качества кластеризации dHxj при исключении из рассмотрения анализируемой характеристики [12].

dHxj может принимать как положительные, так и отрицательные значения. В последнем случае после селекции наблюдается ухудшение качества классификации согласно общему гипер-объему пространства анализируемых показателей H.

Описанные методы применимы при априорно известном множестве характеристик. Однако на практике, например при исследовании биообъекта [2], часто необходимо определять информативность характеристики в текущий момент времени.

В случае, если биологический объект характеризуется некоторым сигналом небольшим объемом в работе [14] предлагается применить следующий подход.

В анализе сигнала используется фильтр, основанный на различии фаз измеряемого сигнала (регулярная функция) и шума (случайная функция, причём математическое ожидание шума принимается равным нулю).

Опорный импульс, применяемый в фильтре, имеет две прямоугольные ступени с различными амплитудами, общая длительность ступеней значительно меньше интервала наблюдения Тн.

При проведении измерений фрагмент искомого сигнала помещается на вторую ступень опорного импульса. В качестве измеряемой характеристики вычисляется фаза основной гармоники e–jwt при w=1. Для оценки величины сигнала используется разность фаз опорного импульса с сигналом и без него.

При значениях D и M (M=TH/TИ, а D=U2/ U1), близких к единице, увеличивается чувствительность фазы к изменению напряжения (амплитуды ступени).

При этом зависимость фазы от D и М имеет вид [1, 15]:

artemenko2_f25.eps (9)

artemenko2_80.tif

Рис. 1. Зависимость значения фазы основной гармоники опорного сигнала от отношения амплитуд первой и второй ступеней

Для повышения информативности результатов следует обеспечивать попадание фазы опорного импульса и фазы импульса с изменённым фрагментом сигнала на квазилинейный участок графика зависимости от параметра φ(D) (точки на кривой рис. 1). Для этого первую ступень опорного импульса следует принять равной 1, затем вычислить значение D (начальная фазы основной гармоники (w=1) попадёт на нижний конец квазилинейного участка кривой φ(D)).

artemenko2_f26.eps (10)

После формирования данным образом опорного импульса вычисляется среднее значение измеряемого фрагмента сигнала, которое может быть оценено через разность фаз основной гармоники опорного импульса с сигналом и без него [1].

Затем этот фрагмент умножается на коэффициент:

artemenko2_f27.eps , (11)

где x - среднее значение фрагмента «сигнал + шум».

Восстановление сложных сигналов проводят путём оценки средних значений отдельных их фрагментов. Для этого исходный сигнал формируется в виде импульса с колоколовидной огибающей, к нему добавляется шум в виде последовательности случайных нормально распределённых чисел. Зашумлённый сигнал разбивается на фрагменты, для каждого такого фрагмента описанным выше способом оценивается среднее значение сигнала [15].

В результате из некогерентного шума формируется информативный сигнал, по которому можно вести дальнейший анализ [9].

Для вычисления значения информативных параметров снятого сигнала [5,17], предлагается использовать функциональные параметры, характеризующие поведение системы, способной принимать решение в текущий момент времени в соответствии с учетом прошлого опыта и прогнозирования будущего [3, 4].

Целесообразное полагать, что биологическая система должна принимать решения в момент времени t, при регистрации значения информативного сигнала y(t). Так как автономная система управления организмом систематически учитывает лучший результат «прошлого» опыта и автоматически прогнозирует развитие ситуации в будущем, то сигнал y(t) может быть представлен в виде [8]:

artemenko2_f28.eps , (12)

где: φt±i(t±i) – частный аргумент-функционал, отражающий состояние анализируемой системы в моменты времени (t±i); τ1 и τ2 – максимальное время упреждения и экстраполяции (прогноза), соответственно; T1 и T2 формирующий индекс частных аргумент-функционалов, F() интегральный «опытно-прогностический функционал» – FPF(t)).

В первом приближении частные спектральные аргумент-функционалы представляются линейными преобразованиями:

artemenko2_f29.eps . (13)

Множество значений информативных хронометрических параметров в момент времени t+1, формируется «Модулем «фантазий», который содержит правила идентификации artemenko2_f30.eps по artemenko2_f31.eps и рассогласования между прогнозируемым состоянием St+1 и реально регистрируемым artemenko2_f32.eps . Обучение заканчивается, когда указанное рассогласование достигнет приемлемого порога величины [8] (задается в общем случае нижней и верхними границами).

Выводы

Рассмотренные подходы позволяют формализовать выделение множеств информативных прямых и латентных характеристик биологического объекта путём анализа сигналов различных уровней мощности на основе применения как упреждающих, так и прогнозируемых значений сигнала. Анализ осуществляется с помощью применения самоорганизационной концепции моделирования, дифференцированного анализа и метода анализа иерархий. Исследования в этом направлении представляются новыми и перспективными для решения задачи диагностики состояния анализируемого биообъекта.

Библиографическая ссылка

Артеменко М.В., Сотникова А.Д. ВЫДЕЛЕНИЕ ИНФОРМАТИВНЫХ ХАРАКТЕРИСТИК БИОЛОГИЧЕСКОГО ОБЪЕКТА ИЗ РЕГИСТРИРУЕМОГО СИГНАЛА // Научное обозрение. Биологические науки. 2017. № 1. С. 31-35;
URL: https://science-biology.ru/ru/article/view?id=1032 (дата обращения: 21.08.2025).

Научный журнал
Научное обозрение. Биологические науки

ISSN 2500-3399

ПИ №ФС77-57454

Библиографическая ссылка

Научное обозрение. Биологические науки
Научный журнал | ISSN 2500-3399 | ПИ №ФС77-57454