Научный журнал
Научное обозрение. Биологические науки
ISSN 2500-3399
ПИ №ФС77-57454

ВЫДЕЛЕНИЕ ИНФОРМАТИВНЫХ ХАРАКТЕРИСТИК БИОЛОГИЧЕСКОГО ОБЪЕКТА ИЗ РЕГИСТРИРУЕМОГО СИГНАЛА

Артеменко М.В. 1 Сотникова А.Д. 1
1 ФГБОУ ВО Юго-западный государственный университет
В работе рассматриваются перспективные методы формирования множества прямых и латентных информативных характеристик при анализе регистрируемых сигналов о состоянии биологического объекта в процессе мониторинга, представленных в виде временных трендов или таблиц «признак - значение». Предлагается применять: концепции системного анализа и самоорганизационного моделирования, анализ матрицы иерархий, синхронное математическое моделирование упреждающих и прогнозируемых значений сигнала от биологического объекта. В качестве способов формирования множества информативных характеристик биообъекта рассматривается: методика определения весовых коэффициентов информативных характеристик при вычислении латентных показателей, интегрально отражающих расстояния до центра определенного исследователем базового класса нормированных по дисперсии и основанная на вычислении критерия Стьюдента; специфический способ формирования матрицы предпочтительности; применение нелинейной дискриминантной функции, идентифицируемой на основе полинома Колмогорова-Габора и метода группового учета аргументов (МГУА) и анализа рангов; критерий относительной погрешности отличий; критерий качества классификации в гипер-пространстве; применение опорных импульсов. Исследования в предлагаемых направлениях представляются перспективными для решения задач классификации или диагностики состояния анализируемого биообъекта.
биологический объект
информативные характеристики
матрица предпочтительности
самоорганизационное моделирование
анализ сигнала
1. Авдеева Д. К., Вылегжанин О. Н., Рыбалка С. А. Метод выделения полезного сигнала при помехе//Успехи современного естествознания. – 2010. -№1. – С. 132-135.
2. Артёменко Н.М. Распознавание состояний легких человека по издаваемому ими акустическому шуму // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2015. № 2 (15). стр. 94-98.
3. Артеменко М.В., Бабков А.С. Классификация методов прогнозирования поведения систем // Современные проблемы науки и образования. – 2013. – № 6.;URL: http://www.science-education.ru/ru/article/view?id=11527 (дата обращения: 10.12.2016)
4. Артеменко М.В., Добровольский И.И., Мишустин В.Н. Информационно-аналитическая поддержка автоматизированной классификации на основе прямых и обратных решающих правил на примере прогноза тромбоэмболии. // Современные наукоемкие технологии. – 2015. №12 (часть 2). – стр.199-205.
5. Артеменко М.В., Калугина Н.М. Диагностический анализ состояния биообъекта по хронометрическим параметрам регистрируемых сигналов. //Международный научно-исследовательский журнал. 2016. № 4-2 (46). стр. 30-35.
6. Артеменко М. В., Калугина Н. М., Шуткин A. Н. Формирование множества информативных показателей на основании аппроксимирующего полинома Колмогорова–Габора и максимального градиента функциональных различий // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение, 2016, №1, стр. 116-223
7. Артеменко М.В., Подвальный Е.С., Старцев Е.А. Метод комплексной оценки и выборка состава информативных признаков в задачах оценки состояния биотехнических систем //Биомедицинская радиоэлектроника, 2016, №9, стр.38-44
8. Калугина Н. М. Система диагностики состояния организма по спектральным характеристикам биомедицинского сигнала. //Лучшая статья 2016: сборник статей III Международного научно-практического конкурса / Под общ. ред. Г. Ю. Гуляева – Пенза: МЦНС «Наука и Просвещение». – 2016. – 200 с.
9. Кобринский В.А Телемедицина в системе практического здравоохранения. -М.: Директ-Медиа, 2016. – 238 с.
10. Лбов Г.С., Старцева Н.Г. Логические решающие функции и вопрос статистической устойчивости решений Новосибирск: Изд-во Ин-та математики, 1999. 212 с.
11. Орлов А.А. Принципы построения архитектуры программной платформы для реализации алгоритмов метода группового учета аргументов / А.А. Орлов // Управляющие системы и машины.-2013. - №2. -стр.65-71
12. Превентивная медицина: Опыт работы информационного полипараметрического комплекса / Под ред. Н.В. Дмитриевой. –М.: Книжный дом «ЛИБРОКОМ», 2010. – 248 с.
13. Саати Томас Л. Принятие решений при зависимостях и обратных связях: аналитические сети. Пер. с англ./Науч. ред. А.В. Андрейсиков, О.Н. Андрейчикова. Изд. 4-е. – М.: ЛЕНАНД, 2015. – 360 с.
14. Сотникова А. А., Писарев М. В., Калугина Н.М. Выделение информативных признаков //Медико-экологические информационные технологии – 2016: сборник научных статей по материалам XIX Международной научно-технической конференции / редкол.: Н. А. Кореневский [и др.]; Юго-Зап. гос. ун-т. – Курск, 2016. – 308 с.
15. Способ измерения сигналов произвольной формы в присутствии случайных шумов/Д.К. Авдеева. Пат. 2133474 РФ, МКИ 19/02. Заявл. 30.10.97; Опубл. 20.07.99, Бюл. №20.
16. Справочник по типовым программам моделирования / А.Г. Ивахненко, Ю.В. Коппа, В.С. Степашко и др.; под ред. Ивахненко А.Г. – К.: Техника,1980.- 184 с.
17. Цифровая обработка сигналов и изображений в радиофизических приложениях. / Под ред. В. Ф. Кравченко, - M.:ФИЗМАТЛИТ, 2007. -544 с.
18. Р. Хэгглин. Дифференциальная диагностика внутренних болезней –М.: Триада – Х, 2015, -800 с.
19. Artemenko M.V., Kalugina N.M., Dobrovolsky I.I. The formation of a set of informative features based on the functional relationships between the data structure field odservations // European Journal of Natural History. 2016. № 6. С. 43-48.
20. Differential Diagnosis: Methodological Instructions for Students // URLL: http://zavantag.com/docs/index-16795051.html?page=13 (дата вхождения – 20.12.2016)

Актуальной проблемой проектирования систем поддержки принятия классификационных решений соотнесения состояния биологического объекта к определенной страте (классу) является задача выделения маломощного сигнала на фоне большой зашумленности и характеристик с приемлемым уровнем адекватности значений диагностирующих состояние. Это касается и сложности выделения маломощных сигналов из шумов и формирования информативных множеств, достоверно характеризующих биообъект. С целью повышения эффективности диагностики заболеваний на ранних стадиях и улучшения качества медицинского обслуживания населения в целом.

Одним из наиболее распространенным подходом к построению классификационных систем является распознавание образов, начальным этапом которого является формирование множества информативных характеристик, характеризующих альтернативные классы. В дальнейшем, при построении систем дифференциальной диагностики (например, в медицине [18, 20]), что характерно для иерархических деревьев принятия решений, достаточно на каждом этапе бинарного дерева осуществить соотнесение объекта к одному из альтернативных классов w0 и w1.

Для выбора множества характеристик, обладающих необходимой степенью классификационных возможностей, предлагается следующая методика. Пусть задано некоторое исходное множество характеристик {Pr} g , где g – исходное количество, g?0. Требуется сформировать множество характеристик {Prо}gо , 1≤go≤g, обладающее наибольшими классификационными возможностями. Из разницы между множествами {Pr}g и {Prоэ}gоэ возникает задача отбора характеристик, обладающих наибольшими классификационными возможностями, апробированными, статистически доказуемыми, формализованными методами.

Для этого необходимо иметь по каждому из альтернативных классов некоторые множества численных данных. Речь идет, в данном случае, о разведочном анализе и априорной принадлежности к нормальному закону распределения (в этом случае приемлемые результаты могут быть получены на выборках малого объема).

Наряду с регистрируемыми характеристиками (множеством {Х}) для повышения качества классификации предлагается формировать дополнительное множество интегральных (множество {Y}), расчет элементов которого проводится по формуле (1).

artemenko2_f1.eps (1),

Yk - интегральная характеристика, k - индекс интегральной характеристики, artemenko2_f2.eps - соответственно, модальное значение (в случае нормального распределения совпадает с математическим ожиданием и средним значениями) и средне-квадратичное отклонение (СКО) , полученное на обучающей выборке для некоторого класса «базовый», artemenko2_f3.eps - весовые коэффициенты, определяющие информационный вклад характеристики xi в формирование интегральной Yk.

Весовые коэффициенты artemenko2_f3.eps в указанной формуле предлагается определять следующими способами:

1. Путем назначения экспертами, исходя из личного опыта и анализа информационных источников.

2. Автоматически – на основе применения определенного статистически обоснованного математического аппарата.

3. Смешанным способом.

Во всех трех способах необходимо иметь единые шкалы измерений и ограничений. Принимаем ограничения:

artemenko2_f4.eps (2),

где n – количество частных показателей множества {Х}, k – номер интегральной характеристики Y (k≥0).

Предлагается следующая методика определения рассматриваемых весовых коэффициентов αi,k информативности (действительна только при наличии двух альтернативных классов):

1. Регистрируются для каждого альтернативного класса значения элементов множеств artemenko2_f5.eps (где n – количество характеристик).

2. По значениям коэффициента Стьюдента на заданном уровне значимости (ошибки первого рода) осуществляется селекция с предположительно незначительными классификационными возможностями. В результате селекции для дальнейшего формирования информативного признакового пространства используется множество artemenko2_f6.eps, где mx – количество характеристик, оставшихся после селекции.

3. По каждому показателю (признаку) artemenko2_f6.eps вычисляются коэффициенты Стьюдента различий между двумя альтернативными классами – формируется множество artemenko2_f7.eps, элементами которого (artemenko2_f8.eps) являются значения коэффициентов Стьюдента.

4. Элементы полученного множества artemenko2_f7.eps ранжируются (по убыванию или возрастанию). Строится диаграмма значений полученного ряда, по которой исследователь определяет необходимое количество (my ,my≤mx) и «состав» интегральных характерестик путем выделения кластеров близких (по некоторой мере исследователя) значений ранжированных коэффициентов Стьюдента.

5. Каждому кластеру k (k=1,…,my) ставится в соответствие определенная интегральная характеристика Yk и соответствующее подмножество artemenko2_f6.eps. Формула (2) модифицируется в формулу:

artemenko2_f9.eps (3).

6. Для каждой интегральной характеристики Yk с учетом вычисленных в п.2 значений коэффициентов Стьюдента и выделенных в п.3 кластеров определяются значения соответствующих весовых коэффициентов в (3) по формуле:

artemenko2_f10.eps (4).

Полученные величины весовых коэффициентов позволяют в дальнейшем формировать значения множества {Y}.

Таким образом, множество информативных характеристик {Pr}g для решения задачи обучения системы классификации (диагностики) формируется по формуле:

artemenko2_f11.eps (5),

где artemenko2_f12.eps - соответственно: множество отобранных характеристик по изложенной выше методике, множество отобранных интегральных характеристик, множество отобранных экспертом характеристик, - элементами всех множеств являются «идентификаторы».

Для формирования информативного множества и принятия решении о включении в него признака так же рекомендуется использовать методологию принятия решений Саати Т.Л. [13]

Формируется матрица предпочтительности W, элементы которой для показателей i и j различаются по 9 степеням (признак i предпочтительнее j): wi,j=1 - равная степень предпочтительности, wi,j=2 - слабая wi,j=3 - средняя, wi,j=4 - предпочтение выше среднего, wi,j=5 - умеренно сильное, wi,j=6 - сильное, wi,j=7 - очень сильное (очевидное), wi,j=8 - очень, очень сильное (абсолютное), wi,j=9 – абсолютное.

Анализ матрицы позволяет после преобразования группировать признаки по кластерам предпочтительности с помощью предлагаемого IJ-преобразования. Строки I меняются местами со строками J до тех пор, пока сумма произведений значений элемента матрицы W* на расстояние этого элемента до главной диагонали не станет минимальной (формула (6)). Таким образом, вокруг главной диагонали модифицированной матрицы предпочтений W* сгруппируются элементы с максимальными значениями.

artemenko2_f13.eps (6)

artemenko2_f14.eps

где N– количество анализируемых признаков до селекции.

Упорядочивание признаков по убыванию рангов информативности позволит определить степень предпочтения.

Целесообразно полагать, что для минимизации ошибки и принятия ложных решений из уже сформированного множества следует выделить ряд наиболее информативных характеристик, которые бы наиболее достоверно охарактеризовали исследуемый биологический объект.

Например, информативность отдельной характеристики из множества {Х} в работах [6, 7, 19] предлагается определять следующими методами [15].

Первый метод основан на нелинейной дискриминантной функции, определённой для классов (подразумевается бинарное иерархическое дерево решений). Он подразумевает:

– задание функции отклика для каждого класса w0 и w1;

– структурно-параметрическую идентификацию полинома Габора, с помощью алгоритма МГУА [6, 11];

– вычисление мультипликанта для каждого аргумента;

– определение аддиативно-мультипликативного влияния показателя xi на функцию отклика;

– введение «относительной погрешности отличий» (ОПО) (рекомендуется 0,01≤ε<0,1) и пересчёт значений величины мультипликативного влияния с учётом ОПО;

– упорядочивание xi по мере убывания в диапазоне, заданным ОПО;

– формирование кортежей признаков для классов: artemenko2_f15.eps и artemenko2_f16.eps;

– формирование множества рангов artemenko2_f17.eps и artemenko2_f18.eps по кортежам;

– формирование итогового множества информативных признаков;

– вычисление информативности признака Inf(xj) по формуле:

artemenko2_f19.eps (7)

где artemenko2_f20.eps – значение ранга показателя xi в w0 и w1, соответственно.

Во втором методе формирование множества информативных характеристик и вычисление значения Inf(xj), основывается на предварительной идентификации аппроксимирующего полинома Габора для каждой характеристики из начального множества {X}. В этом случае, процедура идентификации повторяется N раз для каждого класса w0 и w1, последовательно формируя множества {Z}={Х}–xj и отклики Y(Z)=xj.

В результате формируются множества аппроксимантов для каждого класса. Аппроксиманты, значения коэффициента детерминации которых меньше определенного порогового значения, не учитываются. Минимальный объем множества аппроксимантов устанавливается исследователем - рекомендуется не менее 3.

Для каждого альтернативного класса формируются матрицы значений artemenko2_f21.eps , по которым строятся векторы значений artemenko2_f22.eps и artemenko2_f23.eps.

Кортежи показателей artemenko2_f15.eps и artemenko2_f16.eps формируются для каждого класса по мере убывания xi по вектору значений с учётом ОПО.

Далее вычисление информативности осуществляется аналогично действиям, рассмотренным в способе 1.

В третьем методе переменные принимают значения «true» («1») либо «false» (0). С определенной точностью для возможности применения подходов, изложенных в способе 1 и 2, используют аналог полинома Габора Yв*(Zв*) для логических функций в виде формулы (8), на основании аналогов арифметических операций логическим функциям [10].

artemenko2_f24.eps,(8)

Далее расчеты аналогичны 1 и 2 методам.

В четвёртом методе осуществляется упорядочивание характеристик с последующим вычислением рангов, включением в информативный кортеж и вычислением информативности аналогично ранее рассмотренными способами на основании гипер- объемов H. При этом проводятся процедуры разведочной кластеризации с вычислением величины изменения качества кластеризации dHxj при исключении из рассмотрения анализируемой характеристики [12].

dHxj может принимать как положительные, так и отрицательные значения. В последнем случае после селекции наблюдается ухудшение качества классификации согласно общему гипер-объему пространства анализируемых показателей H.

Описанные методы применимы при априорно известном множестве характеристик. Однако на практике, например при исследовании биообъекта [2], часто необходимо определять информативность характеристики в текущий момент времени.

В случае, если биологический объект характеризуется некоторым сигналом небольшим объемом в работе [14] предлагается применить следующий подход.

В анализе сигнала используется фильтр, основанный на различии фаз измеряемого сигнала (регулярная функция) и шума (случайная функция, причём математическое ожидание шума принимается равным нулю).

Опорный импульс, применяемый в фильтре, имеет две прямоугольные ступени с различными амплитудами, общая длительность ступеней значительно меньше интервала наблюдения Тн.

При проведении измерений фрагмент искомого сигнала помещается на вторую ступень опорного импульса. В качестве измеряемой характеристики вычисляется фаза основной гармоники e–jwt при w=1. Для оценки величины сигнала используется разность фаз опорного импульса с сигналом и без него.

При значениях D и M (M=TH/TИ, а D=U2/ U1), близких к единице, увеличивается чувствительность фазы к изменению напряжения (амплитуды ступени).

При этом зависимость фазы от D и М имеет вид [1, 15]:

artemenko2_f25.eps (9)

artemenko2_80.tif

Рис. 1. Зависимость значения фазы основной гармоники опорного сигнала от отношения амплитуд первой и второй ступеней

Для повышения информативности результатов следует обеспечивать попадание фазы опорного импульса и фазы импульса с изменённым фрагментом сигнала на квазилинейный участок графика зависимости от параметра φ(D) (точки на кривой рис. 1). Для этого первую ступень опорного импульса следует принять равной 1, затем вычислить значение D (начальная фазы основной гармоники (w=1) попадёт на нижний конец квазилинейного участка кривой φ(D)).

artemenko2_f26.eps (10)

После формирования данным образом опорного импульса вычисляется среднее значение измеряемого фрагмента сигнала, которое может быть оценено через разность фаз основной гармоники опорного импульса с сигналом и без него [1].

Затем этот фрагмент умножается на коэффициент:

artemenko2_f27.eps, (11)

где x - среднее значение фрагмента «сигнал + шум».

Восстановление сложных сигналов проводят путём оценки средних значений отдельных их фрагментов. Для этого исходный сигнал формируется в виде импульса с колоколовидной огибающей, к нему добавляется шум в виде последовательности случайных нормально распределённых чисел. Зашумлённый сигнал разбивается на фрагменты, для каждого такого фрагмента описанным выше способом оценивается среднее значение сигнала [15].

В результате из некогерентного шума формируется информативный сигнал, по которому можно вести дальнейший анализ [9].

Для вычисления значения информативных параметров снятого сигнала [5,17], предлагается использовать функциональные параметры, характеризующие поведение системы, способной принимать решение в текущий момент времени в соответствии с учетом прошлого опыта и прогнозирования будущего [3, 4].

Целесообразное полагать, что биологическая система должна принимать решения в момент времени t, при регистрации значения информативного сигнала y(t). Так как автономная система управления организмом систематически учитывает лучший результат «прошлого» опыта и автоматически прогнозирует развитие ситуации в будущем, то сигнал y(t) может быть представлен в виде [8]:

artemenko2_f28.eps, (12)

где: φt±i(t±i) – частный аргумент-функционал, отражающий состояние анализируемой системы в моменты времени (t±i); τ1 и τ2 – максимальное время упреждения и экстраполяции (прогноза), соответственно; T1 и T2 формирующий индекс частных аргумент-функционалов, F() интегральный «опытно-прогностический функционал» – FPF(t)).

В первом приближении частные спектральные аргумент-функционалы представляются линейными преобразованиями:

artemenko2_f29.eps. (13)

Множество значений информативных хронометрических параметров в момент времени t+1, формируется «Модулем «фантазий», который содержит правила идентификации artemenko2_f30.eps по artemenko2_f31.eps и рассогласования между прогнозируемым состоянием St+1 и реально регистрируемым artemenko2_f32.eps. Обучение заканчивается, когда указанное рассогласование достигнет приемлемого порога величины [8] (задается в общем случае нижней и верхними границами).

Выводы

Рассмотренные подходы позволяют формализовать выделение множеств информативных прямых и латентных характеристик биологического объекта путём анализа сигналов различных уровней мощности на основе применения как упреждающих, так и прогнозируемых значений сигнала. Анализ осуществляется с помощью применения самоорганизационной концепции моделирования, дифференцированного анализа и метода анализа иерархий. Исследования в этом направлении представляются новыми и перспективными для решения задачи диагностики состояния анализируемого биообъекта.


Библиографическая ссылка

Артеменко М.В., Сотникова А.Д. ВЫДЕЛЕНИЕ ИНФОРМАТИВНЫХ ХАРАКТЕРИСТИК БИОЛОГИЧЕСКОГО ОБЪЕКТА ИЗ РЕГИСТРИРУЕМОГО СИГНАЛА // Научное обозрение. Биологические науки. – 2017. – № 1. – С. 31-35;
URL: https://science-biology.ru/ru/article/view?id=1032 (дата обращения: 24.04.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674