ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ НАУКИ. 2019. № 1 (61)
УДК 681.391:543/545
ИСПОЛЬЗОВАНИЕ ФУНКЦИЙ ЧЕБЫШЕВА - ЭРМИТА В ОБРАБОТКЕ СИГНАЛОВ АНАЛИТИЧЕСКИХ ПРИБОРОВ
Р.Т. Сайфуллин, А.В. Бочкарев
Самарский государственный технический университет Россия, 443100, г. Самара, ул. Молодогвардейская, 244
Аннотация. Цель работы заключается в разработке теоретических и прикладных подходов, которые позволяют синтезировать компактные и быстрые вычислительные алгоритмы оценки полезного сигнала, реализовать все потенциальные возможности аналитических приборов. Для достижения указанной цели выходной сигнал аналитического прибора представляется в виде разложения в базисе функций Чебышева - Эрмита: нахождение коэффициентов разложения - кодирование данных, восстановление сигнала по заданным коэффициентам в данном базисе - декодирование данных. Для оценки качества результатов восстановления использована приведенная погрешность. Даны примеры восстановления сигнала при различном количестве функций разложения Чебышева - Эрмита. Рассмотрены ограничения способа, связанные, во-первых, с несовпадением длительности локализации сигнала и базисных функций, во-вторых, с увеличением требуемого числа базисных функций при усложнении формы исследуемого сигнала. Для согласования длительностей сигнала и базисных функций предложен масштабный коэффициент, позволяющий сжимать или растягивать базисные функции во времени. При обработке сигналов сложной формы предложен алгоритм деления исходного сигнала на более простые фрагменты. Для модели аналитического пика в виде функции Гаусса представлена зависимость значений коэффициентов разложения от изменения параметров пиков (ширины и положения пиков на оси развертки). Рассмотрена возможность восстановления сглаженных первой и второй производных исходного сигнала с использованием коэффициентов разложения по функциям Чебышева - Эрмита. Для этого сформирован базис декодирования производных соответственно первого и второго порядков. Приведены соответствующие примеры. Для вычислений и графического представления результатов использована система компьютерной алгебры Wolfram Mathematica 11.3.
Введение
Аналитическое приборостроение является интенсивно развивающейся областью измерительной техники, предназначенной для исследования состава и свойств веществ. Развитие этого направления идет по пути улучшения характеристик аналитических приборов и внедрения новых методов анализа результатов измерений. Среди задач аналитического приборостроения следует выделить функциональное преобразование, фильтрацию, детектирование и разделение
Сайфуллин Раухат Талгатович (д.т.н., проф.), профессор кафедры «Информационно-измерительная техника».
Бочкарев Андрей Владимирович, аспирант.
наложенных аналитических сигналов, устранение искажающего действия аппаратной функции прибора и т. д. [1].
Совершенствование вычислительных технологий обработки измерительной информации для сигналов сложной формы связано с развитием прикладных математических методов, лежащих в основе данных технологий, с внедрением новых программно-алгоритмических средств обработки данных. Таким образом, актуальной проблемой является разработка теоретических и прикладных подходов, которые позволяют синтезировать компактные и быстрые вычислительные алгоритмы оценки полезного сигнала, направленные на реализацию всех потенциальных возможностей аналитических приборов [2].
В этой связи в данной работе для математического описания сигнала Дх) предлагается использовать проекционную схему кодирования-декодирования данных, основанную на разложении сигнала в ряд по функциям Чебышева - Эр-мита [3-8]. Одновременная локализация этих функций как в частотном, так и во временном пространстве делает метод достаточно устойчивым к инструментальным погрешностям [9, 10].
Определение функций Чебышева - Эрмита
Разложение сигнала в ряд по функциям Чебышева-Эрмита позволяет производить анализ сигнала и его преобразование Фурье одновременно, поскольку функции Чебышева-Эрмита являются собственными функциями преобразования Фурье [11].
Функции Чебышева-Эрмита определяются следующим образом:
Фп (х) =--е 2 • Н (х), (1)
где ап =\\]2пп!л/Л - нормирующая константа;
Нп(х) - стандартизированный многочлен Чебышева-Эрмита степени п:
Нп (х М-1)
При х^да функции Чебышева-Эрмита обращаются в нуль. Пусть ¥ (•) - оператор преобразования Фурье, тогда:
¥(фи (х)) =• Фи (х). Для всех п > 2 функции Чебышева-Эрмита можно определить через рекуррентные формулы:
фп ( х) = х\\ ~ • Фп-1 ( Х) - • Фп-2 (Х), (2)
у п ЦП
ф 0 (х )=Ж
Ф1 (х)^42х•е 2
Каждая из функций фп (х) локализована на некотором отрезке [-тп , тп].
Функции Чебышева-Эрмита образуют на бесконечном интервале -да < х < да полную ортогональную нормированную с единичным весом систему:
^ Г0, т Ф п,
I Фп (х)-Фт (Ч ,
-о, [1, т = п.
Четные и нечетные функции Чебышева-Эрмита также образуют полную ортогональную нормированную с единичным весом систему на интервале
Примеры функций Чебышева-Эрмита фп(х) для п=0,1,...7 приведены на рис. 1.
Использование функций Чебышева-Эрмита для кодирования
и декодирования сигналов
Набор функций фп (х) (2) задает базис для кодирования и декодирования сигналов.
Представление сигнала / (х) с помощью п функций разложения (алгоритм кодирования) заключается в нахождении коэффициентов сп. В силу локализации функций Чебышева-Эрмита нахождение данных коэффициентов можно свести к формуле:
сп= I /(х)-фй(х)Л, И = 0,1,...,Ж (3)
где [-тп , тп] - отрезок, на котором локализована функция фп (х) .
На практике в качестве [-тп, тп] используют некоторый отрезок, который достаточно легко связать с номером полинома. Этот отрезок называют интервалом интегрирования, причем на нем локализована большая часть функции Чебышева-Эрмита порядка п. Наиболее простым способом задать границы интегрирования является выражение, характеризующее положение крайней точки перегиба в п-й базисной функции:
тп =7 2п +1.
Алгоритм декодирования с помощью п коэффициентов разложения выражается формулой:
/(х) = 2Сп -Фп(х). (4)
Описанный алгоритм кодирования-декодирования обладает сглаживающим свойством [12], и позволяет получить не только сглаженный сигнал, но также и его сглаженную производную к порядка, при наличии соответствующего базиса. Формируя различные базисы перехода от коэффициентов разложения (3) к различным характеристикам, можно получить универсальный аппарат для быстрого получения также коэффициентов непрерывного вейвлет-преобразования, устранения аппаратной функции прибора и т.д.
При кодировании с использованием полиномов с номерами п = 0,1,..N для различных N достигается различная точность восстановления, причем
с увеличением N точность повышается. Для численной оценки точности восстановления при использовании полиномов Чебышева-Эрмита можно воспользоваться наиболее простой из согласующихся с визуальной оценкой точности характеристик - максимальным значением приведенной погрешности /(х) относительно / (х):
у = тах
Г/(х) - }(х)^
тах[/ ( х)]
где тах[ / (х) ] - максимальное значение функции на отрезке локализации.
При кодировании-декодировании сигналов важно учитывать область локализации функций Чебышева-Эрмита. Дело в том, что длительность исследуемого сигнала может быть значительно отличаться от области локализации используемых базисных функций. Если длительность сигнала меньше длительности локализации используемых базисных функций, результат декодирования будет иметь искажения, связанные с недостаточной детализацией. В случае же, когда локализация базисных функций меньше длительности сигнала, при восстановлении будут наблюдаться искажения, связанные с появлением отсутствующих в исследуемом сигнале высокочастотных составляющих. Для устранения данного недостатка можно ввести масштабный коэффициент к:
" 2г„
где l - длительность исследуемого сигнала.
Данный коэффициент характеризует, во сколько раз длительность сигнала отличается от интервала интегрирования, принимаемого за область локализации функций Чебышева-Эрмита. При ^ > 1 функцию с номером п следует «растягивать» вдоль оси времени для согласования размеров с сигналом; при ^ < 1 функцию с номером п следует «сжимать» вдоль оси времени для согласования размеров с сигналом. Согласовывая область локализации базисных функций с длительностью сигналов, стоит учесть, что при формировании коэффициентов разложения согласно (3) следует полученный результат делить на
Также важно отметить, что масштабирование каждой из функции п порядка на соответствующий ей коэффициент ^ вызывает существенные погрешности восстановления из-за нарушения нормировки функций друг относительно друга. При этом, в случае масштабирования всех базисных функций на один и тот же коэффициент, такой погрешности не возникает.
Выбирать ^ следует, опираясь на число используемых функций для разложения сигнала. В общем случае достаточно, чтобы порядок коэффициента п не превышал половины от максимального значения коэффициента N
к = /2Таким образом, с учетом согласования локализации функций Чебышева-Эрмита и длительности исследуемого сигнала, можно записать (3) в следующем виде:
сп=\\ I п = 0,1,...,М. (5)
Пример кодирования с последующим декодированием представлен ниже. В качестве тестового сигнала используется сумма трех гауссовских пиков - по центру пик с единичной амплитудой, симметрично ему слева и справа - пики с амплитудой 0,7. Среднеквадратичная ширина центрального пика - 2, боковых - 0,8.
На рис. 2 представлен сам исходный сигнал, а также полученные результаты при различном числе полиномов разложения N.
Рис. 2. Исходный и восстановленный сигнал
Численные оценки точности восстановления для некоторых N < 30 представлены в таблице.
Зависимость у от N при восстановлении заданного сигнала
N 5 7 9 11 13 15 17 18
у№% 27 12 4 1,7 0,58 0,19 0,16 0,15
N 19 23 24 25 26 27 29 30
у№% 0,048 0,044 0,051 0,065 0,064 0,048 0,057 0,61
Необходимо заметить, что число используемых коэффициентов разложения будет зависеть от конфигурации исследуемого сигнала. В случае простой формы сигнала (к примеру, рис. 2, б) для обеспечения сравнительно высокой точности восстановления (у < 10%) достаточно ~7-10 базисных функций Чебышева-Эрмита, для более сложных форм сигнала их число увеличивается.
Рис. 3. Схема алгоритма разбиения сигнала на фрагменты по пикам
Для упрощения конфигурации произвольного сигнала можно разбить его на фрагменты. В данной работе, для решения этой задачи, предлагается проанализировать знак первой производной исходного сигнала. Поскольку аналитические данные представляют собой массивы чисел, для нахождения знака производной достаточно сравнить отстоящие друг от друга на некоторое значение отсчеты. Анализируя знак производной, можно обнаружить границы аналитических пиков, составляющих исходный сигнал. Эти границы предлагается использовать в качестве границ отдельных фрагментов. Описанную процедуру можно представить в виде алгоритма, изображенного на рис. 3.
Рис. 4. Результат определения границ фрагментов
а - сигнал без помехи при 81ер=10, б - с помехой при 81ер=10, в - с помехой при 81ер=5
Согласно данному алгоритму, создается массив Peaks, совпадающий по размеру с массивом исследуемого сигнала S и состоящий из нулей в тех точках, где границы пиков обнаружены не были, и единиц в тех точках, где были. Для приближенного обнаружения границ пиков i-й элемент должен быть меньше чем i+step-й и i-step-й элементы (положительная производная слева и отрицательная производная справа, соответственно). Константа step £ И задает шаг, на который отстоят друг от друга сравниваемые элементы. В общем случае, когда на исследуемый сигнал наложена помеха, step не может быть равным 1, поскольку в этом случае массив Peaks будет характеризовать, по большей части, локальные максимумы помехи. Таким образом, сформированный алгоритм направлен, в первую очередь, на минимизацию ложных срабатываний из-за наличия помехи.
Для иллюстрации зависимости точности работы алгоритма (см. рис. 3), на рис. 4 представлены примеры определения границ пиков: для сигнала без наложенной помехи с параметром step=10, с помехой при значении step=10, с помехой при step=5. Помеха во всех случаях имеет нормальный закон распределения, нулевое среднее и СКО 0,08. Границы фрагментов обозначены дельта-функцией.
Данный алгоритм позволяет быстро разделить сигнал сложной конфигурации на более простые фрагменты, пригодные для дальнейшей обработки.
Для различных задач хроматографии, к примеру, для определения параметров совмещенных аналитических пиков, можно рассмотреть задачу кодирования сигнала с учетом модели пиков как функции Гаусса [13-15]. Эта функция может быть описана следующим выражением:
g(t) = a • e , (6)
где a - амплитудное значение пика,
ц - смещение пика вдоль оси времени, в - среднеквадратическая ширина пика. Подставляя в качестве fx) в выражение (5) функцию (6) получим:
сп = a • ф„ fydx, п = 0,1,..., N, (7)
- общий вид выражения для нахождения «-го коэффициента разложения в базисе Чебышева-Эрмита.
Можно заметить, что (7) зависит не только от координаты х, но и от параметров, задающих форму пика - а, ц и р. Следовательно, проинтегрировав данное выражение при некотором п можно получить зависимость «-го коэффициента разложения от а, ц и р. Поскольку а выступает в качестве константы, ее влияние на величину коэффициентов будет линейным, куда важнее рассмотреть зависимость коэффициентов от смещения ц и среднеквадратической ширины Р, которые в качестве параметров находятся в степени экспоненты.
В сущности, выражение (7) представляет собой выражение для взаимной корреляции п-й функции Чебышева-Эрмита (1) с функцией Гаусса (6). Причем, с увеличением Р данное выражение отражает взаимную корреляцию озвученных функций с уменьшением детализации, по аналогии с изменением параметра
масштаба для непрерывного вейвлет-преобразования. На рис. 5 графически проиллюстрирована зависимость коэффициентов разложения от в и ц при п = 0,1.. .5. Для базисных функций более высоких порядков вычисление аналитических выражений при произвольных в и ц значительно усложняется.
И ?уо,35 И 2.5
п=4 п=5
Рис. 5. Зависимость коэффициентов разложения от в и ц
Использование алгоритма кодирования-декодирования
для вычисления производных различных порядков
Как было озвучено ранее, функции Чебышева-Эрмита могут быть использованы для перехода к различным преобразованиям исследуемого сигнала, при наличии соответствующих базисов. При обработке сигналов аналитических приборов важным является возможность нахождения их производной, причем не только первого, но и высших порядков.
Для быстрого перехода к производным исследуемого сигнала можно осуществить дифференцирование (1) для формирования соответствующего базиса,
производных функций Чебышева-Эрмита. Выражения для первой и второй производной могут быть описаны следующим образом:
= х • ф„ (х) - Л/2(ПТ1) • Ф„+1 (х), (8)
Фп2( Х) = (1 + х2 ) • Фп (х) 4(п +1) ГГ • х • фп+! (х) - ТП+2 • фп+2 (х)
Таким образом, соотношения (8) и (9) задают базис для вычисления производных, соответственно, первого и второго порядка. Первые 4 базисные функции представлены на рис.6.
Рис. 6. Производные функций Чебышева-Эрмита:
а - первого порядка, б - второго порядка
Полученные базисы позволяют восстанавливать первую, либо вторую производную исследуемого сигнала с помощью рассчитанных ранее коэффициентов разложения этого сигнала по самим функциям Чебышева-Эрмита. Для этого
Л //14 I \\ дФп (Х) д Фп (х) необходимо заменить в (4) фп (х) на- или--— соответственно:
дТ(х)_ N. Сфп (х)
Сп •
д7 (х)_ N. С2фп(х)
= ^ Сп
На рис. 7 показан пример осуществления восстановления производных сигнала при N=7. Очевидно, что производные восстанавливаются практически без искажений.
Рис. 7. Пример вычисления первой и второй производной анализируемого сигнала:
Заключение
В качестве вычислительной технологии обработки аналитической информации целесообразно выбрать схему кодирования-декодирования сигналов в базисе функций Чебышева - Эрмита, на основе которой можно разрабатывать различные алгоритмы обработки в соответствии с поставленными задачами.
Приведены соотношения, позволяющие осуществить операцию кодирования сигнала и последующего его декодирования при восстановлении формы сигнала. Для кодирования сложных многокомпонентных сигналов предлагается алгоритм предварительного его разбиения на отдельные фрагменты. Для получения производных сигнала первого и второго порядков, используемых в алгоритмах обработки данных для локализации границ пиков, получен базис декодирования производных. Приведены примеры расчетов.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
Статья поступила в редакцию 25 января 2018 г.
USING OF CHEBYSHEV-HERMITE FUNCTIONS FOR ANALYTICAL DEVICE SIGNALS PROCESSING
R.T. Sayfullin, A.V. Bochkarev
Samara State Technical University
Abstract. The paper deals with the development of theoretical and applied approaches for synthesis fast and compact analytical data processing algorithms which can be used to estimate analytical peaks parameters. These algorithms are based on analytical data decomRauhat T. Sayfullin (Dr. Sci. (Techn.)), Professor. Andrey V. Bochkarev, Postgraduate Student.
position, the Chebyshev-Hermite polynomials are used as decomposition basis. The goal of using data decomposition is possibility of simple estimating of analytical peaks parameters by reconstructing different data transforms directly from decomposition coefficients. These transforms can be obtained by using corresponding bases. In this article considered following bases: basis for reconstruction initial data, bases for reconstruction smoothed first and second derivative of initial data. Examples of using these bases are given. Limitations of this approach are described. Relation between values of decomposition coefficients and modeled analytical peak parameters are obtained, Gauss function used for peak model. The Mathematica 11.3 computer algebra system was used to calculations and graph the results.
REFERENSES