Говоря о системах автоматического управления, нельзя не сказать о всё более расширяющемся классе автоматов. Автоматы выполняют целый ряд функций, но без непосредственного участия человека. Существует большая номенклатура разработанных автоматов, к которой относятся станки-автоматы, фасовочные автоматы, торговые автоматы, банкоматы и др. К автоматам можно причислить и образцы робототехники, беспилотных летательных аппаратов, самодвижущихся танков и т. д. Автоматы в своём большинстве основаны на использовании дискретной, в том числе цифровой, техники и отличаются следующими свойствами: на входах и выходах данные X и Y поступают в дискретные моменты времени и квантуются по величине, причём конечное число её фиксированных значений выбирается из входного и выходного алфавитов; промежуточные значения модели Z фиксированы и конечны, при этом они определяются как входной величиной Х в тот же момент времени, так и предыдущими значениями Z. Различают автоматы с конечной памятью и автоматы с бесконечной памятью. В основе действий автоматов лежит использование логических функций из арсенала математической логики. В последнее время получили развитие адаптирующиеся автоматы. Промежуточные состояния модели таких автоматов Z зависят от случайной среды и меняются с изменением выхода. С появлением ошибок назначаются штрафные санкции, подаваемые на вход. Вследствие этого вероятность наказания снижается, а модель как бы «приспосабливается» к изменениям среды. С началом развития моделирования стали создаваться модели автоматов, отражающих функционирование живых организмов. Моделирование нейронов, объединённых в нервные сети, основано на использовании дискретной техники, логических функций, реализующих взаимодействие отдельных нейронов и пороговых элементов, моделирующих процесс возбуждения нервных клеток. Наиболее удачными считаются вероятностные (стохастические) модели и среди них модели, называемые персептронами. Они обладают памятью и имеют случайную структуру связи между элементами. Персептрон оказался одним из первых автоматов, способных учиться распознаванию образов.
Обучение как вероятностный процесс обычно рассматривается в параллель с процессом адаптации
[19]
. Известны автоматы для обучения распознаванию образов, автоматы для обучения целесообразному поведению путём введения «оценок» при поощрении или наказании. В общем случае учитель (обучающий) передаёт знания ученику (обучаемому) в виде алгоритма решения задачи или сообщает эти знания при помощи примеров. Второй метод считается более эффективным. Мы им будем пользоваться в дальнейшем.
Когда на автоматическую систему воздействуют случайные нежелательные возмущения и она борется с ними, предполагается, что других влияющих на это систем нет. Нередки, однако, случаи функционирования двух систем, «интересы» которых противоположны. При этом управляющие воздействия, вырабатываемые каждой из систем, могут оказаться вредными для другой стороны. Это представляет собой пример так называемой конфликтной ситуации. Конфликты возникают в живой природе, в военной области, при экономической конкуренции. В этих условиях, при наличии признаков борьбы, управляемая система на основе выбранной стратегии вырабатывает реакцию наибольшего благоприятствования при самых неблагоприятных действиях оппонента. В теоретическом плане исследованиями возможных стратегий занимается теория игр. Наиболее продвинутой является теория парных игр с нулевой суммой, где выигрыш одного игрока равен проигрышу другого. Возможные выигрыши при такой игре определяются платёжной матрицей m x n, где m действиям игрока А (m строк матрицы) противопоставляются n действий игрока В (n столбцов матрицы). Оптимальная стратегия, называемая стратегией минимакса, для игрока А состоит в выборе максимального элемента матрицы по строкам из минимальных по столбцам, а для игрока В – минимального по столбцам из максимальных по строкам. Если в матрице имеется элемент, который является одновременно максимальным для игрока А и минимальным для игрока В, то говорят, что матрица содержит седловую точку, соответствующую чистой стратегии. При отсутствии седловой точки возможно случайное применение с заданными вероятностями тех или иных чистых стратегий. В этом случае имеет место смешанная стратегия. При такой стратегии возможно доминирование одного из игроков.
Перейдём теперь от обобщающих задач кибернетики к проблемам радиолокации и противорадиолокации. Здесь я должен заметить, что весь приведённый ниже материал имеется в открытых публикациях, и все непростые усилия автора были направлены на поиск и компоновку добытых сведений и представлении их в возможно более доступном виде для широкого читателя.
Начнём со свойств радиолокационных сигналов, в том числе сигналов, отражённых от радиолокационных целей. Вообще, сигнал является средством передачи информации от одного объекта к другому. Сигнал передаёт сообщения по каналу связи. Мера количества информации, передаваемых сигналом, зависит от вероятностей поступления сообщений. Если одно из n поступающих сообщений достоверно (с вероятностью единица), а вероятности поступления других (n – 1) сообщений соответственно равны 0 (т. к. р1 + р2 + … + рn = 1), то среднее количество информации равно нулю. Численно количество информации определяется суммой произведений вероятности сообщения на её логарифм. Основанием логарифма является число два, в физике часто используются натуральные логарифмы. При двух равновероятных событиях р1 = р2 = р = 0,5, количество информации
Н = – р1log2p1 – р2log2p2 = 1 бит.
Генерируемый передатчиком РЛС сигнал в простейшей форме (известной нам из основ тригонометрии) может быть представлен с помощью одной из гармонических функций (Sin или Cos) в виде u(t) = ACos(ωt + φ), где А – амплитуда сигнала, ω – частота, t – время, φ – фаза. В написанном виде сигнал относится к непрерывным сигналам, ибо время t пока ничем не ограничено, а параметры сигнала постоянны. Однако параметры гармонического сигнала могут со временем меняться по тому или иному закону или, как говорят в радиотехнике, модулироваться. Например, амплитуда А может быть промодулирована около некоей постоянной величины А0, т. е. А(t) = А0 + AmSinΩt, где обычно Ω < ω, а глубина модуляции Am << А0. Но модуляция амплитуды может иметь и 100 % глубину. Так, если произвести амплитудную модуляцию исходного сигнала периодической последовательностью импульсов длительностью τ и частотой повторения F, получим вместо непрерывного импульсный радиосигнал, состоящий из набора высокочастотных импульсов с указанными длительностью и частотой следования. Аналогичным образом может модулироваться частота сигнала ω = ω(t0) или его фаза φ = φ(t). Могут быть и смешанные модуляции, например по амплитуде и частоте.
Радиолокационным сигналам и методам их модуляции посвящена большая литература
[20]
, с которой пытливый читатель может ознакомиться. Мы здесь скажем о другом. Модуляция, которой наделён радиолокационный сигнал на передающем конце канала связи, может быть извлечена на приёмном его конце с помощью детектирования. Амплитудный детектор позволяет получать информацию, заложенную при амплитудной модуляции. Так, на его выходе образуется импульсное или постоянное напряжение в зависимости от того, какой сигнал принят: импульсный или непрерывный. Для выделения из принятого сигнала частотной модуляции (ЧМ) используются частотные детекторы, называемые также частотными дискриминаторами. Если сигнал имеет фазовую модуляцию (ФМ), то для его детектирования необходим фазовый детектор, обладающий двумя входами. На первый вход подаётся принятый ФМ сигнал, а на другой вход опорный сигнал с той же несущей частотой ω, но с постоянной фазой φ = φ0.