Основы теории нейронных сетей


Бинарные системы


В первой работе Д.Хопфилда функция

была просто пороговой функцией. Выход такого нейрона равен единице, если взвешенная сумма выходов с других нейронов больше порога
, в противном случае она равна нулю. Порог вычисляется следующим образом:

Состояние сети — это просто множество текущих значений сигналов OUT от всех нейронов. В первоначальной сети Хопфилда состояние каждого нейрона менялось в дискретные случайные моменты времени, в последующей состояния нейронов могли меняться одновременно. Так как выходом бинарного нейрона может быть только ноль или единица (промежуточных уровней нет), то текущее состояние сети является двоичным числом, каждый бит которого является сигналом OUT некоторого нейрона.

Задачи, решаемые данной сетью, как правило, формулируются следующим образом. Известен некоторый набор двоичных сигналов (изображений, оцифровок звука, прочих данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить ("вспомнить" по частичной информации) соответствующий образец (если такой есть) или "дать заключение" о том, что входные данные не соответствуют ни одному из образцов. В общем случае, любой сигнал может быть описан вектором

,
— число нейронов в сети и размерность входных и выходных векторов. Каждый элемент
равен либо 1, либо 0. Обозначим вектор, описывающий k-й образец, через
, а его компоненты, соответственно, —
,
,
— число образцов. Когда сеть распознaет (или "вспомнит") какой-либо образец на основе предъявленных ей данных, ее выходы будут содержать именно его, то есть
, где
--вектор выходных значений сети:
. В противном случае, выходной вектор не совпадет ни с одним образцовым.

Если, например, сигналы представляют собой некие изображения, то, отобразив в графическом виде данные с выхода сети, можно будет увидеть картинку, полностью совпадающую с одной из образцовых (в случае успеха) или же "вольную импровизацию" сети (в случае неудачи).




На стадии инициализации сети весовые коэффициенты синапсов устанавливаются следующим образом:



Здесь
и
— индексы, соответственно, предсинаптического и постсинаптического нейронов;
,
-й и
-й элементы вектора
-го образца.

Алгоритм функционирования сети следующий (
— номер итерации):



  1. На входы сети подается неизвестный сигнал. Фактически его ввод осуществляется непосредственной установкой значений аксонов:



    поэтому обозначение на схеме сети входных синапсов в явном виде носит чисто условный характер. Ноль в скобке справа от
    означает нулевую итерацию в цикле работы сети.



  2. Рассчитывается новое состояние нейронов:



    и новые значения аксонов



    где
    — активационная функция в виде скачка.

  3. Проверка, изменились ли выходные значения аксонов за последнюю итерацию. Если да — переход к пункту 2, иначе (если выходы стабилизировались) — конец процедуры. При этом выходной вектор представляет собой образец, наилучшим образом сочетающийся с входными данными.






Нейроны второго слоя связаны между собой ингибиторными (отрицательными обратными) синаптическими связями. Единственный синапс с положительной обратной связью для каждого нейрона соединен с его же аксоном.

Идея работы сети состоит в нахождении расстояния Хэмминга от тестируемого образа до всех образцов. Расстоянием Хэмминга называется число отличающихся битов в двух бинарных векторах. Сеть должна выбрать образец с минимальным расстоянием Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий именно этому образцу.

На стадии инициализации весовым коэффициентам первого слоя и порогу активационной функции присваиваются следующие значения:



Здесь
-
-й элемент
-го образца.

Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине
. Синапс нейрона, связанный с его же аксоном, имеет вес +1.

Алгоритм функционирования сети Хэмминга следующий:



  1. На входы сети подается неизвестный вектор

    ,

    исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс в скобках указывает номер слоя):



    После этого полученными значениями инициализируются значения аксонов второго слоя:





  2. Вычисляются новые состояния нейронов второго слоя:



    и значения их аксонов:



    Активационная функция
    имеет вид порога, причем величина


    должна быть достаточно большой, чтобы любые возможные значения аргумента не приводили к насыщению.

  3. Проверить, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да — перейти к шагу 2. Иначе — конец процедуры.


Из оценки алгоритма видно, что роль первого слоя весьма условна: воспользовавшись один раз на шаге 1 значениями его весовых коэффициентов, сеть больше не обращается к нему, поэтому первый слой может быть вообще исключен из сети.


Содержание раздела