Основы теории нейронных сетей


Бинарные системы


В первой работе Д.Хопфилда функция

Бинарные системы
была просто пороговой функцией. Выход такого нейрона равен единице, если взвешенная сумма выходов с других нейронов больше порога
Бинарные системы
, в противном случае она равна нулю. Порог вычисляется следующим образом:

Бинарные системы

Состояние сети — это просто множество текущих значений сигналов OUT от всех нейронов. В первоначальной сети Хопфилда состояние каждого нейрона менялось в дискретные случайные моменты времени, в последующей состояния нейронов могли меняться одновременно. Так как выходом бинарного нейрона может быть только ноль или единица (промежуточных уровней нет), то текущее состояние сети является двоичным числом, каждый бит которого является сигналом OUT некоторого нейрона.

Задачи, решаемые данной сетью, как правило, формулируются следующим образом. Известен некоторый набор двоичных сигналов (изображений, оцифровок звука, прочих данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить ("вспомнить" по частичной информации) соответствующий образец (если такой есть) или "дать заключение" о том, что входные данные не соответствуют ни одному из образцов. В общем случае, любой сигнал может быть описан вектором

Бинарные системы
,
Бинарные системы
— число нейронов в сети и размерность входных и выходных векторов. Каждый элемент
Бинарные системы
равен либо 1, либо 0. Обозначим вектор, описывающий k-й образец, через
Бинарные системы
, а его компоненты, соответственно, —
Бинарные системы
,
Бинарные системы
,
Бинарные системы
— число образцов. Когда сеть распознaет (или "вспомнит") какой-либо образец на основе предъявленных ей данных, ее выходы будут содержать именно его, то есть
Бинарные системы
, где
Бинарные системы
--вектор выходных значений сети:
Бинарные системы
. В противном случае, выходной вектор не совпадет ни с одним образцовым.

Если, например, сигналы представляют собой некие изображения, то, отобразив в графическом виде данные с выхода сети, можно будет увидеть картинку, полностью совпадающую с одной из образцовых (в случае успеха) или же "вольную импровизацию" сети (в случае неудачи).




На стадии инициализации сети весовые коэффициенты синапсов устанавливаются следующим образом:

Бинарные системы


Здесь
Бинарные системы
и
Бинарные системы
— индексы, соответственно, предсинаптического и постсинаптического нейронов;
Бинарные системы
,
Бинарные системы
Бинарные системы
-й и
Бинарные системы
-й элементы вектора
Бинарные системы
-го образца.

Алгоритм функционирования сети следующий (
Бинарные системы
— номер итерации):



  1. На входы сети подается неизвестный сигнал. Фактически его ввод осуществляется непосредственной установкой значений аксонов:

    Бинарные системы


    поэтому обозначение на схеме сети входных синапсов в явном виде носит чисто условный характер. Ноль в скобке справа от
    Бинарные системы
    означает нулевую итерацию в цикле работы сети.



  2. Рассчитывается новое состояние нейронов:

    Бинарные системы


    и новые значения аксонов

    Бинарные системы


    где
    Бинарные системы
    — активационная функция в виде скачка.

  3. Проверка, изменились ли выходные значения аксонов за последнюю итерацию. Если да — переход к пункту 2, иначе (если выходы стабилизировались) — конец процедуры. При этом выходной вектор представляет собой образец, наилучшим образом сочетающийся с входными данными.




Нейроны второго слоя связаны между собой ингибиторными (отрицательными обратными) синаптическими связями. Единственный синапс с положительной обратной связью для каждого нейрона соединен с его же аксоном.

Идея работы сети состоит в нахождении расстояния Хэмминга от тестируемого образа до всех образцов. Расстоянием Хэмминга называется число отличающихся битов в двух бинарных векторах. Сеть должна выбрать образец с минимальным расстоянием Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий именно этому образцу.

На стадии инициализации весовым коэффициентам первого слоя и порогу активационной функции присваиваются следующие значения:

Бинарные системы


Здесь
Бинарные системы
-
Бинарные системы
-й элемент
Бинарные системы
-го образца.

Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине
Бинарные системы
. Синапс нейрона, связанный с его же аксоном, имеет вес +1.

Алгоритм функционирования сети Хэмминга следующий:



  1. На входы сети подается неизвестный вектор

    Бинарные системы
    ,

    исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс в скобках указывает номер слоя):

    Бинарные системы


    После этого полученными значениями инициализируются значения аксонов второго слоя:

    Бинарные системы




  2. Вычисляются новые состояния нейронов второго слоя:

    Бинарные системы


    и значения их аксонов:

    Бинарные системы


    Активационная функция
    Бинарные системы
    имеет вид порога, причем величина
    Бинарные системы


    должна быть достаточно большой, чтобы любые возможные значения аргумента не приводили к насыщению.

  3. Проверить, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да — перейти к шагу 2. Иначе — конец процедуры.


Из оценки алгоритма видно, что роль первого слоя весьма условна: воспользовавшись один раз на шаге 1 значениями его весовых коэффициентов, сеть больше не обращается к нему, поэтому первый слой может быть вообще исключен из сети.


Содержание раздела