Реализация apt

Добавил:

bagiwow Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

Нейронные сети

Файл:

Нейрокомпьютернатехника.doc

Скачиваний:

187

Добавлен:

10.12.2013

Размер:

1.99 Mб

Скачать

☆

<<< < Предыдущая 38 39 40 41 42 43 44 45 46 47 48 4950 / 7250 51 52 53 54 55 56 57 58 59 60 61 62 > Следующая >>>

Реализация apt
1. Обзор

APT,как это можно увидеть из литературы, представляет собой нечто большее, чем философию, но намного менее конкретное, чем программа для компьютера. Это привело к наличию широкого круга реализации, сохраняющих идеи APT,но сильно отличающихся в деталях. Рассматриваемая далее реализация основана на работе [5] с определенными изменениями для обеспечения совместимости с работой [2] и моделями, рассмотренными в данной работе. Эта реализация может рассматриваться в качестве типовой, но необходимо иметь в виду, что другие успешные реализации имеют большие отличия от нее.

Функционирование сетей apt

Рассмотрим более детально пять фаз процесса функционирования APT:инициализацию, распознавание, сравнение, поиск и обучение.

Инициализация. Перед началом процесса обучения сети все весовые векторыB_jиT_j, а также параметр сходства, должны быть установлены в начальные значения.

Веса векторов B_jвсе инициализируются в одинаковые малые значения. Согласно [2], эти значения должны удовлетворять условию

для всехi,j, (8.1)

где т– количество компонент входного вектора, L– константа, большая 1 (обычно L = 2).

Эта величина является критической; если она слишком большая, сеть может распределить все нейроны распознающего слоя одному входному вектору.

Веса векторов T_jвсе инициализируются в единичные значения, так что

t_ij= 1 для всехj,i. (8.2)

Эти значения также являются критическими; в [2] показано, что слишком маленькие веса приводят к отсутствию соответствия в слое сравнения и отсутствию обучения.

Параметр сходства устанавливается в диапазоне от0до 1 в зависимости от требуемой степени сходства между запомненным образом и входным вектором. При высоких значенияхсеть относит к одному классу только очень слабо отличающиеся образы. С другой стороны, малое значениезаставляет сеть группировать образы, которые имеют слабое сходство между собой. Может оказаться желательной возможность изменять коэффициент сходства на протяжении процесса обучения, обеспечивая только грубую классификацию в начале процесса обучения, и затем постепенно увеличивая коэффициент сходства для выработки точной классификации в конце процесса обучения.

Распознавание. Появление на входе сети входного вектораXинициализирует фазу распознавания. Так как вначале выходной вектор слоя распознавания отсутствует, сигналG1 устанавливается в 1 функцией ИЛИ вектораX, обеспечивая все нейроны слоя сравнения одним из двух входов, необходимых для их возбуждения (как требует правило двух третей). В результате любая компонента вектораX, равная единице, обеспечивает второй единичный вход, тем самым заставляя соответствующий нейрон слоя сравнения возбуждаться и устанавливая его выход в единицу. Таким образом, в этот момент времени векторСидентичен векторуX.

Как обсуждалось ранее, распознавание реализуется вычислением свертки для каждого нейрона слоя распознавания, определяемой следующим выражением:

NET_j= (B_j•C), (8.3)

где В_j – весовой вектор, соответствующий нейронуjв слое распознавания;С– выходной вектор нейронов слоя сравнения; в этот моментСравно X; NET_j– возбуждение нейронаjв слое распознавания.

Fявляется пороговой функцией, определяемой следующим образом:

OUT_j= 1, если NET_j>T, (8.4)

OUT_j= 0 в противном случае,

где Тпредставляет собой порог.

Принято, что латеральное торможение существует, но игнорируется здесь для сохранения простоты выражении. Оно обеспечивает тот факт, что только нейрон с максимальным значением NETбудет иметь выход, равный единице; все остальные нейроны будут иметь нулевой выход. Можно рассмотреть системы, в которых в распознающем слое возбуждаются несколько нейронов в каждый момент времени, однако это выходит за рамки данной работы.

Сравнение. На этой фазе сигнал обратной связи от слоя распознавания устанавливает G1в нуль; правило двух третей позволяет возбуждаться только тем нейронам, которые имеют равные единице соответствующие компоненты векторовРиX.

Блок сброса сравнивает вектор Си входной векторX, вырабатывая сигнал сброса, когда их сходство S ниже порога сходства. Вычисление этого сходства упрощается тем обстоятельством, что оба вектора являются двоичными (все элементы либо 0, либо 1). Следующая процедура проводит требуемое вычисление сходства:

Вычислить D– количество единиц в вектореX.
Вычислить N– количество единиц в вектореС.

Затем вычислить сходство Sследующим образом:

S=N/D. (8.5)

Например, примем, что

Х = 1 0 1 1 1 0 1 D = 5

С = 00 1 1 1 0 1 N = 4

S=N/D=0,8

Sможет изменяться от 1 (наилучшее соответствие) до0(наихудшее соответствие).

Заметим, что правило двух третей делает Слогическим произведением входного вектораХи вектораР. ОднакоРравенТ_j, весовому вектору выигравшего соревнование нейрона. Таким образом,Dможет быть определено как количество единиц в логическом произведении векторовТ_j и X.

Поиск. Если сходство .S выигравшего нейрона превышает параметр сходства, поиск не требуется. Однако если сеть предварительно была обучена, появление на входе вектора, не идентичного ни одному из предъявленных ранее, может возбудить в слое распознавания нейрон со сходством ниже требуемого уровня. В соответствии с алгоритмом обучения возможно, что другой нейрон в слое распознавания будет обеспечивать более хорошее соответствие, превышая требуемый уровень сходства несмотря на то, что свертка между его весовым вектором и входным вектором может иметь меньшее значение. Пример такой ситуации показан ниже.

Если сходство ниже требуемого уровня, запомненные образы могут быть просмотрены с целью поиска, наиболее соответствующего входному вектору образа. Если такой образ отсутствует, вводится новый несвязанный нейрон, который в дальнейшем будет обучен. Для инициализации поиска сигнал сброса тормозит возбужденный нейрон в слое распознавания на время проведения поиска, сигнал G1устанавливается в единицу и другой нейрон в слое распознавания выигрывает соревнование. Его запомненный образ затем проверяется на сходство и процесс повторяется до тех пор, пока конкуренцию не выиграет нейрон из слоя распознавания со сходством, большим требуемого уровня (успешный поиск), либо пока все связанные нейроны не будут проверены и заторможены (неудачный поиск).

Неудачный поиск будет автоматически завершаться на несвязанном нейроне, так как его веса все равны единице, своему начальному значению. Поэтому правило двух третей приведет к идентичности вектора Свходному векторуX, сходствоSпримет значение единицы и критерий сходства будет удовлетворен.

Обучение. Обучение представляет собой процесс, в котором набор входных векторов подается последовательно на вход сети и веса сети изменяются при этом таким образом, чтобы сходные векторы активизировали соответствующие нейроны. Заметим, что это – неуправляемое обучение, нет учителя и нет целевого вектора, определяющего требуемый ответ.

В работе [2] различают два вида обучения: медленное и быстрое. При медленном обучении входной вектор предъявляется настолько кратковременно, что веса сети не имеют достаточного времени для достижения своих ассимптотических значений в результате одного предъявления. В этом случае значения весов будут определяться скорее статистическими характеристиками входных векторов, чем характеристиками какого-то одного входного вектора. Динамика сети в процессе медленного обучения описывается дифференциальными уравнениями.

Быстрое обучение является специальным случаем медленного обучения, когда входной вектор прикладывается на достаточно длительный промежуток времени, чтобы позволить весам приблизиться к их окончательным значениям. В этом случае процесс обучения описывается только алгебраическими выражениями. Кроме того, компоненты весовых векторов Т_jпринимают двоичные значения, в отличие от непрерывного диапазона значений, требуемого в случае быстрого обучения. В данной работе рассматривается только быстрое обучение, интересующиеся читатели могут найти превосходное описание более общего случая медленного обучения в работе [2].

Рассмотренный далее обучающий алгоритм используется как в случае успешного, так и в случае неуспешного поиска.

Пусть вектор весов В_j(связанный с возбужденным нейрономjраспознающего слоя) равен нормализованной величине вектораС. В [2] эти веса вычисляются следующим образом:

(8.6)

где с_i–i-якомпонента выходного вектора слоя сравнения; j– номер выигравшего нейрона в слое распознавания;b_ij– вес связи, соединяющей нейрон iв слое сравнения с нейрономjв слое распознавания; L– константа > 1 (обычно 2).

Компоненты вектора весов Т_j, связанного с новым запомненным вектором, изменяются таким образом, что они становятся равны соответствующим двоичным величинам вектораС:

t_ij=с_iдля всехi, (8.7)

где t_ijявляется весом связи между выигравшим нейрономjв слое распознавания и нейрономiв слое сравнения.

<<< < Предыдущая 38 39 40 41 42 43 44 45 46 47 48 4950 / 7250 51 52 53 54 55 56 57 58 59 60 61 62 > Следующая >>>

Соседние файлы в предмете Нейронные сети

#
10.12.2013162.67 Кб50Модель приниадаптивных решений.pdf
#
10.12.20131.99 Mб187Нейрокомпьютернатехника.doc
#
10.12.2013172.54 Кб82Проектирование быстрых нейронных сетей.doc
#
10.12.20133.85 Mб100Сборник методов нейроинформатики.DOC
#
10.12.2013126.98 Кб35Содержание.doc

Реализация apt

Функционирование сетей apt