Сигмоидальный нейрон

Сигмоидальный нейрон устраняет основной недостаток персептрона — разрывность функции активации

. Структурная схема нейрона данного типа представлена на рис. 1.

Рис. 1. Структурная схема сигмоидального нейрона

В качестве функции активации

выступает сигмоидальная функция (т.е. функция, график которой похож на букву "S"). На практике используются как униполярные, так и биполярные функции активации.

Униполярная функция, как правило, представляется формулой

тогда как биполярная функция задается в виде

Графики униполярных и биполярных сигмоидальных функций представлены на рис. 2 и рис. 3 соответственно.

Рис. 2. График униполярной сигмоидальной функции

Рис. 3. График биполярной сигмоидальной функции

Коэффициент

определяет "крутизну" функций и выбирается разработчиком сети (на практике

для упрощения назначают обычно равным 1).

Производная униполярной функции активации имеет вид

а производная биполярной функции —

Графики производных имеют колоколобразный вид и представлены на рис. 4 и рис. 5.

Рис. 4. График производной униполярной сигмоидальной функции

Рис. 5. График производной биполярной сигмоидальной функции

Для обучения сигмоидального нейрона используется стратегия "с учителем", однако, в отличие от персептрона, для поиска минимума целевой функции

здесь используются методы поисковой оптимизации первого порядка, в которых целенаправленное изменение весовых коэффициентов

осуществляется в направлении отрицательного градиента

-ая компонента вектора градиента имеет вид

Обозначив

, имеем

Также возможно обучение сигмоидального нейрона и дискретным способом — сериями циклов уточнения входных весов для каждой эталонной пары

(см. правило персептрона). При этом коррекция весов после каждого цикла выполняется по следующей формуле:

где

— коэффициент обучения, значение которого выбирается из диапазона (0, 1).

Необходимо напомнить, что все методы поисковой оптимизации первого порядка — это методы локального поиска, не гарантирующие достижения глобального экстремума. В качестве попытки преодолеть этот недостаток было предложено обучение с моментом, в котором коррекция весов выполняется следующим образом:

Последнее слагаемое в формуле называется моментом и характеризует фактическое изменение веса в предыдущем цикле (

выбирается в диапазоне (0, 1)). Существует надежда, что при приближении к точке локального минимума (где градиентная составляющая

стремится к нулю) составляющая момента выведет поиск из области локального минимума в более перспективную область.