Сеть с прямой связью состоит из слоев нейронов. Первый слой, входной, получает информацию или вводы извне. Этот слой состоит из независимых переменных, например значении цен или индикаторов, на которых основывается система в последующих заключениях или прогнозах. Этот слой имеет множество связей со следующим, называемым скрытым слоем, поскольку он не имеет связей с внешним миром. Выходы этого слоя подаются на следующий слой, который может быть также скрытым (если это так, то процесс повторяется) или выходным слоем. Каждый из нейронов выходного слоя выдает сигнал, основанный на прогнозах, классификациях или решениях, сделанных сетью. Сети обычно определяются по количеству нейронов в каждом слое; например сеть 10- 3- 1 состоит из 10 нейронов во входном, 3 в скрытом и 1 в выходном слое. Сети бывают различного размера — от нескольких нейронов до тысяч и от всего трех слоев до десятков; сложность зависит от размаха решаемой задачи. Практически всегда бывает достаточно трех- четырех слоев.
Нейронные сети с прямой связью (аналоги использованной в этой главе) включают особую форму нелинейной множественной регрессии. Сеть берет ряд входных переменных и использует их для прогнозирования цели задания, как и при регрессии. В стандартной множественной линейной регрессии, например, если ставится задача предсказать уровень холестерола (зависимая переменная) на основе потребления жиров и физической нагрузки (независимые входные переменные), то данные будут моделироваться следующим образом: прогнозируемый уровень холестерола = а + b х потребление жиров + с X нагрузку, где значения a, b и с будут определяться статистической процедурой. Будет производиться поиск множества решений задачи, которое может быть линией, плоскостью или гиперплоскостью (в зависимости от количества переменных) согласно правилу наименьших квадратов. В вышеприведенной задаче все решения находятся на плоскости: ось х представляет потребление жиров, ось у—физическую нагрузку, высота плоскости в каждой точке (х, у) представляет собой прогнозируемый уровень холестерола.
При использовании технологии нейронных сетей двумерная плоскость или n- мерная гиперплоскость множественной линейной регрессии заменяется гладкой n- мерной изогнутой поверхностью с пиками и провалами, хребтами и оврагами. Например, нам требуется найти оптимальное решение для набора переменных, и задача будет сводиться к построению многомерной карты. В нейронной сети решение достигается при помощи нейронов — взаимосвязанных нелинейных элементов, связи которых сбалансированы так, чтобы подгонять поверхность подданные. Алгоритм обучения производит регулировку весов связей для получения максимально вписывающейся в исходные данные конфигурации поверхности. Как и в случае со стандартной множественной регрессией, где коэффициенты регрессии необходимы для определения наклона гиперповерхности, для нейронной модели требуются параметры (в виде весов связей), чтобы обеспечить наилучшее совпадение построенной поверхности, всех ее возвышений и впадин, с входными данными.