Часто более предпочтительным методом предварительной


Часто более предпочтительным методом предварительной обработки входных данных АНС, чем выравнивание по дисперсии, является метод выравнивания по гистограмме. Этот метод позволяет преобразовать произвольное исходное распределение значений показателей в почти равномерное. Выравнивание по гистограмме выполняется для каждого показателя в отдельности следующим образом. Если имеется гистограмма, построенная на 100 интервалах N финансовых отчетов, из которых берется N значений показателя x , то N /100 наименьших значений x , заменяются на 1, следующие N /100 наименьших значений заменяются на 2 и т.д. Наконец, N /100 наибольших значений x заменяются на 100. Если в исходных данных присутствуют равные значения финансовых показателей, длина соответствующего интервала должна быть скорректирована таким образом, чтобы равные значения попадали в один и тот же интервал, приобретая, таким образом, равные значения и после выравнивания.

Еще одним способом предварительной обработки входных данных является нормализация отклонений значений компонент. Однако следует иметь в виду, что данный способ чувствителен к исключительно высоким значениям. В результате при обучении АНС предпочтение отдается незначительному числу случаев.

В ряде случаев (например, при сравнении эффективности работы различных предприятий) исследователя интересуют относительные, а не абсолютные показатели.

В таких обстоятельствах финансовые данные по каждому предприятию должны нормализоваться в соответствии с величиной валюты баланса предприятия.

При отсутствии предварительных соображений, обуславливающих осмысленный выбор способа нормирования, как и в случае подбора обучающих параметров АНС, целесообразно определить наилучший метод путем тестирования разных способов нормирования. Нормиро-вание входных данных является весьма существенной частью их предварительной обработки. Результат обучения АНС в значительной степени зависит от того, насколько правильно были определены соотношения между параметрами, иными словами, от масштабирования.

Изменяя факторы масштабирования, можно исследовать различные характеристики массива входных данных. В некоторых случаях, когда требуется выявить закономерности в структуре отдельных параметров или отдельных групп параметров, эксперименты с различными масштабами дают возможность повысить чувствительность АНС к выбранным параметрам. Часто различие в масштабе показателей тесно связано с выбором наиболее важных входных переменных. При этом АНС как бы разбивает пространство входных данных на области, в которых группируются сходные по выбранным признакам объекты. Топология плоскости выходных параметров упорядочивается согласно доминирующим компонентам, остальные же компоненты усредняются. АНС представляет собой удобный интерфейс для исследования данных, организованных в соответствии со значениями главных компонент. Масштабирование изменяет топологическую структуру плоскости. Компоненты, подвергшиеся масштабированию в наибольшей степени, представляют собой топологически компактные области, особенно в случае, когда речь идет об основных компонентах множества данных. Слабо масштабированные компоненты образуют подобласти внутри основных областей.

Содержание раздела