Часто более предпочтительным методом предварительной обработки входных данных АНС, чем выравнивание по дисперсии, является метод выравнивания по гистограмме. Этот метод позволяет преобразовать произвольное исходное распределение значений показателей в почти равномерное. Выравнивание по гистограмме выполняется для каждого показателя в отдельности следующим образом. Если имеется гистограмма, построенная на 100 интервалах N финансовых отчетов, из которых берется N значений показателя x , то N /100 наименьших значений x , заменяются на 1, следующие N /100 наименьших значений заменяются на 2 и т.д. Наконец, N /100 наибольших значений x заменяются на 100. Если в исходных данных присутствуют равные значения финансовых показателей, длина соответствующего интервала должна быть скорректирована таким образом, чтобы равные значения попадали в один и тот же интервал, приобретая, таким образом, равные значения и после выравнивания.
Еще одним способом предварительной обработки входных данных является нормализация отклонений значений компонент. Однако следует иметь в виду, что данный способ чувствителен к исключительно высоким значениям. В результате при обучении АНС предпочтение отдается незначительному числу случаев.
В ряде случаев (например, при сравнении эффективности работы различных предприятий) исследователя интересуют относительные, а не абсолютные показатели.
В таких обстоятельствах финансовые данные по каждому предприятию должны нормализоваться в соответствии с величиной валюты баланса предприятия.
При отсутствии предварительных соображений, обуславливающих осмысленный выбор способа нормирования, как и в случае подбора обучающих параметров АНС, целесообразно определить наилучший метод путем тестирования разных способов нормирования. Нормиро-вание входных данных является весьма существенной частью их предварительной обработки. Результат обучения АНС в значительной степени зависит от того, насколько правильно были определены соотношения между параметрами, иными словами, от масштабирования.
Изменяя факторы масштабирования, можно исследовать различные характеристики массива входных данных. В некоторых случаях, когда требуется выявить закономерности в структуре отдельных параметров или отдельных групп параметров, эксперименты с различными масштабами дают возможность повысить чувствительность АНС к выбранным параметрам. Часто различие в масштабе показателей тесно связано с выбором наиболее важных входных переменных. При этом АНС как бы разбивает пространство входных данных на области, в которых группируются сходные по выбранным признакам объекты. Топология плоскости выходных параметров упорядочивается согласно доминирующим компонентам, остальные же компоненты усредняются. АНС представляет собой удобный интерфейс для исследования данных, организованных в соответствии со значениями главных компонент. Масштабирование изменяет топологическую структуру плоскости. Компоненты, подвергшиеся масштабированию в наибольшей степени, представляют собой топологически компактные области, особенно в случае, когда речь идет об основных компонентах множества данных. Слабо масштабированные компоненты образуют подобласти внутри основных областей.