Нейрокомпьютерные системы



              

Предобработка данных


Нормировка и центрирование данных (предобработка) используются почти всегда (кроме тех случаев, когда данные представляют собой бинарные векторы с координатами 0,1 или

\pm1
, либо символьные последовательности). Цель этих преобразований - сделать так, чтобы каждая компонента вектора данных лежала в отрезке
[-1,1]
(или
[0,1]
) или, по крайней мере, не слишком далеко выходила из этого отрезка, и её характерный разброс тоже был бы единичным.

Стандартные преобразования исходной выборки

x^p, p \,{=}\, 1,2, \ldots, M
:

x_i^p =[x_i^p - M(x_i^p)]/ \sigma(x_i^p)
или
x_i^p =[x_i^p - M(x_i^p)]/ max | x_i^p - M(x_i^p)|
, где
x_i^p
-
i
-я компонента вектора
x^p
,

M(x_i^p) = (\sum {x_i^p})/n
- выборочная оценка математического ожидания
x_i^p
;

\sigma(x_i^p) = \{\sum_i^p[x_i^p - M(x_i^p)]^2/n\}^{1/2}
- выборочная оценка среднего квадратичного отклонения. Любое изменение выборки
\{x^p\}
должно, согласно этим формулам, менять и нормировку. Нормировка и центрирование вписывают исходную выборку в куб со стороной 2, вершинами которого являются векторы с координатами
\pm 1
.




Содержание  Назад  Вперед