singlepost

Нейронные сети: масштабирование входа << На главную или назад  

Доброго времени суток.
Захотелось написать нейронную сеть. Но вот вопрос: как быть с размером объектов? Ведь объект может быть и большой и маленький. И при нормализации матрицы весов это может повлиять на качество. Что делать? Каждый раз сжимать или разжимать картинку до размеров матрицы или создавать кучу матриц весов разного размера? По-моему ни то ни другое не практично. Так как быть? Или поворот. Что делать если объект вращается? Ведь если ничего не делать, то весы в результате испортятся, т.е. например при поиске квадрата, если он будет вращаться, то в весах будет такая же картинка как и при поиске круга. А это не хорошо…
С нетерпением жду ваших советов)
P.S. скачал книгу "Хайкин Саймон. Нейронные сети. Полный курс." но дошел пока только до сотых страниц. Уверен, что там это написано, но все таки хотелось бы получить ответ побыстрее)

21 ответов в теме “Нейронные сети: масштабирование входа”

  1. 5
    Николай Немов ответил:

    все понятно, большое спасибо!

  2. 4
    Николай Митропольский ответил:

    Ну можно и картинку масштабировать… можно еще добавить какойнить кластеризующий элемент… карту кохонена или что-то в этом роде.

    Но вообще, как правильно написал Андрей (aka_md6) Горбоконь, нужны дескрипторы(признаки) входного объекта. Какие именно признаки вы должны выбрать, нужна ли вам инвариантность к повороту и т.п. – и есть основная задача при использовании нейросетей.

  3. 3
    Антон Щиров ответил:

    Ну а масштаб убирает преобразование Фурье

  4. 2
    Андрей Горбоконь ответил:

    > как быть с размером объектов

    Для одной и той сети – входной вектор должен иметь одинаковый размер для всех образцов.

    Передавать картинку на вход нейросети – как уже заметили нецелесообразно для производительности. Лучше извлекать признаки – а затем подавать на вход векторы признаков, желательно, чтобы для различных образцов – векторы были ортогональными.

    > Или поворот. Что делать если объект вращается?

    Стабилизировать картинку при повороте может помочь, например, преобразование Хаффа

    > но дошел пока только до сотых страниц

    Если до сотых страниц, это значит вы дошли только до описания алгоритмов обучения. Читайте дальше… Все что вы прочитали – это только теория в чистом виде…

  5. 1
    Евгений Баталов ответил:

    Я не спец, но по-моему сама работа нейросетей не подразумевает простого и красивого обхода таких проблем. для искажений и поворота лучше вроде вектора-но не просто признаки вытаскивать самому, ибо много пересечений по признакам с другими, а также ручной подбор всяких доверительных и нтервалов ипогрешностей (Как в числ методах).

Клуб программистов работает уже ой-ой-ой сколько, а если поточнее, то с 2007 года.