English
!

Доклады

Проблема повышения точности компьютерного зрения с использованием сверточной нейронной сети для программируемых робототехнических систем на платформе «Arduino»

Алакина-Каминская А.И., Охапкин В.П.

Российский государственный гуманитарный университет, Институт информационных наук и технологий безопасности, каф. Комплексной защиты информации, каф. Информационных технологий и систем, Россия, 117534, Москва, ул. Кировоградская, д. 25, корп. 2, тел. 8(495)250-62-66, alina.ak1999@gmail.com, vpokhapkin@yandex.ru

Синтез математических методов распознавания образов и технических средств в промышленности и производстве создал обширную область в инженерном направлении. Первые теоретические разработки в области распознавания образов были сделаны учеными Советского Союза и относятся к началу второй половины XX века. Среди них нужно отметить исследования ученых АН СССР А. А. Харкевича, В. М. Глушкова, В.С. Михалевича, В.С. Пугачёва, академика РАН Ю.И. Журавлева и работы других отечественных и зарубежных ученых в области теории кибернетики, функционального анализа, стохастических систем, теории машинного обучения.

Развитие робототехнических систем выявило новые проблемы в разработке методов и алгоритмов распознавания образов: объекты распознавания, находящиеся под углом в момент фиксации кадра.

Одним из подходов к эффективному опознанию образов является свёрточная нейронная сеть (далее СНС) [1]. В основе такой сети лежит операция свёртки, позволяющая анализировать исходное изображение, перемещая ограниченную по размеру матрицу весов (иначе, ядро свертки). В теории алгоритма СНС ядро свёртки можно рассматривать в качестве графического кода признаков, например, некоторого объекта, расположенного под углом к устройству фиксации изображения. Тогда, всякий последующий слой СНС будет получать карту признаков анализируемого изображения.

Гипотеза: существует такое ядро свертки, сингулярное разложение которого позволяет выполнить поворот и масштабирование анализируемого изображения в пространстве размерностью .

Вычислительный эксперимент с целью проверки сформулированной гипотезы реализуется на базе роботизированной платформы «ARDUINO» с предустановленным модулем видеокамеры.

Литература

Lecun Y, Bengio Y. Convolutional networks for images, speech, and time-series // The handbook of brain theory and neural networks, Vol. 3361, Issue 10, 1995, pp. 1995-2009

© 2004 Дизайн Лицея Информационных технологий №1533