Рассматривается проблема построения формального языка описания изображений в задачах машинной обработки визуальной информации. В качестве основного требования к этому языку выдвигается его близость к языку, которым пользуется человек при работе с изображениями. Формулируется и экспериментально обосновывается гипотеза, согласно которой основные элементы языка описания — локальные геометрические особенности изображения — выделяются с помощью специальной поисковой функции, заданной на изображении. На основе этой гипотезы строится ряд конструктивных моделей зрительного восприятия человека, а также система алгоритмов автоматического формирования языка описания изображений. Приводятся результаты экспериментального обоснования этих моделей и алгоритмов. Рассматриваются возможности применения этих алгоритмов к построению систем диалога человека и вычислительной машины.