В настоящее время протеомика и анализ генома являются чрезвычайно важными и актуальными направлениями исследований. Так, например, недавно был расшифрован геном утконоса [1]. Подобные научные работы помогают понять, как зародилась жизнь, ее эволюцию, а также найти методы борьбы с заболеваниями. Однако большинство алгоритмов идентификации белков являются достаточно трудоемкими и занимают длительное время расчетов на суперкомпьютерах. Подробный обзор существующих подходов и алгоритмов приведен в [2].
В данной работе предложены приближенные методы качественного и количественного анализа белков на основе данных спектрометрии. В отличие от широко применяемых методов, таких как [3] и [4], приближенные алгоритмы дают неточные решения, но работают гораздо быстрее. Предложенные методы позволяют получить оценочные данные об исследуемом образце, и на их основе выстроить дальнейшую более обстоятельную работу по изучению.
Для удаления шумов на спектрограммах применен метод, аналогичный методу, применяемой в вычислительной фотографии [5]. После удаления шумов необходимо идентифицировать пики. Предлагается сведение данной задачи к задаче о рюкзаке. Предложен подход для приближенного восстановления исходной последовательности на основе данных, полученных в процессе идентификации пиков спектрограммы.