В работе рассматривается один из методов повышения эффективности работы распределенных систем обработки данных – оптимальное размещение в узлах системы реплик массивов данных, используемых в системе. Данный метод позволяет обеспечить высокий уровень сохранности информации и высокую надежность работы системы, а также минимизировать затраты на ее эксплуатацию. Данный метод широко используется на практике при создании распределенных информационных систем различного назначения и масштаба.
Выполнена формулировка задачи оптимального распределения реплик нескольких взаимосвязанных массивов данных в узлах распределенной системы с ненадежными каналами связи, а также приводится эвристический алгоритм решения данной задачи. В качестве критерия оптимизации в задаче используется минимум затрат на эксплуатацию системы.
В начале работы приведены статистические данные о размере убытков, которые несут компании в случае простоя информационных систем, вызванных негативными факторами разной природы. Дан краткий обзор работ по тематике размещения данных в распределенных системах.
Далее в работе представлена формальная модель распределенной системы с ненадежными каналами, в узлах которой выполняется множество прикладных процессов, генерирующих информационные запросы к репликам массивов данных и запросы на изменение данных в репликах. Приводится формулировка задачи оптимального размещения реплик в узлах распределенной системы.
Приведен перечень шагов и формулы для определения величины средней задержки сообщений в каналах связи системы с учетом ненадежности каналов связи, а так же формулы для вычисления затрат на эксплуатацию распределенной системы с размещенными в ее узлах репликами массивов данных.
Так как сформулированная задача обладает большой вычислительной сложностью, в работе представлен эвристический алгоритм для поиска оптимального размещения реплик множества массивов данных, используемых в системе.
В заключении работы перечислено несколько перспективных направлений для продолжения исследований в области использования информационной избыточности в виде реплик массивов данных для повышения эффективности работы распределенных систем