Дедубликация в системе резервного копирования с хранением информации в базе данных


https://doi.org/10.18255/1818-1015-2017-2-215-226

Полный текст:


Аннотация

Профилактика потери данных с цифровых носителей включает такой процесс, как резервное копирование. Он может проводиться вручную простым копированием данных на внешние носители или автоматизированно по расписанию с помощью специальных программных средств. Существуют системы удаленного резервного копирования, когда данные сохраняются по сети в удаленное хранилище. Такие системы являются многопользовательскими и обрабатывают большие объемы данных. В общем хранилище могут встретиться файлы, содержащие одинаковые фрагменты. Для исключения повторяющихся данных применяется механизм дедубликации (англ. de-duplication). Он представляет собой метод сжатия информации, когда поиск копий производится по всему массиву данных, а не в пределах одного файла. Главным преимуществом использования данной технологии является существенная экономия дискового пространства. Однако механизм исключения повторяющихся данных может существенно снизить скорость сохранения и восстановления информации. Настоящая статья посвящена проблеме реализации такого механизма в системе резервного копирования с хранением информации в реляционной базе данных. В данной работе рассматривается пример реализации такой системы, работающей в двух режимах: с дедубликацией данных и без нее. В статье приведен пример схемы классов для разработки клиентской части приложения, а также описание таблиц и связей между ними в базе данных, что относится к серверной части. Далее автор предлагает алгоритм сохранения данных с дедубликацией, а также приводит результаты сравнительных тестов скорости работы алгоритмов сохранения и восстановления информации при работе с реляционными системами управления базами данных разных производителей.


Об авторе

Сергей Максимович Таранин
Ярославский государственный университет им. П.Г. Демидова
Россия

 аспирант

ул. Советская, 14, г. Ярославль, 150003 Россия



Список литературы

1. Таранин С.М., “Резервное копирование с хранением в базе данных”, Моделирование и анализ информационных систем, 23:4 (2016), 479–491; [Taranin S.M., “Backup with Storage in a Database”, Modeling and Analysis of Information Systems, 23:4 (2016), 479– 491, (in Russian).]

2. Казаков В.Г., Федосин С.А., “Технологии и алгоритмы резервного копирования”, Всероссийский конкурсный отбор обзорно-аналитических статей по приоритетному направлению Информационно-телекоммуникационные системыы, 2008, 1– 49; [Kazakov V. G., Fedosin S. A., “Technologii i algoritmi reservnogo kopirovania”, Vserossiyskiy konkursniy otbor obzorno-analiticheskih statey po prioritetnomu napravleniu ”Informacionno-telekommunikacionnie sistemi”, 2008, 1–49, (in Russian).]

3. Medeiros J., “NTFS Forensics: A Programmers View of Raw Filesystem Data Extraction”, Grayscale Research, 2008, 1–27.

4. Казаков В.Г., Федосин С.А., Плотникова Н.П., “Способ адаптивной дедупликации с применением многоуровневого индекса размещения копируемых блоков данных”, Фундаментальные исследования, 2013, №8, 1322–1325; [Kazakov V. G., Fedosin S. A., Plotnikova N. P., “Method of adaptive dedublication with multilevel block indexing”, Fundamental research, 2013, № 8, 1322–1325].

5. Sears R., Catharine van Ingen, Gray J., To BLOB or Not To BLOB: Large Object Storage in a Database or a Filesystem? Technical Report MSR-TR-2006-45, 2006, 1–11.

6. Zhu N., Chiueh T., “Portable and Efficient Continuous Data Protection for Network File Servers”, Stony Brook University, 2007, 1–17.

7. Meyer D. T., Bolosky W. J., “A Study of Practical Deduplication”, ACM Transactions on Storage, 7:4 (2012), 1–13.

8. Storer M. W., Greenan K., Long D. D. E., Miller E. L., “Secure Data Deduplication”, Proceedings of the 4th ACM international workshop on Storage security and survivability, 2008, 1–10.

9. Renzel K., Keller W., “Client/Server Architectures for Business Information Systems”, A Pattern Language, 1997, 1–25.

10. Дейт К. Дж., Введение в системы баз данных, 8, Вильямс, 2005; In English: Date C. J., An Introduction to Database Systems, 8, Pearson Education, Inc., 2004.

11. Грофф Д., Вайнберг П., Оппель Э., SQL: полное руководство, 3, Вильямс, 2015; In English: Groff J., Weinberg P., Oppel A., SQL The Complete Reference, 3, The McGraw- Hill Companies, 2010.

12. Дейт К.Дж., SQL и реляционная теория. Как грамотно писать код на SQL, СимволПлюс, 2010; In English: Date C. J., SQL and Relational Theory. How to Write

13. Accurate SQL Code, O’Reilly Media Inc., 2009.

14. Mistry R., Misner S., Introducing Microsoft SQL Server 2008 R2, Microsoft Press, 2010.

15. Максимов В., Козленко Л.А., Маркин С.П., Бойченко И.А., “Защищенная реляционная СУБД Линтер”, Открытые системы. СУБД, 1999, №11–12; [Maksimov V., Kozlenko L. A., Markin C. P., Bojchenko I. A., “Zashchishchennaya relyacionnaya SUBD Linter”, Otkrytye sistemy. SUBD, 1999, № 11–12, (in Russian).]

16. Таненбаум Э., Бос Х., Современные операционные системы, 4, Питер, 2015; In English: Tanenbaum A. S., Bos H., Modern Operating Systems, 4, Pearson Education, Inc., 2015.


Дополнительные файлы

Для цитирования: Таранин С.М. Дедубликация в системе резервного копирования с хранением информации в базе данных. Моделирование и анализ информационных систем. 2017;24(2):215-226. https://doi.org/10.18255/1818-1015-2017-2-215-226

For citation: Taranin S.M. De-duplication on the Backup System with Information Storage in a Database. Modeling and Analysis of Information Systems. 2017;24(2):215-226. (In Russ.) https://doi.org/10.18255/1818-1015-2017-2-215-226

Просмотров: 323

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-1015 (Print)
ISSN 2313-5417 (Online)