Порівняння моделей забезпечення узгодженості даних у розподілених системах керування базами даних
Андрій Миргородський, Оксана РоманюкВикористання розподіленої інфраструктури для забезпечення масштабованості та високої доступності створює нові виклики для підтримки узгодженості даних між вузлами інформаційних систем, що стрімко зростають та вимагають надійного управління даними для коректної роботи. Метою дослідження була комплексна систематизація та порівняльний аналіз методів забезпечення узгодженості даних у розподілених системах керування базами даних, враховуючи фундаментальні компроміси між узгодженістю, доступністю та затримками оновлення, що описуються теоремами CAP та PACELC. Для досягнення мети було використано методи теоретичного аналізу, формального моделювання поведінки систем та порівняльного експертного оцінювання. В результаті дослідження було систематизовано моделі узгодженості за двома основними підходами: інформаційно-орієнтованим та клієнтоорієнтованим. В рамках першого підходу проаналізовано моделі, що визначають глобальну поведінку системи: лінеаризовність, послідовну, причинну та кінцеву узгодженість. Для кожної моделі визначено переваги, недоліки та типові сценарії застосування. У рамках другого підходу розглянуто клієнтоорієнтовані моделі, що надають гарантії в межах сесії одного користувача: узгодженість читання і запису, монотонне зчитування, монотонний запис та сесійну причинність. Запропоновано узагальнену класифікацію, яка візуалізує співвідношення між ступенем узгодженості, затримками, гнучкістю, стійкістю до збоїв та потенційною продуктивністю для кожної моделі. Проведено порівняння усіх розглянутих моделей узгодженості даних за допомогою ряду відібраних істотних характеристик (клас за PACELC, узгодженість, стійкість до збоїв, потенційна продуктивність тощо) та діаграм на основі їх параметрів. Практична цінність роботи полягає у формулюванні чітких рекомендацій щодо вибору оптимальної моделі узгодженості залежно від вимог до надійності, продуктивності та архітектурних особливостей інформаційної системи. Результати можуть бути використані для підвищення ефективності проектування розподілених баз даних у високонавантажених системах, таких як фінансові сервіси, платформи Інтернету речей та хмарні застосунки
Використані джерела
[1] Abadi, D. (2012). Consistency tradeoffs in modern distributed database system design: CAP is only part of the story. Computer, 45(2), 37-42. doi: 10.1109/mc.2012.33.
[2] Ahmed, J., Karpenko, A., Tarasyuk, O., Gorbenko, A., & Sheikh-Akbari, A. (2023). Consistency issue and related tradeoffs in distributed replicated systems and databases: A review. Radioelectronic and Computer Systems, 2(106), 171-179. doi: 10.32620/reks.2023.2.14.
[3] Aldin, H.N.S., Deldari, H., Moattar, M.H., & Ghods, M.R. (2019). Consistency models in distributed systems: A survey on definitions, disciplines, challenges and applications. ArXiv. doi: 10.48550/arXiv.1902.03305.
[4] Aldin, H.N.S., Deldari, H., Moattar, M.H., & Ghods, M.R. (2020). Strict timed causal consistency as a hybrid consistency model in the cloud environment. Future Generation Computer Systems, 105(C), 259-274. doi: 10.1016/j.future.2019.11.038.
[5] Almeida, P.S. (2024). A framework for consistency models in distributed systems. ArXiv. doi: 10.48550/arXiv.2411.16355.
[6] Brewer, E. (2012). CAP twelve years later: How the “rules” have changed. Computer, 45(2), 23-29. doi: 10.1109/mc.2012.37.
[7] Campêlo, R.A., Casanova, M.A., Guedes, D.O., & Laender, A.H.F. (2020). A brief survey on replica consistency in cloud environments. Journal of Internet Services and Applications, 11(1), article number 1. doi: 10.1186/s13174-020-0122-y.
[8] Cattell, R. (2011). Scalable SQL and NoSQL data stores. ACM SIGMOD Record, 39(4), 12-27. doi: 10.1145/1978915.1978919.
[9] Chen, Y., Pan, A., Lei, H., Ye, A., Han, S., Tang, Y., Lu, W., Chai, Y., Zhang, F., & Du, X. (2024). TDSQL: Tencent distributed database system. Proceedings of the VLDB Endowment, 17(12), 3869-3882. doi: 10.14778/3685800.3685812.
[10] Diogo, M., Cabral, B., & Bernardino, J. (2019). Consistency models of NoSQL databases. Future Internet, 11(2), article number 43. doi: 10.3390/fi11020043.
[11] Faria, N., & Pereira, J. (2025). CRDV: Conflict-free replicated data views. Proceedings of the ACM on Management of Data, 3(1), 1-27. doi: 10.1145/3709675.
[12] Ghasemirad, S., Sprenger, C., Liu, S., Multazzu, L., & Basin, D. (2025). Pushing the limit: Verified performance-optimal causally-consistent database transactions. In A. Gurfinkel & M. Heule (Eds.), Tools and algorithms for the construction and analysis of systems. TACAS 2025. Lecture notes in computer science (Vol. 15698, pp. 43-62). Cham: Springer.doi: 10.1007/978-3-031-90660-2_3.
[13] Golab, W. (2018). Proving PACELC. SIGACT News, 49(1), 73-81. doi: 10.1145/3197406.3197420.
[14] Gorbenko, A., Karpenko, A., & Tarasyuk, O. (2020). Analysis of trade-offs in fault-tolerant distributed computing and replicated databases. In 2020 IEEE 11th international conference on dependable systems, services and technologies (DESSERT) (pp. 1-6). Kyiv: IEEE. doi: 10.1109/DESSERT50317.2020.9125078.
[15] Junfeng, T., Wenqing, B., & Haoyi, J. (2022). PGCE: A distributed storage causal consistency model based on partial geo-replication and cloud-edge collaboration architecture. Computer Networks, 212(C), article number 109065. doi: 10.1016/j.comnet.2022.109065.
[16] Lourenço, J.R., Cabral, B., Carreiro, P., Vieira, M., & Bernardino, J. (2015). Choosing the right NoSQL database for the job: A quality attribute evaluation. Journal of Big Data, 2(1), article number 18. doi: 10.1186/s40537-015-0025-0.
[17] Mahfoud, Z., & Nouali-Taboudjemat, N. (2019). Consistency in cloud-based database systems. Informatica, 43(3), 313-319 . doi: 10.31449/inf.v43i3.2650.
[18] Mahmoud, H.A., & Yasin, H.M. (2025). Data integrity and consistency challenges in distributed database systems. Engineering and Technology Journal, 10(5), 5077-5086. doi: 10.47191/etj/v10i05.36.
[19] Muñoz-Escoí, F.D., de Juan-Marín, R., García-Escrivá, J.-R., González de Mendívil, J.R., & Bernabéu-Aubán, J.M. (2019). CAP theorem: Revision of its related consistency models. The Computer Journal, 62(6), 943-960. doi: 10.1093/ comjnl/bxy142.
[20] Myrhodskyy, A.V., Romanyuk, O.V., Romanyuk, O.N., & Titova, N.V. (2023). Development of a high availability method for configuration management software. Optoelectronic Information-Power Technologies, 46(2), 64-75. doi: 10.31649/1681-7893-2023-46-2-64-75.
[21] Nguyen, D., Charapko, A., Kulkarni, S.S., & Demirbas, M. (2019). Using weaker consistency models with monitoring and recovery for improving performance of key-value stores. Journal of the Brazilian Computer Society, 25(1), article number 10. doi: 10.1186/s13173-019-0091-9.
[22] Park, S., Kim, J., Mulder, I., Jung, J., Lee, J., Krebbers, R., & Kang, J. (2024). A proof recipe for linearizability in relaxed memory separation logic. Proceedings of the ACM on Programming Languages, 8(PLDI), 175-198. doi: 10.1145/3656384.
[23] Perrin, M., Petrolia, M., Mostéfaoui, A., Jard, C. (2016). On composition and implementation of sequential consistency. In C. Gavoille & D. Ilcinkas (Eds.), Distributed computing. DISC 2016. Lecture notes in computer science (Vol. 9888, pp 284-297). Berlin: Springer. doi: 10.1007/978-3-662-53426-7_21.
[24] Pradeep, B. (2023). Data consistency models in distributed systems: CAP theorem revisited. International Journal on Science and Technology, 14(3). doi: 10.5281/zenodo.14631471.
[25] Rabeshko, Yu. , & Turbal , Yu. (2023). Review of joint text editing algorithms Conflict-free Replicated Data Types (CRDT). Bulletin of Cherkasy State Technological University, 28(4), 10-18. doi: 10.62660/2306-4412.4.2023.10-18.
[26] Russel, D., Dawson, R., Chen, N., & Chambers, A. (2025). Consistency models and verification in modern distributed systems. Retrieved from https://www.researchgate.net/publication/389598133_Consistency_Models_and_Verification_in_ Modern_Distributed_Systems.
[27] Taghinezhad-Niar, A. (2024). A client-centric consistency model for distributed data stores using colored petri nets. In 10th international conference on web research (ICWR) (pp. 309-314). Tehran: IEEE. doi: 10.1109/ ICWR61162.2024.10533365.
[28] Viotti, P., & Vukoli , M. (2016). Consistency in non-transactional distributed storage systems. ACM Computing Surveys (CSUR), 49(1), article number 19. doi: 10.1145/2926965.
[29] Wang, C., Mohror, K., & Snir, M. (2024). Formal definitions and performance comparison of consistency models for parallel file systems. IEEE Transactions on Parallel and Distributed Systems, 35, 1092-1106. doi: 10.1109/ TPDS.2024.3391058.
[30] Xu, Q., Yang, C., & Zhou, A. (2024). Native distributed databases: Problems, challenges and opportunities. Proceedings of the VLDB Endowment, 17(12), 4217-4220. doi: 10.14778/3685800.3685839.