覚えておきたいクラウド&データのキホン(第10回) レプリケーションとは何か?バックアップとの違いは?

クラウド・共有 データ保護・バックアップ

公開日:2022.03.31

 「レプリケーション」という言葉をご存じでしょうか。レプリケーションはサーバーやデータベースなどにあるデータをリアルタイムで複製し、機器の故障や災害といったアクシデントに備えることを示す言葉です。

 今回はレプリケーションを行うメリット・デメリット、レプリケーションとバックアップの違いなどについて整理します。

レプリケーションとは

 レプリケーションとは、前述の通り企業が利用するサーバーやデータベースなどにあるデータをリアルタイムで複製する技術を示す言葉です。複製したデータ(レプリカ)を別のサーバーやデータベースに作成することで、万が一、複製元でトラブルや障害が発生してもすぐに複製先のデータへ切り替えられるので、事業やサービスのシームレスな継続が期待できます。

 レプリケーションは「データを保管するサーバーやデータベースの負荷を分散する」というメリットにもつながります。サーバーやデータベース内にあるデータに大量のアクセスが発生すると大きな負担がかかります。複製先となる複数のサーバーやデータベースにアクセスを分散すれば、負荷軽減が期待できます。

バックアップとは

 レプリケーションと似た言葉として「バックアップ」があります。バックアップも、データを別のサーバーやデータベースに保管することです。データを自動でバックアップするツールを活用すれば、レプリケーションと似たような感覚で扱えます。

 ただし、バックアップはレプリケーションのように複製先のデータを使って負荷を軽減することはできません。またバックアップはレプリケーションのようにリアルタイムで複製せず、日付や曜日など一定期間ごとに行うのが一般的です。

レプリケーションのメリット・デメリット

 レプリケーションとバックアップには、それぞれにメリット・デメリットが存在します。まずはレプリケーションのメリット・デメリットを見ていきましょう。

メリット1:災害時にも事業やサービスを継続できる
 災害はいつどこで起こるかわかりません。災害が起きると、場合によってはサーバーやデータベースの設置場所に停電や地震が発生し、保管していたデータが消失する可能性もあります。

 しかし、レプリケーションで異なる場所に複製しておけば、仮に災害が起きて複製元のサーバーやデータベースに障害が発生しても、複製したデータを用いて迅速に復旧できます。

メリット2:負荷を分散できる
 1つのサーバーやデータベースに大量のアクセスが集中すると負荷がかかり、最悪の場合、データにアクセスできなくなることもあります。しかし、レプリケーションで複数のサーバーやデータベースに複製し、アクセスを複製先に分散することで、負荷の軽減が期待できます。

デメリット1:ネットワークやシステムに負荷がかかる
 レプリケーションはデータの更新があるごとに複製しているため、ネットワークやシステムに負荷がかかりやすい傾向があります。負荷がかかり過ぎるとサーバーやデータベースへのアクセスに影響を及ぼす可能性があります。

デメリット2:複製したくないデータも複製してしまう
 レプリケーションはリアルタイムでデータを複製するため、破損したデータやウイルスに感染したデータなど、複製したくないデータも複製されるというデメリットがあります。

バックアップのメリット・デメリット

 次に、レプリケーションと比較した際のバックアップのメリット・デメリットを見ていきましょう。

メリット1:データを失うリスクの軽減
 データをバックアップすることで、データの消失や紛失などのリスクを軽減します。この点においては、レプリケーションも同じです。

メリット2:ロールバックできる
 レプリケーションはリアルタイムにデータを複製するため、データが破損したりウイルスに感染したりした場合、復元できません。バックアップであれば過去に遡って復元できるので、破損前あるいはウイルス感染前のデータを入手できる可能性が高まります。

デメリット1:バックアップしたデータが古い可能性がある
 レプリケーションと比べて、バックアップはリアルタイムではなく一定期間ごとに行われるのが一般的です。最後にバックアップしてからデータが更新された場合、当然ながらそのデータはバックアップをしていない状態となります。最新のデータも残したい場合はレプリケーションとバックアップの併用を検討する必要があります。

デメリット2:ストレージのコストが高くなることがある
 バックアップするデータ量の増加やバックアップしたデータの保存期間の影響で、サーバーやデータベースのストレージ容量が増え、コストが高くなる可能性があります。データの圧縮や保存期間の見直しを行うことで防ぐことができます。

まとめ

 レプリケーションはサーバーやデータベース内のデータをリアルタイムで複製、バックアップは、データを一定期間ごとに別の場所へ保管することを示しています。混同することが多いので、覚えておきましょう。

 自社のデータを安全に保管し、自社サービスや業務の継続を可能にするために、レプリケーションあるいはバックアップについて、体制を見直してみてはいかがでしょうか。

※掲載している情報は、記事執筆時点のものです

執筆= NTT西日本

【MT】

あわせて読みたい記事

連載バックナンバー

覚えておきたいクラウド&データのキホン