バックアップ – 長期、大容量、データの保存(アーカイブ)には、どのような媒体を使用すべきか?

archiving backup storage

この質問は、https://superuser.com/questions/374386/how-to-store-and-preserve-lots-of-dataに触発されたものです。似たような質問は他にもありましたが、同じ基準の質問はありませんでした

1つで2つの質問です

  1. 火事以外は生き延びるべきで、何十年も使えるはずの財務/重要記録をどうやって保管しているのでしょうか?
  2. 家族の写真や動画を保存したいと考えていて、人々が100年後にストレージの中でそれらを見つけることができ、まだそれらを使用することができるようにしたいとします。これはどのように行われるのでしょうか?

Criteria

  1. 長期とは、30年以上の保証期間を意味します。平均100年以上。実用的でない場合は、最も近い解答を使用してください】
  2. 大容量とは、数テラバイトのことです
  3. 回答は、「ノークレーム・工業用」の解決策か、在宅オフィス・中小企業ユーザー向けの実用的な解決策かのどちらかになります
  4. メディアは期間中はアクティブになりません。(つまり、ハードドライブを示唆している場合は、回転しません)
  5. さらに、これらのアーカイブを読む必要性を期待するものではありません。それらは緊急時や「将来の世代のために」という目的のために存在しているのです
  6. メンテナンスを必要としないこと(可能であれば)

My thoughts:

  1. CD-R/DVD-Rは、短期的に見ても、バックアップには最悪のメディアであることが私には証明されている。彼らは非常に壊れやすく、原始的な状態であっても短時間でデータを失ってしまうようだ
  2. 1TBのHDDにデータを保存して、10年後か2年後に正しく回転することを期待するのは、ひどい考えだと思わずにはいられません。私は間違っていますか?
  3. 産業用テープドライブは実行可能なオプションのように見えますか?

  62  user606723  2012-01-04


ベストアンサー

Paper

密閉されたストレージ内のアーカイバル紙のアーカイバルインク以外に、現在の媒体では、どのような種類のメンテナンスなしで平均100年持つことが証明されていません

Archival Paper

古い紙は麻や麻などの素材で作られていたため、自然にアルカリ性になり、酸を含まないため、何百年も持ちます。20世紀の紙や現代のほとんどの紙は、通常、木材パルプから作られていますが、酸性のものが多く、長持ちしません

Archival Inks

これらの永久的な、非フェージングインクは、光、熱、水に耐性があり、紙や写真材料の永続性に影響を与えることができる不純物が含まれていません。黒いアクチン性インクは化学的に安定しており、他のインク顔料ができるように不純物を吸収する傾向がない無機顔料を特色にしています

Redundant storage

トルバルズはかつてこう言った

テープバックアップを使うのは弱虫だけだ本物の男は重要なものをftpでアップロードして、それを世界中の人にミラーリングさせています

それは、あなたが単一の媒体で単一のコピーに頼るべきではないことを示唆している

磁性体じゃなくて?

The bell tolls for your magnetic media
Don't wait to try to retrieve the data and content from your magnetic media. Chances are, some of it may already be unrecoverable and highly degraded.
  • 磁性媒体の取り返しのつかない劣化の典型例
  • ハードウェアとソフトウェア(およびデータ形式)の問題

特化したシステムではありません

2002年には、このフォーマットを読めるコンピュータが希少になり、ディスクにアクセスできるドライブがさらに希少になったため、ディスクが読めなくなることが懸念されていました。オリジナルのコードをエミュレートすることの難しさはさておき、静止画がシングルフレームのアナログビデオとしてレーザーディスクに保存されていたことが大きな問題でした

BBC Domesday Project - Wikipedia

長期個人保管

Storage
ZDNET news and advice keep professionals prepared to embrace innovation and ready to build a better future.
  • メディアとフォーマットの両方が読めなくなる可能性があります
  • 顔料インクを使用した無酸紙に印刷し、冷暗所で乾燥させて保管してください
  • 第一の問題は、最大の長寿命を実現するためのデータ形式を選ぶことです
  • 独自のフォーマットの使用は避けてください
  • USCSFは、オリジナルのテープをすべて、BetaSPやVHSのような現在では廃れたフォーマットのものを、75MbitのMotionJPEG2000フォーマットに転送しています

20  RedGrittyBrick  2012-01-04


Short answer

エントロピー(死とも言う!)のせいで長い時間枠を保証することは不可能です。デジタルデータは宇宙の他のものと同じように崩壊して死ぬ。しかし、それを遅らせることはできます

現在のところ、30年以上のコールドデータのアーカイブを保証する、失敗しない、科学的に証明された方法はありません。Long Now museumのRosetta Disksプロジェクトのように、それを目指しているプロジェクトもありますが、まだ非常にコストがかかり、データ密度も低い(約50MB)のが現状です

とりあえず、科学的に証明された復元力のある光媒体を、パナソニックのようなブルーレイディスクのHTLタイプや、Verbatim Gold ArchivalのようなアーカイブグレードのDVD+Rのような冷蔵保存に使って、気密ボックスに入れてソフトスポット(高温にならないように)で光の当たらないところに保管しておくといいでしょう

また、冗長である:あなたのデータの複数のコピー(少なくとも4)を作成し、すべてが大丈夫であることを定期的にチェックするためにハッシュを計算し、数年ごとに新しいディスクにデータを書き換える必要があります。また、エラー修正コードの多くを使用して、彼らはあなたの破損したデータを修復することができます!

Long answer

なぜデータは時間とともに壊れていくのでしょうか?その答えは一つの言葉にあります:エントロピーです。これは宇宙の主要かつ不可避な力の一つであり、システムが時間の経過とともに秩序を失いつつあることを意味しています。データの破損はまさにそれです:ビットの秩序の乱れ。つまり、宇宙はあなたのデータを嫌っているのです

エントロピーとの戦いは、まさに死との戦いに似ている。しかし、エントロピーを遅らせることができるのと同じように、死を遅らせる方法を見つけることができる。また、腐敗を修復することでエントロピーを騙すこともできる(言い換えれば、腐敗を止めることはできないが、事前に対策を講じていれば、腐敗が起こった後に修復することはできる!)。生と死についての何かと同じように、魔法の弾丸やすべての人のための1つの解決策はなく、最高の解決策は、データのデジタル・キュレーションに直接関与することを必要とする。また、すべてを正しく行ったとしても、データの安全性が保証されるわけではなく、可能性を最大化するだけです

良質なストレージメディアと、優れたアーカイブ/キュレーション戦略を組み合わせれば、データを維持するための非常に効率的な方法が今ではあります

良いキュレーション戦略とは何か?ここで一つはっきりさせておきましょう:あなたが見つける情報のほとんどはバックアップに関するものであり、アーカイブに関するものではありません。問題は、ほとんどの人がバックアップ戦略に関する知識をアーカイバルに移すことであり、そのために多くの神話がよく聞かれるようになったということです。実際、データを数年保存すること(バックアップ)と、少なくとも数十年に及ぶ最長期間保存すること(アーカイブ)は全く異なる目標であり、異なるツールや戦略が必要となります

幸いなことに、研究や科学的な成果はかなり多いので、フォーラムや雑誌ではなく、それらの科学論文を参考にすることをお勧めします。ここでは、私が読んだものをいくつかまとめてみます

また、そのようなまたはそのような記憶媒体が完璧であると主張する主張や独立した科学的研究ではないことにも注意してください。有名なBBCのドムズデイプロジェクトを覚えています。“デジタルドムスデイブックは15年ではなく、1000年”を持続させます。本当に独立した論文との研究を常にダブルチェックし、何もない場合は、常に記憶媒体がアーカイブのために良いではないと仮定します

何を求めているのか(ご質問から)を明確にしましょう

  • 長期的なアーカイブ: あなたの感覚的で再現性のない「個人的な」データのコピーを保持したいと思います。よくここで説明されているように、アーカイブはバックアップとは根本的に異なります: バックアップは、定期的に更新される動的な技術データのためのものであり、したがって、バックアップにリフレッシュする必要があります(すなわち、OS、作業フォルダのレイアウトなど)一方、アーカイブは、あなたがおそらく一度だけ書いて、時々読むだけであろう静的なデータです。アーカイブは、通常は個人的なインテンプラルデータのためのものです

  • 冷蔵保存:アーカイブされたデータのメンテナンスはできるだけ避けたいものです。これは、メディアが非常に長い間安定した状態を維持するためのコンポーネントと書き込み方法を使用しなければならないことを意味し、コンピュータや電源への接続を必要としません

分析を容易にするために、まず冷蔵保存のソリューションを検討し、次に長期的なアーカイブ戦略を検討しましょう

冷蔵保存用の媒体

良い冷蔵保存媒体とは何であるべきかを上記で定義しました:操作を必要とせずに長期間データを保持することです(これが「冷蔵」と呼ばれる理由です:クローゼットに保管するだけで、データを維持するためにコンピュータに接続する必要はありません)

紙は地球上で最も弾力性のある記憶媒体のように思えるかもしれませんが、私たちはしばしば古代からの非常に古い原稿を見つけるので。しかし、紙には大きな欠点があります。第一に、データ密度が非常に低く(小さな文字やコンピュータツールを使っても、紙に100KB以上のデータを保存することはできません)、それを監視する方法がなくても時間の経過とともに劣化していきます。しかし、デジタル・データでは無音の破損を監視することができますが、紙では監視することができません。例えば、写真がわずか10年後も同じ色を保つことを保証することはできません。色は劣化しますし、元の色を見つける方法もありません。もちろん、画像修復のプロであれば、写真をキュレーションすることもできますが、これは非常に時間がかかりますが、デジタルデータでは、このキュレーションと修復のプロセスを自動化することができます

ハードドライブ(HDD)は、knownからhaveまでの平均寿命が3年から8年となっています。次の曲線は、驚異的な速度で死ぬためにすべてのHDDのためのこの傾向を示しています

エラータイプに応じたHDDの故障率の推移を示すバスタブカーブ (どのような設計のデバイスにも適用可能)

curve-hdd1

HDDの故障率を示す曲線、すべてのエラータイプがマージされています。curve-hdd2

ソース。Backblaze

HDDには、故障と比較して3つのタイプがあることがわかります:急速に死ぬもの(例:製造ミス、品質の悪いHDD、ヘッドの故障など)、一定の死亡率のもの(良い製造、彼らは様々な “普通の “理由で死ぬ、これはほとんどのHDDの場合です)、そして最後に、HDDのほとんどよりも少し長く生きて、最終的に “普通のもの “の後にすぐに死ぬ堅牢なもの(例:幸運なHDD、あまり使用されていない、理想的な環境条件、など)です。このように、あなたのHDDが死ぬことは保証されています

なぜHDDはよく死ぬのか?というと、データは磁気ディスクに書き込まれていて、磁界はフェードアウトする前に何十年も続くことがあるからです。なぜHDDが死ぬかというと、記憶媒体(磁気ディスク)と読取ハードウェア(電子基板+回転ヘッド)が結合しているからです。まず、磁気ディスクを取り出して別のヘッドで読み取ることはできません

また、HDDは使用しないと時間の経過とともに消磁することが知られています(SSDを含む)。したがって、ハードディスクにデータを保存して押入れに保管し、電気的に接続しなくてもデータが保持されると考えることはできません:少なくとも年に一度、または数年に一度はHDDを電源に接続する必要があります。このように、HDDは明らかに冷蔵保存には向いていません

磁気テープ:彼らはしばしばバックアップのニーズのためのゴー-ツーとして記述されており、アーカイブのための拡張子によって。磁気テープの問題は、彼らが非常に敏感であるということです:酸化磁気粒子が簡単に太陽、水、空気、傷、時間または任意の電磁デバイスによって減磁されたか、単に時間と一緒に落ちるか、またはプリントスルーによって劣化させることができます。そのため、通常はプロがデータセンターでのみ使用しています。また、10年以上データを保持できることは証明されていません。では、なぜバックアップを推奨することが多いのでしょうか?昔はHDDよりも磁気テープの方が10倍から100倍も安く、HDDは今よりもずっと安定していない傾向がありました。そのため、磁気テープは主に費用対効果のためにバックアップに使用することをお勧めしますが、データをアーカイブする際に最も関心のある復元力のために使用するわけではありません

コンパクトフラッシュとセキュアデジタル(SD)カードは、非常に頑丈で堅牢であることが知られており、壊滅的な状況を乗り切ることができる

ほとんどのカメラに搭載されているメモリーカードは、事実上不滅だとDigital Camera Shopper誌が報じています。5つのメモリカードのフォーマットは、コーヒーやコーラで煮沸したり、踏みつけたり、洗ったり、水に浸したりして生き残った

しかし、他の磁気ベースの媒体として、それはデータを保持するために電界に依存しており、したがって、カードの電源が切れた場合、データが完全に失われる可能性があります。したがって、冷蔵保存には最適ではありませんが(電場をリフレッシュするために時折カード上の全データを書き換える必要があるため)、バックアップや短期または中期のアーカイブのための良い媒体になることができます

光学媒体。光メディアは、CD、DVDやBlu-ray(BD)のように、データを読み取るためにレーザーに依存した記憶媒体のクラスです。これは紙の進化と見ることができますが、非常に小さなサイズでデータを書き込むので、紙よりも精密で弾力性のある素材が必要で、光ディスクはまさにそれです。光ディスクの2つの最大の利点は、記憶媒体が読み取りハードウェアから切り離されていること(すなわち、DVDリーダーが故障した場合、ディスクを読み取るために別のものをいつでも購入することができます)と、それが普遍的で将来の証明になるレーザーに基づいていることです(すなわち、あなたがレーザーの作り方を知っている限り、あなたは常にエミュレーションによって光ディスクのビットを読み取るためにそれを微調整することができます、CAMILEONがDomesday BBC Projectのために行ったように。)

どの技術でもそうだが、新しいイタレーションは、より大きな密度(ストレージルーム)を提供するだけでなく、より優れたエラー訂正、環境崩壊に対する回復力にも優れている(必ずしもそうとは限らないが、一般的にはそうである)。DVDの信頼性についての最初の議論は、DVD-RとDVD+Rの間にあったし、DVD-Rが今日でも一般的である場合でも、DVD+Rは、より信頼性の高い正確であると認識されています。特に冷蔵保存用に作られたアーカイブグレードのDVDディスクが今ありますが、彼らはどんなメンテナンスなしで〜20年の最小値に耐えることができると主張しています

Verbatim Gold Archival DVD-R [ … ] は、ドイツの著名な c’t 誌(c’t 16/2008、116-123 ページ)による徹底した長期ストレステストにおいて、最も信頼性の高い DVD-R として評価されています [ … ] 。他にこれらの値に近いディスクはなく、2番目に優れたDVD-Rの最低耐久年数はわずか5年であった

LinuxTech.netより

さらに、非常に長期的なDVDアーカイブに特化した企業もあり、ミレニヤータのM-DiscやDataTresorDiscのように、1000年以上のデータを保持できると主張し、いくつかの(独立していない)研究データが検証されています。pdf” rel=”noreferrer”>いくつかの (非独立) 研究 (2009年から) 科学的ではないその他 の中でも

これは非常に有望だと思われます。不幸なことに、これらの主張を確認するための独立した科学的研究が十分ではなく、利用可能な数少ない研究は、それほど熱心ではありません

湿度(80%RH)と温度(80℃)は、定期的にデータの読みやすさをチェックしながら2000時間(約83日)のテストで数枚のDVDの経年劣化を促進しました。Humidity and temperature accelerated ageing on several DVDs brands

デジタルデータアーカイブのためのフランス機関(Archives de France)、2012年の研究から翻訳されました

1枚目のグラフは、劣化の進行が遅いDVDを示しています。2つ目のグラフは、急速な劣化曲線を持つDVDです。そして3つ目は、M-DiscやDataTresorDiscのような特別な「非常に長期的な」DVDのためのものです。私たちが見ることができるように、それらの性能は、標準的な非アーカイブグレードのDVDよりも低いか、または同等であるという主張に全く適合していません

しかし、M-DiscやDataTresorDiscのような無機光ディスクには、光劣化の影響を受けにくいという利点があります

240時間の間、光(750W/m²)を使用した加速経年変化。Light accelerated ageing on several DVDs brands

これらは素晴らしい結果ですが、Verbatim Gold ArchivalのようなアーカイブグレードのDVDも同じパフォーマンスを達成しており、さらに、光はオブジェクトのための最も制御可能なパラメータです:それは非常に簡単に閉じたボックスやクローゼットにDVDを置くことができ、このように光の可能性のある影響を除去することができます。光よりも温度や湿度に非常に強いDVDを手に入れた方がはるかに便利だろう

この同じ調査チームは、長期的な冷蔵保存に適した媒体を持つブランドがあるかどうかを確認するために、ブルーレイ市場も調査しました。その結果をご紹介します

いくつかのブルーレイブランドでは、DVDと同じパラメータで湿度と温度が経年劣化を加速させました。temp-bd

複数のBluRaysブランドで光加速経年変化、同じパラメータで。light-bd

本研究のArchives de France, 2012.から翻訳したものです

全所見の要約(フランス語) こちらこちら の2つの要約

最高のブルーレイディスク(パナソニック製)は、湿度+温度テストにおいて、最高のアーカイブグレードのDVDと同様のパフォーマンスを示しましたが、光にはほとんど影響を受けませんでした。しかも、このブルーレイディスクはアーカイブグレードですらありません。さらに、Blu-rayディスクはDVDよりも強化されたエラー修正コードを使用しており(それ自体はCDと比較して強化されたバージョンを使用しています)、データを失うリスクをさらに最小限に抑えています。このように、Blu-rayディスクの中には冷蔵保存に非常に適したものもあるようです

平均寿命50年の300GBから1TBのストレージを提供できることを発表した、パナソニックやソニーのように、アーカイブグレードの高密度ストレージBlu-rayディスクに取り組み始めている企業もあります。また、大手企業はコールドストレージ用の光学メディアに目を向けています (電力供給なしでコールドストレージできるため、リソースの消費が大幅に少なくて済むからです)

ロングナウのアーカイブ構想。このようなロングナウ博物館によるロゼッタディスクプロジェクトのような他の興味深いリードがありますが、これは、創世記が翻訳された地球上のすべての言語で創世記の顕微鏡的にスケーリングされたページを書き込むためのプロジェクトです。これは、本当に非常に長期的な冷蔵保存のために50MBを保存することができる媒体を提供する最初のプロジェクトであり(それは炭素で書かれているので)、あなただけのデータにアクセスするために拡大鏡を必要とするので、将来的に保証されたアクセス(ブルーレイのバイオレットビームのような奇妙なフォーマットの仕様や処理する技術的な手間はありません、ただ拡大鏡を必要とする!)、素晴らしいプロジェクトです。しかし、これらはまだ手動で作られているため、個人的なアーカイブスキームのために少し多すぎると思います約$ 20Kの費用がかかると推定されます

インターネットベースのソリューション。まだあなたのデータを冷蔵保存するための別の媒体は、ネット上にあります。しかし、クラウドバックアップソリューションは、クラウドホスティング会社よりも主要な懸念のために、あなたのデータを保持したいと思うように長く生きていない可能性がありますが、良いフィット感ではありません。他の理由は、それが(それはインターネットを介して転送するので)バックアップするために恐ろしいほど遅いという事実が含まれており、ほとんどのプロバイダは、ファイルがまた、それらをオンラインに保つためにあなたのシステム上に存在する必要があります。例えば、CrashPlanもBackblazeも、過去30日間に少なくとも一度はコンピュータ上で見られていないファイルを永久に削除するので、外付けハードドライブにしか保存していないバックアップデータをアップロードしたい場合は、少なくとも月に一度はUSB HDDを差し込んで、カウントダウンをリセットするためにクラウドと同期しなければなりません。しかし、SpiderOakのようにカウントダウンなしで無期限に(もちろん有料であれば)ファイルを保管してくれるクラウドサービスもあります。そのため、選ぶクラウドベースのバックアップソリューションの条件や使い方には十分に注意してください

クラウド・バックアップ・プロバイダーの代替案としては、オンラインで自分のプライベート・サーバーをレンタルし、可能であれば、ハードウェアの障害が発生した場合にデータを自動的にミラーリング/バックアップしてくれるものを選ぶとよいでしょう(いくつかのバックアップ・プロバイダーでは、契約時にデータの紛失を保証してくれるところもありますが、もちろんそれ以上に費用がかかります)。これは素晴らしいソリューションです。第一に、あなたはまだあなたのデータを所有しているので、第二に、ハードウェアの障害を管理する必要がないので、これはあなたのホストの責任です。ある日あなたのホストが廃業した場合、あなたはまだあなたのデータを取り戻すことができます(彼らは夜の上にシャットダウンしないように深刻なホストを選択しますが、事前にあなたに通知し、多分あなたは契約にそれを置くことを求めることができます)、および他の場所で再ホストします

あなた自身のプライベートなオンラインサーバーを設定する手間をかけたくない場合、そしてあなたがそれを余裕があれば、アマゾンは、Glacierと呼ばれる新しいデータアーカイブサービスを提供しています。目的はまさに長期的にあなたのデータをコールドストアすることです。これは、他のS3のオファーと同じですが、はるかに低い価格で、アーカイブごとに1年あたり11 9秒の耐久性を提供しています。しかし、検索は無料ではなく、数分(Glacier Archiveからの標準検索)から48時間(Glacier Deep Archiveからの一括検索)までどこでもかかることがあります

コールドストレージの欠点なぜなら、コールドストレージはデータの完全性を自動的にチェックすることができないからです(単に破損が起こった後のダメージを「回復」するためにエラー修正スキームを実装することはできますが、それを防ぐことも、自動的に管理することもできません!) コンピュータとは逆に、ファイルシステムを計算/ジャーナル化/チェック/修正する処理ユニットがないからです。一方、コンピュータと複数のストレージユニットを使用すると、アーカイブの整合性を自動的にチェックすることができ、データアーカイブで破損が発生した場合、必要に応じて自動的に別のユニットにミラーリングすることができます(同じアーカイブの複数のコピーを持っている限り)

Long-Term Archival

現在利用可能な最高の技術を用いても、デジタルデータは数十年(約20年)しか冷蔵保存できません。したがって、長期的に見れば、冷蔵保存だけに頼ることはできません。将来的に(技術的な変化があっても)データを検索できるようにし、データを失うリスクを最小限に抑えるために、データアーカイブプロセスのための方法論を設定する必要があります。言い換えれば、データのデジタル・キュレーターとなり、破損が発生した場合には修復し、必要に応じて新しいコピーを作成する必要があります

馬鹿にならないルールはありませんが、ここではいくつかの確立されたキュレーション戦略と、特にあなたの仕事を楽にする魔法のツールを紹介します

  • 冗長性/複製の原理。冗長性は、エントロピーの影響を元に戻すことができる唯一のツールである情報理論に基づく原理です。データを保持するためには、このデータを複製する必要があります。エラーコードはまさに冗長性の原理を自動的に適用したものです。しかし、データが冗長であることも保証する必要があります:同じデータを異なるディスクに複数コピーしたり、異なるメディアに複数コピーしたり(1つのメディアが本質的な問題で故障しても、異なるメディアの他のメディアが同時に故障する可能性はほとんどありません)などです。特に、あなたのコピーが破損した場合、3つのコピーからファイルを修復するために単純な多数決を行うことができるように、工学では3モジュールの冗長性とも呼ばれる、あなたのデータの少なくとも3つのコピーを常に持っている必要があります。常に船乗りのコンパスのアドバイスを覚えておいてください

2つのコンパスを持ってくるのは無駄です。1つが間違っていたら、どちらが正しいのか、あるいは両方が間違っているのか分からないからです。コンパスは必ず1つ、または3つ以上持っていくようにしましょう

  • 誤り訂正コード:これは、あなたの生活をより簡単にし、データをより安全にする魔法のツールです。誤り訂正コード(ECC)は、データを修復するために使用できるデータを生成する数学的な構成です。ECC は、単純なレプリケーション(すなわち、ファイルの複数のコピーを作成する)よりも少ないストレージ容量で、より多くのデータを修復することができるため、これはより効率的で、ファイルが破損しているかどうかをチェックしたり、破損している場所を特定したりするのにも使用できます。実際、これはまさに冗長性の原理を応用したものですが、レプリケーションよりも賢い方法です。この技術は、4G、WiMax、さらにはNASAの宇宙通信など、最近ではあらゆる長距離通信で広く使われています。不幸なことに、ECC は通信分野では遍在していますが、ファイル修復には使われていません。しかし、よく知られた(しかし今は古い)PAR2や、DVD Disaster(これは光ディスクにエラー訂正コードを追加する機能を提供しています)、pyFileFixity(PAR2の制限や問題点を克服するために私が一部開発したものです)などのソフトウェアが利用できます。また、Linux用のZFSやWindows用のReFSのように、オプションでリード・ソロモンを実装するファイルシステムもありますが、これらは技術的にはRAID5の一般化です

  • 定期的にファイルの整合性をチェックしてください。ファイルをハッシュ化して、時々チェックしてください(例えば、年に一度ですが、保存媒体や環境条件によって異なります)。ファイルが破損していることがわかったら、作成したECCを使って修復したり、新しい記憶媒体にデータの新しいコピーを作成したりしましょう。データをチェックし、破損を修復し、新しいコピーを作成することは、データの安全性を保証する非常に良いキュレーションサイクルです。あなたのファイルのコピーが静かに破損することができるので、特にチェックすることは非常に重要であり、その後、あなたが改ざんされたコピーをコピーする場合は、完全に破損したファイルで終わるでしょう。これは、データの整合性を自動的にチェックすることができない光ディスクなどのコールドストレージメディアでさらに重要です(彼らはすでに少し回復するためにECCを実装していますが、彼らはチェックしたり、自動的に新しい新しいコピーを作成することはできません、それはあなたの仕事です!)。ファイルの変更を監視するには、pyFileFixityのrfigc.pyスクリプトや、md5deepのような他のUNIXツールを使うことができます。また、Hard Drive Sentinel やオープンソースの smartmontools などのツールを使って、ハードドライブなどの記憶媒体の健全性をチェックすることもできます

  • 洪水や火災のような現実の生活の大惨事のために避けるために、異なる場所にあなたのアーカイブメディアを格納します(あなたの家の外に少なくとも1つのコピーを持つ!)。例えば、あなたの仕事場に1つの光ディスク、またはクラウドベースのバックアップは、この要件をmeedするための良いアイデアになることができます(たとえクラウドプロバイダーがいつでもシャットダウンすることができる場合でも、あなたが他のコピーを持っている限り、あなたは安全になります、クラウドプロバイダーは、緊急時にのみオフサイトのアーカイブとして機能します)

  • 光学媒体の場合は、光を避け、湿気を避けるために水密性の高い箱に入れて保管してください。ハードドライブやSDカードの場合は、残留電力がドライブを改ざんしないように、反磁気スリーブに入れて保管してください。また、気密性と水密性の袋/ボックスに格納し、冷凍庫に格納することができます:遅い温度はエントロピーを遅くし、あなたはかなり多くのそのようなストレージ媒体の寿命を延長することができます(ちょうど水が内部に入らないことを確認してください、そうでなければ、あなたの媒体はすぐに死ぬでしょう)

  • 良い品質のハードウェアを使用して、事前にそれらをチェックしてください(例:あなたがSDカードを購入した場合、そのようなデータを書き込む前にすべてが大丈夫であることを確認するために、HDDスキャンなどのソフトウェアを使用して全体のカードをテストします)。彼らの品質が大幅にあなたの焼かれたディスクの品質を変更することができますので、これは、光学ドライブのために特に重要である、アーカイブス-ド-フランスの研究(悪いDVDバーナーは、はるかに少ない持続するDVDを生成します)によって示されている

  • ファイル形式は慎重に選びましょう。すべてのファイル形式が破損に強いわけではなく、明らかに弱いものもあります。例えば、.jpg の画像は、1 バイトか 2 バイトだけを改ざんすることで、完全に壊れて読めなくなることがあります。7zip アーカイブも同じです。これは馬鹿げているので、アーカイブするファイルのファイル形式には気をつけましょう。経験則として、シンプルなクリアテキストがベストですが、圧縮する必要がある場合は、非固体のzipを使用し、画像の場合は、JPEG2(まだオープンソースではありません…)を使用してください。プロのデジタルキュレーターこちらこちらこちらの詳細情報やレビューをご覧ください

  • データを読み取るために必要なソフトウェアや仕様をすべてデータアーカイブと一緒に保存してください。仕様は急速に変化するため、将来的にはファイルにアクセスできてもデータが読めなくなる可能性があることを覚えておいてください。したがって、オープンソースのフォーマットやソフトウェアを好み、プログラムのソースコードをデータと一緒に保存しておけば、新しいOSやコンピュータから起動するプログラムをソースコードからいつでも適応させることができます

  • 他にもたくさんの方法やアプローチがありますこちら, こちらやインターネットの様々な場所で利用できます

Conclusion

私は、あなたが持っていることができるものを使用することをお勧めしますが、常に冗長性の原則を尊重し(4つのコピーを作成してください!)、常に定期的に整合性をチェックしてください(だから、MD5/SHA1ハッシュのデータベースを事前に生成する必要があります)、破損した場合には、新しい新しいコピーを作成します。そうすれば、技術的には、あなたの記憶媒体が何であれ、あなたが望む限り、あなたのデータを保持することができます。各チェックの間の時間は、あなたの記憶媒体の信頼性に依存します:それがフロッピーディスクの場合は、2ヶ月ごとにチェックし、それがBlu-ray HTLの場合は、2/3年ごとにチェックしてください

今、最適では、私はコールドストレージのために、水密性の不透明なボックスに保存されたBlu-ray HTLディスクまたはアーカイブグレードのDVDディスクを使用して、新鮮な場所に保存することをお勧めします。さらに、SDカードやSpiderOakなどのクラウドベースのプロバイダを使用して、あなたのデータの冗長コピーを格納するために、またはそれがあなたにもっとアクセス可能であれば、ハードドライブを使用することができます

エラー修正コードをたくさん使ってください。また、あなたはこれらのECCsファイルの複数のコピーを作成することができます(しかし、ECCsファイルは自分自身を修復することができるので、あなたのデータの複数のコピーは、ECCsの複数のコピーよりも重要です!)

これらの戦略はすべて、私が開発しているツールのセット(オープンソース)を使用して実装することができます。pyFileFixityです。このツールは、ファイルの固定性を完全に管理できるフリーのツールがないことを知り、実はこの議論から始まったものです。また、ファイルの固定化やデジタルキュレーションについての詳細は、プロジェクトの readme や wiki を参照してください

最後になりますが、私はこの問題にもっとR&Dをかけてほしいと思っています。これは、より多くのデータがデジタル化されている現在の社会の大きな問題ですが、この大量の情報が数年以上生き延びるという保証はありません。これは非常に憂鬱なことですが、私はこの問題をもっと前面に出して、建設業者や企業が将来の世代に耐えうるストレージデバイスを作るためのマーケティングポイントにすべきだと考えています

/EDIT: 実践的なキュレーションルーチンのために以下を読んでください

71  gaborous  2015-02-03


上記の私の前回の回答を素早くフォローアップし、より簡潔にして、30Kの長さの制約のために最初の回答では追加できなかった追加情報(しかし、重要ではない)と参照を加えて拡張します

長期的なアーカイブはキュレーションプロセスであるため、プロセスをより効率的に、時間(とリソース)を消費しないようにするために注意したいことがいくつかあります

  • 重複:長期的なアーカイブを確実にする唯一の方法は意図的に設計された冗長性を介しているので、無駄な冗長データ(例えば、USB キーからアーカイブ用ハードドライブに取り込んだファイルのコピー、しかし、あなたはすでにメインコンピュータからのコピーを持っている!)を避けたいと思います。不要な冗長データは、通常は重複と呼ばれていますが、ストレージコストの面でも、プロセスの面でも(同じファイルの異なるバージョンを持っている場合はどうしますか?どのコピーが正しいものかどうやって知ることができますか?)とあなたの時間のために(すべてのアーカイブにバックアップを同期するときに転送時間に追加されます)。そのため、プロのアーカイブサービスでは通常自動重複排除機能を提供しています。例えばSpiderOakはそれを行っている。自動化されたツールもありますし、ZFS(Linux)やReFS(Windows)のファイルシステムが自動的にそれを行ってくれます

  • 優先順位付け/分類:ご覧のように、長期アーカイブは定期的に実施する必要がある時間のかかるプロセスです(サニティーチェック、メディア間でのアーカイブの同期化、死にかけているものを置き換えるための新しいメディア上での新しいアーカイブの作成、エラー修正コードを使用したファイルの修復など)。コストがかかる時間を最小限に抑えるために、カテゴリに基づいてデータの優先度に応じて異なる保護の仕組みを定義してみてください。アイデアは、あなたが長期的なアーカイブのために使用する外付けハードドライブのいずれかにあなたのコンピュータのデータを移動するときに、バックアップの優先順位を定義する1つのフォルダに直接それらを配置することです。”重要でない」、「個人的な」、「重要な」、「重要な」。その後、各フォルダごとに異なるバックアップ戦略を定義することができます:完全な保護(例えば、3台のハードドライブ上のバックアップ+クラウド+エラー修正コード+ BluRays)を確保するだけで、あなたの生涯(重要なフォルダ)を維持したい最も重要なデータのために、その後、”重要な “データ(例えば、3台のハードドライブ上のバックアップ+クラウド)のための中程度の保護とし、”個人的な “だけで少なくとも2つの外付けハードドライブにコピーされ、”重要ではない “はコピーを取得しません(または同期があまりにも長くない場合は、1台のハードドライブ上のコピーを取得します….)。通常、”unimportant “にはほとんどのデータが含まれ、”personal “にはそれ以下のデータが含まれ、”internificant “にはそれ以下のデータが含まれ、”critical “には非常に小さなデータが含まれます(私の場合は50GB以下)。例えば、「重要」には家の契約書や結婚や出産の写真などが入ります。そして「重要」には、法的な書類や思い出の写真やビデオなど、失いたくない書類を入れます。個人的な」には、すべての個人的な写真、休日のビデオ、仕事の文書を入れます。これらは、あなたが維持したいと思う文書やメディアですが、あなたがそれらを失っても後悔で死ぬことはありません(そして、通常、このフォルダは非常に大きいので、長期的にいくつかのファイルを失うことになるので、それは良いことです…)。”重要でない」とは、インターネットからダウンロードしたものや、様々なファイルやメディアなど、あなたが本当に気にしていないものです(ソフトウェアやゲーム、映画など)。長期的にアーカイブしたいファイルが多ければ多いほど、それは難しい(と時間がかかる)ので、この特別な扱いを受けるファイルは最小限に抑えるようにしましょう

  • メタデータは重要な場所です: たとえ良いキュレーション戦略を持っていても、通常は保護されていないものが1つあります: メタデータです。メタデータには、ファイルに関する情報が含まれています。例えば、ディレクトリツリー(そう、これはわずか数バイトです。これは大したことではないように見えるかもしれませんが、次のことを想像してみてください:明日、すべてのファイル(ソフトウェアやものと一緒に出荷されたファイルを含む)は、ファイル名も拡張子もなく、1つのフラットフォルダ内のすべての配置されている場合はどうでしょうか。あなたのコンピュータ上にある何十億ものファイルの中から、必要なファイルを手動で検査して復元することができるでしょうか?これは珍しいシナリオだと思わないでください、それはあなたが停電やコピーの途中でクラッシュを取得する場合と同じように簡単に起こるかもしれません:書き込まれているパーティションは完全に破壊されることができます(悪名高いタイプのRAW)。この問題を克服するには、データ復旧のために準備してデータを準備する必要があります: メタデータを確実に保持するために、ZIP DEFLATE や DAR などの非固体アーカイブ (ただし、tarではない) を使用して、ファイルのメタデータを凝集させることができます。いくつかのファイルシステムは、DVDisaster (光ディスク用) や ZFS/ReFS (ハードドライブ用) のように、自動化されたメタデータの冗長性を提供しています。メタデータがクラッシュした場合、TestDiskやGetDataBack(ディレクトリツリーの部分的な回復を許可)やISOBuster(光ディスク用)を使用してパーティションを回復し、ディレクトリツリーやその他のメタデータを回復しようとすることができます。このすべてが失敗した場合には、PhotoRecを使用してファイルスクレイピングにフォールバックすることができます:これは、それが認識するすべてのファイルを抽出しますが、完全な混乱の中で、ファイル名やタイムスタンプなしで、唯一のデータ自体が回復されます。重要なファイルをzipで圧縮した場合、zip内のメタデータを回復することができるようになります(zip自体にはもはやメタデータが含まれていない場合でも、少なくともファイルの中には正しいメタデータが残っているでしょう)。しかし、すべてのファイルスクレイプされたファイルを一つずつ手動でチェックする必要があり、時間がかかります。この可能性を防ぐために、pyFileFixityやPAR2を使って整合性チェックサムファイルを事前に生成しておき、ファイルスクレイピング後にこの整合性チェックサムファイルを使って自動的にファイルを認識し、内容に応じてファイル名を変更することができます(これはファイルスクレイピングのメタデータリカバリーを自動化する唯一の方法です。)

  • ファイルフォーマットとキュレーション戦略を自分でテストしてみてください:どのフォーマットタイプが他のものよりも優れているかについての記事の言葉を信用するのではなく、pyFileFixity filetamper.pyや、いくつかのファイルでいくつかの16進数文字を置き換えることによって、自分で試すことができます:あなたは、ほとんどのファイルフォーマットが3つの異なるバイトのような少数で分解できることがわかります。だから、あなたは本当に慎重にファイルフォーマットを選択する必要があります。メモ用にはシンプルなテキストファイルを好み、メディア用には弾力性のあるファイルフォーマットを使用してください(MPEG-4 Variable Error Correcting Code のようなものがまだ開発されており、ffmpeg はそれを実装しており、ref が追加される予定です)

  • 統計的な研究を読んで、クレームを信じないようにしましょう。前の回答でも述べましたが、記憶媒体の寿命については、科学的事実がなくても法外な主張が常になされていますので、特に注意が必要です。確かに、メーカーが長寿命について偽物で検証不可能な主張を自慢することを妨げる法律は何もありません。そのようなBackBlazeのハードドライブの故障率に関する年次報告書などの統計的研究を参照することを好む

  • 長く保証された記憶媒体を取る。保証はあなたのデータを取り戻すことはできませんが、生産者がその製品の故障率をどのように評価しているかを教えてくれます(保証期間中に故障率が高すぎるとコストがかかりすぎるからです)


私が使っているスキームの最新情報です。上述の優先順位付け戦略を適用し、クラウドバックアップサービスのSpiderOakを私のスキームに追加しました。私は自分のデータを唯一のバックアップ媒体として使うことはありません

そこで、現在の私のスキームをご紹介します

  • ハードディスクのコピー3枚を定期的にチェックして同期して保存しているのと、いつも私の手元にある1枚(ゴミを溜めておくのと、クイックバックアップをするのに使っています)の2箇所に保存しています
  • 無限収納プランのスパイダーオーク
  • BluRayディスクは、本当に賢明なデータのためのものですが、大きすぎません(私はこれらのディスクに保存できるデータを50GBに制限しています)
  • pyFileFixityとDVDisasterは、長期的に保存しておきたいフォルダのために使っています

私の日課はこんな感じです。2.5インチのポータブルUSB HDDを常に1台持っていて、重要でないものを保存したり(パソコンのファイルをHDDに移 動したり)、重要なものをバックアップしたり(ファイルをHDDにコピーしてパソコンにコピーを残しておく)しています。本当に重要なものについては、SpiderOakへのオンラインバックアップを追加で有効にしています (重要なものが入っているフォルダがコンピュータ上にあるので、そこに重要なファイルを移 すだけでSpiderOakが自動的に同期してくれます)。本当に重要なファイルについては、 pyFileFixityを使ってエラー訂正ファイルを計算します

要約すると、重要なものについては、ポータブルHDD、SpiderOakクラウド、自分のコンピュータに保存しているので、2つのクイックアクション(ポータブルHDDへのコピーとSpiderOakフォルダへの移動)だけで、いつでも3つのコピーを持っています。もし1つのコピーが破損してしまった場合は、pyFileFixityを使って多数決で修正することができます。これは(価格的にも時間的にも)非常に低コストなスキームですが、非常に効率的で、デジタルキュレーションのコアとなる考え方(トリプル冗長性、異なる場所にある異なるコピー、異なるメディア、SpiderOakによる完全性チェックとECC)をすべて実装しています

そして、3ヶ月から6ヶ月ごとに自宅の2台目のHDDにポータブルHDDを同期させ、6ヶ月から12ヶ月ごとに別の家にある3台目のHDDにポータブルHDDを同期させています。これにより、ローテーションの利点も得られます(6ヶ月後に前回のバックアップで何か問題があり、重要なファイルを削除してしまったことに気付いた場合、2台の自宅のHDDのうちの1台からファイルを取得することができます)

最後に、DVDisasterを使ってBlu-rayディスクに非常に重要なファイルをいくつか書き込んでみました(あと、pyFileFixityを使って追加のeccファイルも書き込んでみましたが、これは必要なかったかもしれません)。それらは押入れの中の密閉ボックスに入れて保管しています。数年に一度しかチェックしていません

日常的には、ポータブルHDDとSpiderOakフォルダにファイルをコピーして、半年に一度、どちらかの家のHDDに同期しているだけです。これは同期が必要なデータ量にもよりますが、ソフトで自動化されているので、あとはパソコンにソフトを走らせて他のことをするだけです(そのためだけに買った100ドルのネットブックを使っているので、コピーの途中でパソコンがクラッシュして書き込み中のハードディスクが破壊される心配もなく、メインのパソコンで同時に作業することができています)。エラー訂正コードとブルーレイスキームは、本当に重要なデータにしか使わないので、時間はかかりますが、稀にしか使わないですね

この方式は、例えばハードドライブに ZFS/ReFS を使用することで (いつものように) 強化することができます。これにより、自動化された Reed-Solomon エラー訂正コードの保護と整合性チェック (および dittoblocks を実装することができます (pyFileFixity に反して)。ZFS Windows OS では実行できませんが (今のところ)、ファイルシステムレベルで同様のエラー訂正制御を可能にする ReFS があります。また、これらのファイルシステムを外付けHDDで利用するのもいいかもしれませんね!自動化されたRSエラー訂正と重複排除機能を備えたZFS/ReFSを実行しているポータブルHDDは素晴らしいものになるはずです。(ZFS はかなり速いようですので、コピーは速いはずです!)

最後の注意点として、このリストにある のようなファイルシステムの ECC 機能に関する主張には注意してください私の知る限りでは、ZFSとReFSだけがメタデータとデータの両方の真のエラー訂正コードを提供しており(単純なミラーリングではなく)、特にReFSドライブは起動できないため、ZFSが現在最も進んでいます(とはいえ2018年現在ではまだやや実験的ですが)

/UPDATE 2020.新しいソリューションが登場していますが、それらはまだ初期の実験段階にあり、多くの場合、不変ブロックチェーンをベースにした分散型のアプローチを使用しています

  • Perkeep他のソフトウェアとの比較)。似たようなプロジェクトとして、Upspinがある。どちらも2020年初頭の時点で積極的に開発されています
  • Sia
  • Syncthing 複数のデバイス間のバックアップミラーリングを容易にすることができます
  • libchop 開発者向け
  • bitdust(再構築がまだできていないので注意!)

13  gaborous  2016-08-06


簡単な解決策はありません。アーカイブのメンテナンスはプロセスであり、一回限りの仕事ではありません。現在利用可能な3つのアーカイブメディアタイプにはそれぞれプラスとマイナスがありますが、これらの主張はすべてのメディアタイプに当てはまります

  1. DVDやハードディスクを30年も100年も保存した人はいません。だから、記録がないし、メディアがどのように老化するかは誰にもわからない。人工的な老化テストは多くを証明するものではなく、ベンダーのテストに頼っている(公平ではない)

  2. 最高の結果を得るためには、制御された環境(一定の温度・湿度、低照度など)でメディアを保管する必要があります。そうしないとメディアの寿命が著しく短くなります

  3. メディアを読み取るハードウェアとソフトウェアをメンテナンスする必要があります(例:SATAインターフェイスは30年後には容易に利用できなくなるかもしれません)

だから、私の考えでは、家庭用や小規模事業者向けの実行可能なソリューションはこれしかありません

  1. 多様なメディアタイプ(ハードディスクとDVDの両方)のすべてのデータの複数のコピーを管理します
  2. すべてのデータのコピーを複数の場所(自宅と銀行の貸金庫)で管理する
  3. すべてのデータを新しいメディアにコピーします(例えば、2年ごとに新しいハードディスクと新しいDVDディスクにコピーします。データ密度が高くなると、おそらくディスクの数も少なくなるでしょう
  4. 可能であれば、すべての重要なデータのために紙のコピーを維持します(例:ビジネスのための年間総勘定元帳を印刷する、最も貴重な家族の写真を印刷する、など)

11  haimg  2012-01-04


私ならマイクロフィルムにします。まだ製造されているかどうかは知らないが、そうでなかったら驚きだ。銀色のネガは正しく保存されていれば何百年も持つ。もちろん、それは莫大な投資であり、写真撮影と鑑賞のために部屋全体を占有することになりますが、それは保管をカウントしていません。だから、メンテナンスなしで100年以上持つということを本当に意味するならば、それはそれでいいのです

タイムカプセルを作りたいのでなければ、HDDのバックアップを使って、10年から15年ごとに新しいメディアに全部コピーしてください。本当に、メディアの老朽化に対して、10年ごとに全体をコピーするよりも優れた保険はありません。マイクロフィルムよりも、粘土の錠剤よりも、砂漠の砂に埋もれた石のオベリスクよりもいい

5  Sigmoid  2012-04-09


磁気テープ別名テープドライブに最大5TB(以上?この時間が証明されています。ブルーレイレコーダーも30年分までは安全に保存できますが、容量は100GB程度です

もっとお金があれば、白黒35mmフィルムに保存するでしょう。今後700年は(密度にもよるが)データの復元が可能だと想定されている。(ドイツのwikipediaへのリンク)

4  tuergeist  2012-01-04


私は、表面に顕微鏡で情報が刻まれた直径3インチのニッケルディスクをお勧めします

Very Long-Term Backup - The Rosetta Project

2  Dane  2013-04-16


そのような時間的スパンのためには、すでに紙の上にあるもの(または情報を失うことなく簡単に印刷できるもの)は、その形で保存するのが最善でしょう。ただ、ハードコピーに使用する紙とトナーに注意してください

他の人については、現在使用されているデジタルメディアの中で、このようなスパンの時間を維持できるものを私は知りません。あなたのコレクションをリフレッシュするために時間(したがって、お金)を費やす場合は、磁気テープは実行可能なオプションかもしれません – しかし、その場合でも、あなただけの単一のテープが悪くなったことを見つけるかもしれないので、いくつかの冗長性が必要になるでしょう(または、それはちょうどそれを読み取る上でテープドライブがテープを混乱させることが起こるかもしれません)

そして、実際のメディアが時の試練に耐えられるようになったとしても、100年後はおろか30年後にはどの番組でもメディアを読めるのかという問題に直面することになります

1  Juha Laiho  2012-01-04


確かに、一般的なCD-RやDVD-Rでは、重要なデータをアーカイブするのに十分な信頼性がありません。しかし、そんなに早く腐らないDVDを手に入れることができます

archival dvd-r - Google 検索

1  Isaac Rabinovitch  2012-11-10


私は ‘M-Disc’が特殊なライターを必要とするDVDを作成したことを読んだことがありますが、まだ一般的なDVDリーダーで読み取ることができます。彼らはそれを正確にテストすることができないと述べ、1000年の推定可能な寿命を主張している。太陽への長い露出、傷、複数の使用法などとディスクは100%使用可能です。私はこのシステムに遭遇した誰からのフィードバックに興味がある

ここでは、新しいラップトップ/PCにM-DiscドライブをインストールしているかもしれないDellからの抜粋です

M-DISC Readyは、レーザーエッチングしたデータを無機質な岩のような素材にドライブしてデータの損失を防ぎ、ファイルの安全性を確保し、最大1000年間保存できると同社は主張している

データを保持するために有機染料を使用している他のすべての記録可能なDVDとは異なり、Mディスクは時間の経過とともに色あせたり、劣化したりすることはありません

1  Dean  2013-04-16


長寿命のバックアップを実現するためには、さまざまな技術、場所、媒体をミックスする必要があります

  • 低速でDVD-Blurayに焼く。低照度、低温、低湿度、傷のない状態で保管してください
  • RAID1、Raid5、Raid6、Raid10のいずれかのユニットにコピーを保管してください
  • 別のコピーを外付けHDDに入れておく
  • クラウド(カーボナイト、クラッシュプラン)にコピーを保管しておく
  • Mディスク技術(MディスクとMディスクバーナー)でコピーを保持することは、Amazon.comでは非常に良い価格で入手できません。メーカーは、彼らが1000年のためのデータを保持することができると述べています

1  Alex  2013-12-26


誰かがすでに述べたように、M-Discと呼ばれる新しい技術があります。彼らは非常に信頼性が高いです。http://www.zdnet.com/torture-testing-the-1000-year-dvd-7000023203/ 我々は、プロダクションマシンのディスクの画像を確保するためにそれらを使用し始めました。ブルーレイはすでに市場に出回っています。唯一の欠点は、彼らは古典的なB-RDよりも遅いということです

1  Tomasz Szkudlarek  2014-09-03


この問題を解決するための方法を持ちたいのであれば、デジタルプリセーブの分野を勉強しておくと良いでしょう

Digital preservation - Wikipedia

デジタル保存とは、技術の進歩によりオリジナルのハードウェアやソフトウェアの仕様が陳腐化しても、デジタル素材が使用可能な状態を維持できるように保存する方法である(wikipedia)

リファレンスモデルもあります。OAIS http://en.wikipedia.org/wiki/Open_Archival_Information_System

これに対応するためのオープンソースや商用のソリューションがいくつかあります。図書館や公文書館では、デジタル化された書籍を長期間保存するためにこの技術を使用しています

0  AGM  2015-05-21


あなたの答えは簡単です

Cinder - OpenStack

Openstackは、ほぼ「不滅の」ストレージのシステムであり、アップグレードしたり、新しいものと障害ノードを交換したりすることができます。あなたのデータは、このシステムでは、少なくとも2つ、最大5つの場所に同時に住んでいるので、完全なストレージノートが失敗することができますし、あなたのデータはまだ存在しています。50 PB (検証済み) – 110 PBまで拡張可能。基本的には、ハードウェアにSWレイヤーを追加して、ストレージを無限に生きた状態にします。これは、現在のレイドセットの音の壁を克服し、非常に大規模なレイドセットのリビルド時間の制限を克服します。コストは従来のレイドストレージシステムの約50%です。これをリファレンスアーキテクチャとして採用している富士通のシステムを知っています。CD10000です

0  Thomas Holzknecht  2016-03-06


平成26年の現在の技術を使った実践的な長期データ保存

…そして、これが私のしていることです

マルチテラバイトのドライブを2台、例えばそれぞれ3テラバイトのドライブを2台用意します。1台をTB-1、もう1台をTB-2と呼びます。すべてをTB-1にバックアップします。1年間TB-1にバックアップした後、TB-2を再フォーマットし、TB-1をTB-2にコピーします。そして、次の年はすべてをTB-2にバックアップします。1年後、TB-1を再フォーマットし、TB-2をTB-1にコピーして、再び2年に1度のサイクルを開始します

再フォーマットはセクタマーカの磁力を回復します。そして、コピーはデータの磁力を回復します

テープバックアップやCDバックアップ、あるいは他のほとんどのバックアップにも同じ原理が適用できます。しかし、CDは、彼らが1年以内に不良になる可能性があるため、非常に不便であり、あなたはすべてをバックアップするためにそれらの非常に多くを必要としています。だから、5ヶ月ごとにすべてのバックアップCDのコピーを焼くのは、あまりにも手間がかかる。今のところ、1台のマルチテラバイトドライブに人生の全てを保存することができています

-1  Indinfer  2014-05-19


タイトルとURLをコピーしました