Wie kann ich ein backup oder sync ein Amazon S3-bucket?

Ich habe wichtige Daten in einem Amazon S3-bucket. Ich möchte eine wöchentliche Sicherung seiner anderen Inhalten zu einem anderen cloud-service, oder auch im S3. Der beste Weg, um sync meinem Eimer zu einem neuen Eimer in einer anderen region, im Falle von Datenverlust.

Wie kann ich das tun?

verwenden s3cmd s3tools.org/s3cmd, oder schreiben Sie Ihre eigenen backup-tool von s3 api.
ist das wirklich sinnvoll? Daten in S3 ist überflüssig. Aus aws.amazon.com/s3/#protecting: Amazon S3’s standard storage is designed to sustain the concurrent loss of data in two facilities.
Zu fügen Sie eine weitere Erkenntnis über die Nützlichkeit dieses Ansatzes (entnommen aus S3-FAQ): Amazon S3 ist entworfen, um 99,999999999% Zuverlässigkeit von Objekten über einen Zeitraum eines Jahres. Diese zuverlässigkeitsstufe entspricht einem jährlich zu erwartenden objektverlust von 0,000000001%. Zum Beispiel, wenn Sie speichern Sie 10.000 Objekte mit Amazon S3 können Sie im Durchschnitt erwarten Sie, um einen Verlust von einem einzigen Objekt einmal alle zu 10.000.000 Jahre. Neben Amazon S3 ist so konzipiert, zu erhalten, dass ein gleichzeitiger Datenverlust in zwei Anlagen.
Redundanz ist KEIN backup - wenn man von der junior-Entwickler entscheidet zu laufen "s3cmd del —rekursive s3://your-bucket/" dann alle die Redundanz in der Welt wird dich nicht retten !
Auch, was ist, wenn Sie ausgesperrt sind, der S3? Sie verlieren Ihre Daten.
Sieht aus wie S3 bietet MFA Delete Schutz gegen das

InformationsquelleAutor VAAA | 2012-08-05

amazon-s3 backup

14

Ich lieber backup lokal mit sync, wo nur die änderungen aktualisiert werden. Das ist nicht die perfekte backup-Lösung aber, die Sie umsetzen können regelmäßige updates später, wie Sie benötigen:
```
s3cmd sync --delete-removed s3://your-bucket-name//path/to/myfolder/
```
Wenn Sie nie benutzt s3cmd installieren und konfigurieren Sie es mit:
```
pip install s3cmd
s3cmd --configure
```
Auch es sollte S3-backup-Dienste für $5/Monat, aber ich würde auch prüfen, Amazon Glacier können Sie stellen fast 40-GB-single-Archiv-Datei, wenn Sie mit einem multi-Teil hochladen.

http://docs.aws.amazon.com/amazonglacier/latest/dev/uploading-archive-mpu.html#qfacts

Denken Sie daran, wenn Sie Ihre S3-Konto kompromittiert ist, haben Sie die chance, um alle Ihre Daten verlieren, als würden Sie die Synchronisierung leere Ordner oder fehlerhafte Dateien. So, Sie besser ein Skript schreiben, archivieren Sie Ihre backup paar mal, für e.g durch die Erkennung von Anfang der Woche.

Update 01/17/2016:

Python-basierte AWS CLI ist jetzt sehr reif.

Verwenden Sie bitte: https://github.com/aws/aws-cli

Beispiel: aws s3 sync s3://mybucket .
- Was sind einige dieser $5 s3-backup-Dienste? Ich möchte eine Sicherung, die schützt gegen menschliche Fehler. Wir verwenden s3 wie einen shared-server.
- Sie scheinen nicht zu sein, um mehr, ich schlage vor, dass ein anderes cloud-Konto wie Google Cloud Plattform für das speichern von Duplikaten vielleicht.
InformationsquelleAutor placeohlder

Dieses Skript sichert eine S3-bucket:

#!/usr/bin/env python
from boto.s3.connection import S3Connection
import re
import datetime
import sys
import time

def main():
    s3_ID = sys.argv[1]
    s3_key = sys.argv[2]
    src_bucket_name = sys.argv[3]
    num_backup_buckets = sys.argv[4]
    connection = S3Connection(s3_ID, s3_key)
    delete_oldest_backup_buckets(connection, num_backup_buckets)
    backup(connection, src_bucket_name)

def delete_oldest_backup_buckets(connection, num_backup_buckets):
    """Deletes the oldest backup buckets such that only the newest NUM_BACKUP_BUCKETS - 1 buckets remain."""
    buckets = connection.get_all_buckets() # returns a list of bucket objects
    num_buckets = len(buckets)

    backup_bucket_names = []
    for bucket in buckets:
        if (re.search('backup-' + r'\d{4}-\d{2}-\d{2}' , bucket.name)):
            backup_bucket_names.append(bucket.name)

    backup_bucket_names.sort(key=lambda x: datetime.datetime.strptime(x[len('backup-'):17], '%Y-%m-%d').date())

    # The buckets are sorted latest to earliest, so we want to keep the last NUM_BACKUP_BUCKETS - 1
    delete = len(backup_bucket_names) - (int(num_backup_buckets) - 1)
    if delete <= 0:
        return

    for i in range(0, delete):
        print 'Deleting the backup bucket, ' + backup_bucket_names[i]
        connection.delete_bucket(backup_bucket_names[i])

def backup(connection, src_bucket_name):
    now = datetime.datetime.now()
    # the month and day must be zero-filled
    new_backup_bucket_name = 'backup-' + str('%02d' % now.year) + '-' + str('%02d' % now.month) + '-' + str(now.day);
    print "Creating new bucket " + new_backup_bucket_name
    new_backup_bucket = connection.create_bucket(new_backup_bucket_name)
    copy_bucket(src_bucket_name, new_backup_bucket_name, connection)


def copy_bucket(src_bucket_name, dst_bucket_name, connection, maximum_keys = 100):
    src_bucket = connection.get_bucket(src_bucket_name);
    dst_bucket = connection.get_bucket(dst_bucket_name);

    result_marker = ''
    while True:
        keys = src_bucket.get_all_keys(max_keys = maximum_keys, marker = result_marker)

        for k in keys:
            print 'Copying ' + k.key + ' from ' + src_bucket_name + ' to ' + dst_bucket_name

            t0 = time.clock()
            dst_bucket.copy_key(k.key, src_bucket_name, k.key)
            print time.clock() - t0, ' seconds'

        if len(keys) < maximum_keys:
            print 'Done backing up.'
            break

        result_marker = keys[maximum_keys - 1].key

if  __name__ =='__main__':main()

Ich diese in einem rake-task (für eine Rails-app):

desc "Back up a file onto S3"
task :backup do
     S3ID = "AKIAJM3FAKEFAKENRWVQ"
     S3KEY = "0A5kuzV+F1pbaMjZxHQAZfakedeJd0dfakeNpry"
     SRCBUCKET = "primary-mzgd"
     NUM_BACKUP_BUCKETS = 2

     Dir.chdir("#{Rails.root}/lib/tasks")
     system "./do_backup.py #{S3ID} #{S3KEY} #{SRCBUCKET} #{NUM_BACKUP_BUCKETS}"
end

FYI ... Ihre S3-ID und der Schlüssel scheint zu sein, ausgesetzt in dieser Antwort.
Die sind fake.

InformationsquelleAutor Rose Perrone

0

Habe ich versucht, dies zu tun in der Vergangenheit, und es ist immer noch frustrierend schwer, vor allem mit großen, multi-GB-viele-Millionen-von-Dateien Eimer. Die beste Lösung, die ich jemals gefunden wurde S3S3Mirror, die gemacht wurde, für genau diesen Zweck.

Es ist nicht so trivial wie einfach nur einen Schalter umlegen, aber es ist immer noch besser als die meisten anderen DIY-Lösungen, die ich ausprobiert habe. Es ist multi-threaded und kopieren Sie die Dateien viel schneller als vergleichbare single-threaded Ansätze.

Einen Vorschlag: stellen Sie es auf einem separaten EC2-Instanz, und sobald Sie es ausführen, nur den Mund, die Maschine aus-aber lassen Sie die AMI dort. Dann, wenn Sie Sie brauchen, um re-run -, Feuer-die Maschine wieder auf und Sie sind alle gesetzt. Dies ist bei weitem nicht so schön wie eine echte automatisierte Lösung, sondern überschaubare monatliche oder wöchentliche backups.

InformationsquelleAutor Micah
0

Ist der beste Weg, um haben die Fähigkeit, zu synchronisieren mein Eimer mit einem neuen Eimer in einer anderen region im Falle eines Datenverlustes.

Als der 24 Mar 2015, dies ist möglich mit der Cross-Region Die Replikation - feature von S3.

Einen der aufgeführten Use-case-Szenarien ist "compliance-Anforderungen", das scheint zu passen Sie Ihre use-case für zusätzlichen Schutz wichtiger Daten gegen Datenverlust:

Obwohl, standardmäßig, Amazon S3 speichert Ihre Daten auf mehrere geografisch entfernte Availability Zones, compliance-Anforderungen könnten diktieren, die Sie speichern Daten auf noch weitere Entfernungen. Cross-region die Replikation ermöglicht das replizieren von Daten zwischen entfernten AWS-Regionen auf die Erfüllung dieser compliance-Anforderungen.

Sehen How to Set Up Cross-Region die Replikation für die setup-Anweisungen.

InformationsquelleAutor wjordan

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.