GithubHelp home page GithubHelp logo

backups-biod's Introduction

Strategie backupów

1 Co backupować?

1.1 Jakie rzeczy są warte backupu?

Wg PCWorld[fn::~www.pcworld.com/article/525129/7_backup_strategies.html~] jest kilka kategorii, które szczególnie warto backupować. Są to m.in.:

  1. Dokumenty
  2. Ostatnie dokumenty (jeśli program nie wspiera kopii przyrostowych)
  3. Zdjęcia, filmy i inne media
  4. Pamiątki
  5. System

2 Czego się trzymać przy wybieraniu metody?

2.1 Prostota

Backup powinien być prosty w użyciu - jeśli będzie wymagał nauki wielu rzeczy - nikomu nie będzie się chciało go robić.

2.2 Automatyzacja

Bez automatyzacji bardzo szybko zaczniemy zapominać o zrobieniu backupu, a w ten sposób najszybciej stracimy dane - nie będzie jeszcze ich kopii.

2.3 Przygotowany na tragedię

Możemy mieć backup, ale nic nam po nim, jeżeli wszystkie wersje danych były w płonącym domu.

3 Jak wybrać nośnik danych?

3.1 Trwałość

Nie chcemy, aby nasz backup przestał działać przez sam wiek. Może się coś takiego stać np. w przypadku starych dyskietek, jednak dyski też nie są w 100% bezpieczne pod tym względem.

3.2 Pojemność

Z czasem nasz backup może się zrobić naprawdę duży - jeśli wybierzemy niezbyt pojemny nośnik - zajmie on bardzo dużo miejsca. Jeśli wybierzemy za duży - po uszkodzeniu nośnika stracimy zbyt wiele danych.

3.3 Prędkość

Trzeba znaleźć złoty środek dla tych trzech wartości - taśmy magnetyczne są zarówno trwałe, jak i pojemne (a także przy ich uszkodzeniu tracimy tylko część danych), ale są bardzo wolne - dane mogłyby się zapisywać wolniej, niż dochodzą nowe.

3.4 Jakich nośników użyć?

Dostępnych jest wiele rozwiązań - od tych przeznaczonych dla zwykłego ,,Kowalskiego” po rozwiązania klasy Enterprise, które różnią się między sobą znacznie. Dla większości wystarczający byłby dodatkowy dysk ze skonfigurowaną chmurą, jednak firmy mogą wymagać więcej. Np. skonfigurowany serwer sieciowy, do którego automatycznie będą wysyłane dane, a do tego użycie centrum danych do ich przechowywania. W korporacjach często używane są taśmy magnetyczne (sic!), takie jak w kasetach VHS, jednak w dużo nowszej technologii.

3.5 Chmury, czyli pożycz pan szpulę…

Wiele z dostępnych rozwiązań chmurowych używa zwykłych dysków, jednak jesteśmy w stanie dużo niższym kosztem trzymać dane w miejscach takich jak S3 Deep Archive czy S3 Glacier. Jest to rozwiązanie oferowane przez Amazon Web Services, które bazuje na szpulach właśnie. Pozwalają one na przechowywanie dużych ilości danych niskim kosztem, ale mają jeden, znaczący minus - są bardzo wolne. Możemy wysyłać tam dane z niemal pełną prędkością, jednak ich odczyt jest bardzo długi (i kosztowny). Warto tam trzymac dane, które mają już kilka innych kopii, a nie boimy się już o ich utratę.

4 Rotacja nośników

4.1 Round robin

Nośniki wymieniane są po kolei

./img/round_robin.png

4.2 Grandfather-Father-Son (GFS)

Nośniki są podzielone na kategorie:

  1. Kopie dzienne (pon-czw) - Son
  2. Kopie tygodniowe (co piątek) - Father
  3. Kopie miesięczne - Grandfather

Każdy z takich zestawów jest nadpisywany nowymi danymi po wystąpieniu ,,większego” cyklu, tj. Kopie dzienne zaczynamy nadpisywać po zrobieniu kopii tygodniowej, a tygodniowe - po miesięcznej.

4.3 Tower of Hanoi

Ten schemat rotacji nośników jest oparty na popularnym problemie programistycznym - wieżach Hanoi. W naszym wypadku dzielimy nośniki na pięć kategorii:

  1. A - Backupy co drugi dzień
  2. B - Backupy co czwarty dzień
  3. C - Backupy co ósmy dzień
  4. D i E - Backupy co szesnasty dzień.

4.4 Tower of Hanoi c.d.

./img/hanoi.png

5 Typy kopii

5.1 Kopia pełna (full backup)

Wszystkie pliki są kopiowane na nowy nośnik - zwykle jest to pierwsza iteracja kopii następnych. Jest kosztowna ze względu na użycie takiej samej ilości miejsca, jak dane oryginalne za każdym razem.

PlusyMinusy
SamowystarczalnaDuża
Łatwa w przywróceniuKosztowna

5.2 Kopia przyrostowa (incremental backup)

Tylko pliki utworzone/zmienione od ostatniego backupu są kopiowane

PlusyMinusy
SzybkaWymaga poprzednich wersji
Lekka

5.3 Kopia różnicowa (differential backup)

Podobnie jak w kopii przyrostowej - kopiowane są dane jedynie po zmianie, ale od ostatniego pełnego backupu.

PlusyMinusy
SzybkaWymaga pełnego backupu
Średnia wagaRośnie dużo szybciej od kopii przyrostowej

6 3-2-1… start!

6.1 Trzy…

kopie danych - w razie równoległego problemu z dwoma nośnikami - zawsze pozostaje trzeci.

6.2 Dwa…

różne nośniki - nie trzymanie wszystkich danych jedynie na np. dyskach HDD może spowodować, że przy jakimś incydencie stracimy wszystkie dane przy awarii dysków.

6.3 Jeden…

backup powinien się znajdować w innym miejscu - w ten sposób jesteśmy zabezpieczeni przed sytuacjami losowymi takimi jak pożar czy powódź.

A dlaczego z tych trzech tylko jeden w innej lokalizacji? Odpowiedź jest stosunkowo prosta - dużo szybciej odzyskamy dane lokalnie, niż pobierając je przez internet.

6.4 Start!

Wszystkie podane wcześniej wartości są wartościami minimalnymi - w tym wypadku więcej znaczy lepiej.

7 Retencja

7.1 Po co mi te stare dane?

Czasami zdarza się tak, że usuniemy coś, zakładając, że już więcej się nie przyda, a po jakimś czasie okazuje się, że była to ważna informacja - w takim momencie przydają się starsze dane.

7.2 Jak długo trzymać to wszystko?

Zwykle wystarczą dane z ostatnich kilku dni, jednak często zaleca się, aby też trzymać informacje jeszcze starsze - przy trzymaniu codziennych wersji może się tego zrobić naprawdę dużo, ale jest kilka rozwiązań:

  1. Retencja - trzymamy dane z ostatnich 3 dni, ale z każdego tygodnia mamy już tylko podsumowanie. Analogicznie dla miesiąca - nie trzymamy tygodniowych backupów starszych niż tydzień, a jedynie ich miesięczne podsumowanie.
  2. Kopie przyrostowe - nie zapisujemy ponownie danych, które już mamy (chyba, że się zmieniły), a tylko te nowe.

7.3 Jak ustawić retencję?

Nie ma złotego rozwiązania - każdy musi sobie odpowiedzieć jak długiej historii potrzebuje. W moim wypadku wygląda to tak:

  1. Kopie dzienne - zależnie od tego czy to kopia zdalna czy lokalna (tę drugą robię częściej) - trzymam wszystkie backupy z danego dnia
  2. Kopie tygodniowe - w danym tygodniu zapisuję tylko trzy dni
  3. Kopie miesięczne - dwanaście miesięcy ma swoje podsumowanie
  4. Kopie roczne - aż dziesięć lat wstecz - do tego momentu jeszcze nie dotarłem.

8 Ale jak to wszystko zastosować?

8.1 Poznajcie Zenka…

Zenek jest studentem zarządzania. Aktualnie pisze swoją pracę licencjacką, której bardzo nie chce stracić. Od lat nie stracił żadnego dysku, aż tu nagle chlup - komputer zalany. W wielkiej panice Zenek próbuje jeszcze raz uruchomić komputer, jednak jedyne co w tym momencie słyszy to cichy trzask. Decyduje się oddać komputer do naprawy.

8.2 A w serwisie…

Komputera nie udało się odratować. Serwisant pokazuje dysk Zenkowi - cały zalepiony, a w jednym miejscu czarny - to było spięcie. Nie ma czego ratować (albo jest to bardzo drogie). Zenek jest zdruzgotany i musi zacząć z pracą od nowa.

8.3 Co by było gdyby?

Zenek przypomina sobie jednak o tym, że wykupił usługę kopii zapasowych. Jego Word automatycznie zapisuje pliki do chmury! Po sprawdzeniu OneDrive są trzy możliwości:

  1. Zenek nie stracił dosłownie nic związanego ze swoją pracą
  2. Zenek stracił tydzień pracy - coś się zawiesiło w aplikacji synchronizującej
  3. Zenek stracił wszystko - stwierdził, że ma za mało miejsca i tego pliku akurat tam nie potrzebuje i śmieszne zdjęcia piesków są ważniejsze.

8.4 Na pomoc przychodzi kopia zapasowa

Zenek mógł być jednak zaradny i skonfigurować kopie zapasowe niezależne od OneDrive. Co w przypadku, jeśli faktycznie je ma?

Może pobrać cały dysk na nowy, wgrać do nowego systemu stare pliki i wrócić do pracy - w najgorszym wypadku stracił kilka godzin pracy.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.