Corrupció i pèrdua de les dades

Factors principals en la pèrdua de dades digitals

Mentre que les dades digitals es poden perdre si l'única còpia d'un suport digital es roba o es perd en un incendi (aquest tipus de pèrdua és el mateix que pot ocórrer a les còpies en paper tradicionals o negatius). Així que aquí parlarem dels altres focus de pèrdua de dades digitals que es poden categoritzar aproximadament en les següents àrees de preocupació:

  • El deteriorament físic del suport (tots els suports es deterioren a diferents velocitats).

  • Errors de transmissió no detectats durant la transferència de les dades.

  • La falta de suport a llarg termini per a formats digitals propietaris.

  • Maquinari antic.

Kroll Ontrack, l'empresa de recuperació de dades més gran del món, té algunes estadístiques interessants sobre el que realment causa la pèrdua de les dades.

Causa de la pèrdua de les dades

Percepció

Realitat

Problema de maquinari o del sistema

78%

56%

Error humà

11%

26%

Corrupció o problema del programari

7%

9%

Virus informàtics

2%

4%

Desastre

1-2%

1-2%

Així que analitzarem aquests casos pas a pas.

Deteriorament de l'emmagatzematge

Els dispositius que es llisten a continuació s'ordenen per la velocitat d'accés a les dades, de més lent a més ràpid.

Suport magnètic

Les cintes magnètiques s'utilitzen habitualment en sistemes de còpia de seguretat professional, però rarament s'utilitzen en sistemes domèstics. Les cintes tenen problemes amb la retenció de dades a llarg termini, poden ser danyades per camps magnètics forts, i la tecnologia de cinta està canviant constantment. No obstant això, les cintes són més segures en alguns aspectes que les unitats òptiques: són menys susceptibles a rascades, brutícia i errors durant l'escriptura. Per a evitar problemes de retenció de dades a llarg termini, les cintes s'han de tornar a copiar cada 5-8 anys, en cas contrari, fallaran massa bits perquè la protecció de la suma de verificació els corregeixi. El desavantatge de les cintes magnètiques és que les unitats de cinta són cares i el temps per a restaurar les dades pot ser 20x més llarg que des d'un disc dur. Els sistemes de còpia de seguretat de cintes s'utilitzen millor en grans entorns professionals que necessiten fer còpies de seguretat de quantitats massives de dades.

Unitats òptiques

Potser us sorprendrà saber que molts CD-R es deterioren físicament a un ritme més ràpid que la pel·lícula. No obstant això, mentre que la pel·lícula pot durar més dècades que alguns suports òptics, els suports digitals que es fan còpies de seguretat regularment mai perden res. La pel·lícula comença a desintegrar-se en el moment en què es crea i es revela (els 1 i 0 digitals no ho fan). La pel·lícula mai tindrà el mateix color i contrast que quan es va crear per primera vegada. El digital no ho fa. No obstant això, els suports digitals són susceptibles de corrupció.

Tots els suports òptics són propensos a errors, fins i tot en un estat acabat d'escriure. És per això estan molt protegits amb codis de correcció d'errors que ocupen fins el 25% de l'emmagatzematge efectiu al disc. Però fins i tot amb aquesta enorme quantitat de protecció encara pateixen deteriorament per envelliment químic, exposició ultraviolada, rascades, pols, etc.

El CD o DVD mitjà que es cuida adequadament no s'hauria de confiar-hi més enllà de pocs anys. Es poden comprar CD i DVD de qualitat d'arxiu que duren molt més temps, però són més difícils d'obtenir i són molt més cars. Hi ha ofertes de suports òptics banyats en or que costen uns quants euros cada peça que afirmen una vida d'emmagatzematge de 100 anys (si voleu creure-ho).

A la llarga, tots els discs òptics poden resultar impossibles de llegir, però es pot reduir el risc emprant discs de bona qualitat, una gravadora bona, i emmagatzemar el disc d'una manera correcta. Les millors gravadores òptiques no són molt més cares que les més barates, però escriuen d'una manera molt més fiable. És una qüestió de triar la correcta.

Per a unitats òptiques malmeses, vegeu a la Viquipèdia la llista de totes les aplicacions habituals dissenyades per a obtenir dades de disquets, discs durs, suports flash malmesos com ara memòria de càmeres i unitats USB o similars.

El disc Blu-ray com a suport òptic de doble capa pot emmagatzemar 50 GB, gairebé sis vegades la capacitat d'un DVD de doble capa amb 8,5 GB. Tot el que s'ha dit sobre els CD/DVD també s'aplica als discs Blu-ray.

Millor pràctica: Cremar els suports òptics lentament amb un bon gravador en un suport amb qualitat d'arxiu en un format obert, no propietari. Llegir les dades de nou per a verificar, etiquetar-lo amb un text descriptiu amb la data i autor. Tancar-lo en un lloc net, fosc, sec i protegit d'animals. I no oblideu de copiar-los en la pròxima generació de suports abans de desfer-vos de l'última peça de maquinari o programari capaç de llegir-los.

Discs durs

Els fabricants de discs durs (HDD) guarden les seves estadístiques per a si mateixos. La garantia d'un fabricant us fa comprar un disc nou, però no hi ha dades sobre el temps que pot durar. Backblaze, un proveïdor d'emmagatzematge, va informar d'una taxa de fallada anual de l'1,5% el 2023 basada en un inventari de 237.278 discs durs. Google ha fet un estudi a gran escala sobre els mecanismes de fallada dels HDD <https://en.wikipedia.org/wiki/Hard_disk_drive>: Estudi de fallades de disc («Disk Failures study»).

En poques paraules: els discs funcionen més temps quan operen entre 35°C i 45°C. Pot semblar contraintuïtiu, però les taxes de fallada dels HDD augmenten dràsticament a temperatures més baixes. Les parts controladores (electrònica) són les fonts de fallada principals, una font d'error que SMART no diagnostica. Alguns errors SMART són indicatius d'una fallada imminent, en particular els errors d'escaneig i els comptadors de reubicació. L'esperança de vida és de 4-5 anys.

En general, i contràriament a la intuïció o les consideracions ecològiques, el funcionament continu d'un disc dur resulta en una vida útil més llarga que no pas encendre'l i apagar-lo tota l'estona. Fins i tot s'ha informat que les vides dels HDD es poden reduir mitjançant una gestió agressiva d'energia que desacceleri ràpidament el gir de la unitat. Així que els pitjors factors per als HDD són probablement les vibracions, els xocs i les temperatures fredes.

Si la unitat comença a fer sorolls estranys, un programari de recuperació de fitxers normal no ajudarà. Feu una còpia de seguretat ràpida. (Utilitzeu la utilitat «dd» si és possible, no una còpia de seguretat normal, ja que «dd» llegeix en un flux suau, des del començament fins al final sense estressar la mecànica). Hi ha empreses especialitzades que poden recuperar dades que fallen, però el procés és molt car.

La suite SmartMonTools de Linux permet consultar els dispositius de maquinari d'emmagatzematge per a fallades futures. Recomanem molt l'ús d'aquesta mena d'eines al vostre ordinador.

Discs en estat sòlid

Els discs SSD són mecànicament més robustos i molt més ràpids que els discs durs. Els SSD estan substituint els discs durs, ja que la capacitat i el preu esdevenen més competitius, fent-los cada cop més una bona solució com a dispositius d'emmagatzematge permanent de les dades.

Backblaze, un proveïdor d'emmagatzematge, ha informat d'una taxa de fallada anual de l'1% el 2023 basada en un inventari de 3.144 SSD. Per tant, els SSD són millors que els HDD, però també no són 100% fiables.

Quan els SSD s'utilitzen com a dispositiu extern, una de les causes principals de pèrdua de dades (sovint recuperable) és l'extracció insegura del SSD de l'ordinador. Abans que les dades es desin des de la memòria de l'ordinador a qualsevol dispositiu connectat, s'emmagatzemen durant un temps en una memòria intermèdia. En els discs durs això significa com a màxim segons, mentre que amb els SSD pot ser desenes de minuts. Per tant, abans de desconnectar un dispositiu flaix, assegureu-vos sempre que les memòries intermèdies de dades s'han buidat utilitzant les capacitats d'extreure el dispositiu de forma segura del sistema operatiu.

Memòria no volàtil

La NVM Express (NVMe) per a memòria no volàtil és una interfície de dispositiu lògic per a accedir al bus PCI Express (PCIe) connectat a un suports d'emmagatzematge no volàtil d'un ordinador. Utilitza la mateixa memòria flaix NAND molt ràpida que s'utilitza en els SSD, però utilitza la interfície de targetes M.2 en lloc del mSATA més lent que s'utilitzava amb els HDD més antics.

La NVMe permet que el maquinari i el programari de l'amfitrió aprofitin al màxim els nivells de paral·lelisme possibles en els SSD moderns. La NVMe redueix la sobrecàrrega en l'E/S i ofereix diverses millores de rendiment en relació amb els SSD anteriors. Els protocols d'interfície mSATA es van desenvolupar per a utilitzar-los amb unitats de disc dur molt més lentes on hi ha una demora molt llarga entre una sol·licitud i la transferència de dades, i on les velocitats de les dades són molt més lentes que les velocitats de la RAM.

Atès que els dispositius NVMe utilitzen el mateix maquinari que els SSD per a emmagatzemar dades, la seva fiabilitat hauria de ser similar.

Important

En tots els casos, els SSD o NVMe com a dispositius interns són la solució més moderna i eficient per a allotjar les bases de dades i les col·leccions d'imatges del digiKam.

Fallades de subministrament elèctric

Pujades de tensió

Per més que cada any, l'1% de tots els equips es veuen afectats per llamps i sobretensions.

Aquesta secció és sobre la pèrdua total de les dades a causa de les pujades de tensió. Òbviament, és possible que tingueu una pèrdua de les dades de tant en tant a causa dels talls d'energia, abans de desar els fitxers. Però aquestes pèrdues normalment es poden recuperar sense grans dificultats.

No cal que espereu a la pròxima tempesta per a preocupar-vos de com podrà afectar el vostre sistema amb una fluctuació en el corrent elèctric. Estadístiques recents mostren que prop del 63% dels accidents electrònics es deuen a problemes elèctrics, i la majoria dels ordinadors estan subjectes a dues o més anomalies elèctriques al dia. Atès que les pujades de tensió o talls d'energia poden ocórrer en qualsevol lloc i en qualsevol moment, té sentit protegir l'ordinador invertint en algun tipus de dispositiu de protecció contra les sobretensions.

Com succeeixen les sobretensions

Una pujada de tensió es produeix quan la tensió de la xarxa augmenta en valors nominals durant més de 10 mil·lisegons. El seixanta per cent de totes les pujades de tensió es produeixen a casa o l'oficina, generalment quan s'apaga un dispositiu amb motor (com ara un assecador de roba, nevera o bomba d'aigua) i la potència que emprava es desvia a altres llocs com a excés de tensió. El 40% restant de les pujades de tensió es generen per factors com els llamps, la commutació de la xarxa, canvis de línia, cablejat deficient, etc.

Encara que la majoria dels dispositius elèctrics no es veuen afectats per les pujades de tensió, els dispositius que es basen en xips d'ordinador i microprocessadors són susceptibles a danys greus. Les anomalies elèctriques que entrin a l'ordinador poden provocar bloquejos de teclat, la pèrdua completa de les dades, la degradació del maquinari, plaques base malmeses, entre d'altres. El fet de fallar en protegir-vos de l'inevitable pot resultar en una pèrdua de temps i diners.

Protectors de sobretensions

La defensa més comuna contra les pujades de tensió és un protector o supressor de sobretensions, un dispositiu que treballa absorbint l'excés d'energia i derivant la resta cap a terra. Normalment, es troben en forma de regleta (un d'aquests dispositius llargs que tenen sis punts d'endoll i una única connexió a terra). Tingueu en compte, però, que no totes les regletes serveixen com a protector de sobretensions.

Quan trieu el vostre protector de sobretensions, assegureu-vos que compleix amb la norma UL 1449, el qual garantirà un cert nivell mínim de protecció de les dades. També n'haureu de cercar un que ofereixi protecció contra els llamps (no tots ho fan) i que proporcioni seguretat per als dispositius que estiguin correctament connectats.

Com que una pujada de tensió pot seguir qualsevol camí al vostre ordinador, assegureu-vos que cada perifèric connectat al vostre sistema estigui protegit. Això inclou la línia telefònica o el mòdem per cable, ja que també poden sorgir pics a través d'aquests camins. Alguns fabricants produeixen protector de sobretensions que contenen una presa de telèfon per al mòdem, juntament amb les preses de corrent, mentre que altres tenen preses de cable coaxials per a aquells que utilitzen un mòdem o targeta sintonitzadora de TV per cable.

Si teniu un ordinador portàtil, és possible que també vulgueu portar un protector de sobretensions. Hi ha una àmplia varietat de supressors dissenyats específicament per a portàtils. Són de mida petita i tenen dues preses, una elèctrica i una de telèfon, el qual els fan ideals per al seu ús a la carretera.

Sistema d'alimentació ininterrompuda

Tot i que un protector de sobretensions protegirà el vostre sistema de les fluctuacions petites a la línia elèctrica, no us ajudarà en el cas d'una apagada elèctrica. Fins i tot una caiguda d'alguns segons pot provocar la pèrdua de dades valuoses, per la qual cosa val la pena invertir en un sistema d'alimentació ininterrompuda (SAI).

A més de ser protectors de sobretensions, aquests dispositius canvien automàticament a una bateria quan es produeix un tall d'energia, el qual us permetrà desar les dades i apagar el sistema. Alguns models fins i tot permeten continuar treballant fins que torni el subministrament. Quan compreu un SAI, assegureu-vos que disposa de les mateixes qualitats que voleu trobar en un protector de sobretensions, però comproveu també la durada de la bateria i el programari inclòs.

Si teniu en compte el risc potencial per al vostre ordinador, assegureu-vos que la vostra seguretat contra els trastorns elèctrics és una inversió rendible. Un protector de sobretensions de qualitat o un SAI de 500 W no són massa cars per a la tranquil·litat que obtindreu sabent que l'equip està ben protegit. Com a mínim, considereu desconnectar totes les línies quan marxeu de vacances.

Política de salvaguarda

Serveis d'emmagatzematge web

Els serveis web d'Amazon inclouen S3 -Servei d'emmagatzematge senzill-. Amb la configuració adequada, podeu muntar el S3 com a una unitat en els sistemes Linux, Mac i Windows, el qual permetrà utilitzar-la com a destinació per a la còpia de seguretat per al vostre programari preferit. Google Drive és un altre servei popular d'emmagatzematge al núvol on una persona pot emmagatzemar una quantitat infinita de dades.

L'emmagatzematge al núvol és car en comparació amb els discs durs a casa. I cal transferir les imatges a través d'un Internet relativament lent. Però creiem que l'emmagatzematge en el núvol pot ser una salvaguarda útil contra la pèrdua de dades localitzades de les imatges més essencials.

Google Photo i Flickr ofereixen serveis d'emmagatzematge en línia que estan especialitzats en fotografies. El seu espai de franc és limitat, així que no voldreu emmagatzemar imatges en resolució completa en línia. Però els de pagament ofereixen més emmagatzematge.

Les solucions basades en web són probablement bastant segures en termes de retenció de dades. Els errors de transmissió es corregeixen automàticament (gràcies al protocol TCP) i les grans empreses solen tenir còpies de seguretat incloses més emmagatzematge distribuït perquè ells mateixos siguin a prova de desastre.

El digiKam proporciona una eina per a exportar elements al servei web iNaturalist

Els errors de transmissió

La pèrdua de dades no només es produeix des dels dispositius d'emmagatzematge, les dades també es poden perdre quan viatgen dins de l'ordinador o a través de xarxes (encara que el trànsit de xarxa en si a través de TCP està protegit contra errors). Els errors es produeixen ocasionalment en els busos informàtics interns i en els xips de memòria. El maquinari dels particulars no té protecció contra errors de bits aleatoris, però la tecnologia per a controlar i corregir errors existeix. Es pot comprar memòria protegida ECC (codi de correcció d'errors), que funcionarà amb una placa mare amb suport d'ECC, encara que és cara. Amb la RAM ECC <https://en.wikipedia.org/wiki/ECC_memory> com a mínim la memòria serà monitorada per errors d'un sol bit i corregida. Els errors de doble bit poden escapar de la detecció, però es produeixen amb tan poca freqüència per a preocupar-se.

El flux de treball de dades entre l'aplicació i el suport d'emmagatzematge

Aquest diagrama representa els elements de la cadena de transmissió en un ordinador, totes les transicions són susceptibles a errors de transmissió. Els sistemes de fitxers ZFS i BTRFS estan dissenyats per a assegurar la integritat de les dades en el camí des del sistema operatiu Linux cap al disc.

El percentatge d'error de bits (BER) de la memòria i els canals de transmissió va en l'ordre d'1 entre 10 bilions (1E-12 per bit). Això només vol dir que 1 de cada 30 megabytes d'imatges tenen un error a causa dels problemes de transmissió. Ara, l'impacte en una imatge queda a l'atzar. El qual pot significar la destrucció total de la imatge o simplement el canvi d'un píxel. Però, a causa de la compressió que s'utilitza en gairebé totes les imatges, no és possible predir l'impacte d'un error en un únic bit.

El pitjor de tot és que no hi ha cap avís del maquinari quan es produeix un error de transmissió o de memòria. Totes aquestes inestabilitats poden passar desapercebudes, fins que un dia obriu la fotografia, descobrint amb sorpresa que està malmesa. Pot semblar molt preocupant que no hi hagi cap protecció contra els errors de transmissió dins d'un ordinador. És sorprenent que Internet (protocol TCP) sigui molt més segur com a canal de dades que dins d'un ordinador.

Les fonts d'alimentació inestables són una altra font de pèrdues de transmissió, ja que creen interferències en els fluxos de dades. Amb molts sistemes de fitxers normals, aquests errors poden passar desapercebuts.

Futur dels sistemes de fitxers

El ZFS d'Oracle sembla un dels dos candidats per a fer front als errors de baix nivell en el disc, i és altament escalable. És de codi obert, molt patentat, ve amb una llicència incompatible amb la GPL i està disponible a Linux i macOS.

Oracle també ha presentat el seu sistema de fitxers BTRFS. Utilitza la mateixa tècnica de protecció que ZFS i està disponible al Linux.

Errors humans

Robatoris i accidents

No subestimeu el potencial de pèrdua de dades per robatoris o accidents. Aquests dos factors representen el 86% de les pèrdues de dades en ordinadors portàtils i el 46% en sistemes d'escriptori. Per als ordinadors portàtils, el robatori ja representa el 50%.

Programari maliciós

La pèrdua de dades a causa dels virus és menys greu del que la saviesa popular vol fer creure. Representa menys danys que el robatori o les reinstal·lacions, per exemple. Tot i que el programari maliciós solia limitar-se principalment al SO Microsoft, la freqüència d'atacs a sistemes Linux i Apple ha crescut.

Humans i la pèrdua de les dades

L'error humà, com en tot, és un problema important en la pèrdua de les dades. La gent tendeix a fer coses realment estúpides. Els usuaris amb experiència trauran la unitat amb errors d'una matriu RAID o reformatarà la unitat, destruint tota la seva informació. Actuar sense pensar és perillós per a les vostres dades.

Quan alguna cosa vagi malament, respireu profundament i no us esvereu. La millor aproximació és fer un pla abans de prendre qualsevol acció que pugui provocar una pèrdua de dades significativa. Després, seieu i expliqueu el pla a una persona inexperta. Us sorprendrà veure quants errors estúpids es poden evitar simplement fent un pla i explicant-lo a una altra persona.

Si el disc comença a fer sorolls estranys, el programari normal de recuperació no ajudarà. Feu ràpidament una còpia de seguretat. Si la unitat encara gira i no podeu trobar les vostres dades, cerqueu una utilitat de recuperació de dades i feu una còpia de seguretat a un altre ordinador o unitat. Una solució universal i potent pot ser utilitzar la suite de codi obert CloneZilla. L'important és baixar les vostres dades en una altra unitat, sigui en un altre ordinador, o en una unitat USB o disc dur. És una bona pràctica desar sempre les dades recuperades en un altre disc. L'eina «dd» és la vostra amiga en els sistemes Linux.

Esvair els mites habituals

Ens agradaria esvair alguns mites habituals:

  • Els sistemes de fitxers de codi obert són menys propensos a la pèrdua de les dades que els sistemes propietaris: incorrecte, NTFS en realitat és una mica millor que ext4, ReiserFs, JFS, XFS, per a anomenar només alguns dels sistemes de fitxers més populars que sovint venen com a format predeterminat d'emmagatzematge de disc utilitzat per les distribucions.

  • Els sistemes de fitxers amb diaris (journaling) eviten la pèrdua de les dades i la corrupció: incorrecte, només acceleren el procés d'exploració en cas d'una interrupció sobtada durant una operació i eviten els estats ambigus. Però si un fitxer no s'ha escrit completament abans de la caiguda, es perdrà.

  • Els sistemes RAID eviten la corrupció/pèrdua de dades: força incorrecte, RAID 0 elimina les dades sense redundància, de manera que en realitat fa que sigui més propens a la pèrdua de dades. RAID 1 escriu dades emmirallades, de manera que evita la pèrdua de dades per una fallada individual de lectura de disc, però no altres fallades. RAID 5 també pot evitar la pèrdua de dades a causa de fallades de disc, però no per errors del sistema de fitxers o del controlador RAID. Molts controladors RAID de gamma baixa (com la majoria dels controladors de placa mare) no informen de problemes, pensant que mai no us adonareu. Si us hi trobeu, mesos després, quina és la possibilitat que sapigueu que va ser culpa del controlador? Un problema insidiós és la corrupció de les dades de paritat RAID 5. És bastant senzill verificar un fitxer llegint-lo i fent coincidir les metadades. Verificar les dades de paritat és molt més difícil, de manera que normalment no veureu errors de paritat fins a una reconstrucció. Llavors, per descomptat, serà massa tard.

  • Els virus són l'amenaça més gran per a les dades digitals: incorrecte. El robatori i l'error humà són la causa principal de la pèrdua de les dades.

Estimar el volum d'emmagatzematge

Els sensors de les càmeres digitals es troben a 1 o 2 passos de les limitacions físiques fonamentals de la percepció de la llum. El que volem dir és que, a mesura que evoluciona la tecnologia, hi ha un límit natural per al seu progrés. Les característiques de sensibilitat i soroll de qualsevol classe de sensor de llum no estan lluny d'aquest límit.

Les càmeres d'avui en dia tendeixen a utilitzar sensors de 50 megapíxels, encara que aquesta resolució no és necessàriament evident en el resultat final. Tenint en compte la mida del sensor i la qualitat de l'òptica, 12 megapíxels són òptims per a les càmeres compactes. Fins i tot les càmeres DSLR (rèflexs digitals) arriben als seus límits als 20 o 24 megapíxels. Per a resolucions més altes, caldrà optar per sensors de fotograma complet (24x36 mm) o fins i tot formats més grans.

Així, tenint en compte la propaganda del fabricant sobre els megapíxels, sembla segur dir que la major part de les futures càmeres funcionaran amb menys de 30 megapíxels. Això proporciona una base per a estimar l'espai d'emmagatzematge requerit per a cada fotografia futura: <40 MB per imatge. Fins i tot si s'introdueix el versionat de fitxers (agrupament de variacions d'una fotografia sota una referència de fitxer), la tendència és registrar només les instruccions utilitzades per a produir la versió nova, de manera que només cal enregistrar una quantitat petita de dades, en lloc d'una còpia completa de les dades, per a cada versió de la imatge.

Per a estimar la quantitat d'espai d'emmagatzematge que heu de planificar, només cal que determineu la quantitat de fotografies que preneu per any (és fàcil amb la pestanya «Línia de temps» en la barra lateral del digiKam) i multipliqueu-la per 40 MB. La majoria dels usuaris mantindran menys de 2.000 imatges per any, que requereix menys de 80 GB/any. Suposant que canviareu el disc dur (o el suport que utilitzeu en el futur) cada 4 o 5 anys, l'augment natural de la capacitat d'emmagatzematge serà suficient per a mantenir-vos per sobre de les vostres necessitats d'emmagatzematge.

Aquests fotògrafs ambiciosos que necessitaran més espai, potser molt més, haurien de considerar la compra d'un servidor de fitxers. Giga-Ethernet s'integra avui en les plaques mare i la transferència de fitxers a través d'una xarxa local pot ser molt ràpida. I si no necessiteu tantes dades, hauríeu de considerar les plaques base modernes amb suport per als SSD ràpids. Pocs terabytes de SSD ràpid connectats a través d'una connexió Thunderbolt 5 poden fer volar la biblioteca d'imatges.

Còpia de seguretat i recuperació

El 6% de tots els PC patiran un episodi de pèrdua de dades en un any determinat. Us hem avisat, de manera que no tindreu a ningú més a qui donar la culpa quan us passi un error d'emmagatzematge. Els HDD i els SSD multiterabyte no són molt cars. Compreu-ne un i utilitzeu-lo per a fer sovint còpies de seguretat de les vostres dades d'acord amb un pla. Encara millor, hauríeu de fer una còpia de seguretat de les vostres dades i provar la còpia de seguretat abans de fer res crític com tornar a instal·lar el SO, canviar de disc, canviar la mida de les particions i així successivament.

Prevenir els desastres

Imagineu-vos que feu les còpies de seguretat religiosament cada dia en una unitat SATA externa. Estareu content, a menys que per descomptat sigueu com la majoria de la gent i sempre tingueu les unitats externes connectades a l'ordinador.

Els desastres que colpegen localment poden destruir molt de cop. Oblideu-vos de l'avió que cau: el foc, l'aigua, l'electricitat, els infants i els robatoris són prou perillosos per a les nostres dades. Normalment, els desastres domèstics afecten tota una habitació o inclús la casa.

Per tant, el control de desastres significa un emmagatzematge deslocalitzat. De tant en tant, canvieu de còpies de seguretat, movent-ne una a dalt, a una altra casa, o fins i tot al vostre lloc de treball.

Hi ha una altra raó bona per a separar físicament les còpies de seguretat. Com s'ha esmentat anteriorment, el pànic sovint condueix a errors que destrueixen dades, fins i tot les dades de les còpies de seguretat. Mantenir una còpia de seguretat remota pot donar-vos temps suficient per a pensar i, per tant, evitar un error estúpid.

Tècniques de còpia de seguretat

  • Còpia de seguretat completa: una còpia de seguretat que conté tots els fitxers. És una instantània sense historial, representa una còpia completa de les dades en un moment determinat.

  • Còpia de seguretat diferencial: una còpia de seguretat amb només els fitxers que han canviat des de l'última còpia de seguretat completa. És una instantània completa de dos punts en el temps: la còpia de seguretat completa i l'última diferencial.

  • Còpia de seguretat incremental: una còpia de seguretat amb només els fitxers que han canviat des de l'últim conjunt de còpies de seguretat. Consta de diverses instantànies. Podeu tornar a crear l'estat original en qualsevol moment que s'hagi efectuat una còpia de seguretat. Això és molt semblant a un sistema de control de versions, amb la diferència que funciona per selecció i no és continu.

Còpia de seguretat de les dades

La millor pràctica per a fer una còpia de seguretat de les dades és:

  • Fer una còpia de seguretat completa a un dispositiu d'emmagatzematge extern.

  • Verificar la integritat de les dades i desfeu-vos dels dispositius defectuosos (control de desastres).

  • Tenir un altre dispositiu d'emmagatzematge per a còpies de seguretat freqüents.

  • Canviar els dispositius cada mes, després de comprovar la integritat de les dades.

Una eina útil per a les còpies de seguretat

El rsync del Linux és una petita utilitat estupenda molt senzilla de configurar a les vostres màquines. En lloc de tenir una sessió FTP programada amb un script, o qualsevol altre forma de programa de transferència de fitxers, el «rsync» només copia les diferències dels fitxers que realment s'han modificat, les comprimeix i les envia a través de SSH si esteu interessat en la seguretat. Això és una joia.

Una aproximació raonable a les còpies de seguretat de les imatges podria ser:

  • Fer immediatament una còpia de seguretat de les imatges importants (després de transferir-les a un ordinador) en un suport òptic.

  • Fer una còpia de seguretat incremental de l'espai de treball.

  • Fer una còpia de seguretat diferencial setmanal i suprimir les còpies de seguretat integrals cada dues setmanes.

  • Fer una còpia de seguretat diferencial mensual i suprimir la còpia de seguretat del segon mes.

  • Si els suports de còpia de seguretat encara no estan físicament separats, separeu-los ara (intercanviant una altra unitat de còpia de seguretat).

Aquest protocol intenta deixar prou temps per a detectar les pèrdues i recuperar-vos completament, mantenint el volum de la còpia de seguretat en <130% de l'espai de treball. Acabareu amb una versió diària dels últims 7 o 14 dies, una instantània setmanal durant almenys un mes i una instantània de cada mes. Qualsevol altra reducció s'haurà de fer a mà, després d'una verificació completa.

També hauríeu de considerar els passos per conservar les imatges a través de qualsevol canvi en la tecnologia i la propietat.

Per tal que les vostres valuoses imatges sobrevisquin una o dues generacions fins a la següent hi ha dues estratègies que cal seguir:

  • Estigueu al corrent de la tecnologia, no us quedeu enrere més d'un parell d'anys.

  • Deseu les fotografies en un estàndard obert, no propietari.

Mantenir-se al dia amb la tecnologia

Si bé el futur és imprevisible per naturalesa, el progrés tecnològic sembla continuar. Cada 5-8 anys hauríeu de considerar la qüestió de la compatibilitat cap enrere dels sistemes actuals. Quantes menys variants utilitzem en el passat, menys preguntes caldrà respondre en el futur.

Òbviament, cada vegada que canvieu l'ordinador (màquina, sistema operatiu, aplicacions, DRM), haureu de fer-vos les mateixes preguntes. Avui en dia, si voleu canviar al Windows, haureu de preguntar-vos tres vegades si encara podeu importar les vostres imatges i, sobretot, si podreu moure-les a un altre sistema o màquina. Si esteu lligat a un sistema propietari, hi ha possibilitats que no ho pugueu fer. Hem vist molta gent que lluita perquè el Windows aplica un règim estricte de DRM. Com podeu demostrar al Windows que sou el propietari dels drets d'autor de les vostres imatges?

La solució a aquest problema és utilitzar només estàndards oberts que estan suportats per diverses aplicacions.

La virtualització ja està disponible generalment per a tothom. Per tant, si teniu un sistema antic que és important per a llegir les vostres imatges, manteniu-lo, i més tard el podreu instal·lar com a màquina virtual.

En cas contrari, l'avís és molt senzill: sempre que canvieu l'arquitectura de l'ordinador, la tecnologia d'emmagatzematge i còpia de seguretat, el format de fitxer, aneu a la vostra biblioteca i convertiu-la a un estàndard més nou. I si cal, manteniu l'ús d'estàndards oberts.

Escalabilitat

L'escalabilitat és l'expressió dels experts en tecnologia de la capacitat de canviar la mida d'un sistema, el qual sempre es implica un augment de la mida.

Suposarem que heu planificat l'escalabilitat i que heu emmagatzemat la col·lecció d'imatges en un contenidor que voleu incrementar a un disc o una partició separada. En un sistema Linux podeu copiar i canviar la mida del contenidor al disc nou.

Emprar formats de fitxer oberts

La curta història de l'era digital en els últims 20 anys ha demostrat una vegada i una altra que els formats propietaris no són el camí a seguir quan es vol que les vostres dades siguin intel·ligibles dins de 10 anys. Microsoft és el proveïdor més conegut de formats propietaris a causa de la seva quota dominant de mercat. Però altres empreses poden ser pitjors ja que no poden romandre en el mercat prou temps o només tenen una base petita d'usuaris o col·laboradors. En el cas de Microsoft, almenys es té l'avantatge que moltes persones comparteixen els mateixos problemes. Això fa que sigui molt més probable que pugueu trobar una solució a un problema que implica els seus formats propietaris. No obstant això, continua sent habitual que qualsevol versió de la suite del MSoffice no pugui llegir correctament un document creat amb la mateixa aplicació dues versions principals anteriors.

Afortunadament, els formats d'imatge normalment tenen una vida útil més llarga que els documents d'oficina i estan menys subjectes a la discontinuació.

Els estàndards de codi obert tenen el gran avantatge de tenir una especificació oberta. Fins i tot si un dia en el futur ja no hi ha programari per a llegir un format de fitxer particular, algú pot tornar a crear aquest programari basant-se només en l'especificació.

Opcions de configuració predeterminades per als formats d'imatge habituals a l'editor d'imatges digiKam

El JPEG ha existit durant força temps. És un format amb pèrdua que perd una mica cada vegada que feu i deseu una versió modificada de l'original. En el costat positiu, el format JPEG és omnipresent, admet metadades JFIF, Exif, IPTC i XMP, té relacions bones de compressió i pot ser llegit per tot el programari d'imatge. A causa de les seves limitacions de metadades, és amb pèrdua, absència de transparència i profunditat de canal de color de 8 bits, no el recomanem. El JPEG2000 és millor, es pot emprar sense pèrdues, però pateix d'una base d'usuaris més petita.

El GIF és un format propietari i patentat que està desapareixent lentament del mercat. No l'utilitzeu.

El PNG es va inventar com un estàndard de codi obert per a substituir el GIF, però fa molt més. No té pèrdua, és compatible amb les metadades XMP, Exif ​​i IPTC, té codificació de color de 16 bits i transparència completa. El PNG pot emmagatzemar les dades de gamma i cromaticitat per a una correspondència millorada del colors a plataformes heterogènies. El seu desavantatge és una mida de fitxer relativament gran (però més petit que el TIFF) i una compressió lenta. El recomanem.

El TIFF es va utilitzar àmpliament com a format d'imatge. Pot existir en un format sense comprimir o en un contenidor que utilitza un algorisme de compressió sense pèrdua (deflació). Manté una alta qualitat d'imatge, però a costa de mides de fitxer molt més grans. Algunes càmeres permeten desar les imatges en aquest format. El problema és que el format ha estat alterat per tantes persones que ara hi ha 50 o més variants, i no totes són reconegudes per totes les aplicacions.

El PGF per al «Fitxer de gràfics progressius» (Progressive Graphics File) és un altre format de fitxer d'imatges, no tan ben conegut, però obert. Basat en la compressió per ondetes, el qual permet la compressió de les dades amb pèrdua i sense. El PGF es compara bé amb el JPEG 2000, però va ser desenvolupat per a la velocitat (compressió/descompressió) en lloc de la relació de compressió. Un fitxer PGF es veu molt millor que un fitxer JPEG de la mateixa mida de fitxer, mentre que també és molt bo en la visualització progressiva. El format PGF s'utilitza internament en el digiKam per a emmagatzemar miniatures comprimides en la base de dades. Per a obtenir més informació sobre el format PGF, vegeu la pàgina web de la libPGF.

Eina d'importació RAW a l'editor d'imatges digiKam

El format RAW. Algunes de les càmeres més costoses permeten disparar en el format RAW. El format RAW no és en absolut un estàndard d'imatge. Es tracta d'un format de contenidor diferent per a cada marca i model de càmera. Les imatges en format RAW contenen les dades pràcticament sense processar pels sensors d'imatge de la càmera digital o l'escàner de la imatge. Els fitxers d'imatge RAW normalment s'anomenen negatius digitals, ja que tenen el mateix paper que els negatius rodet en la fotografia química tradicional. Concretament, el negatiu no es pot utilitzar directament com a imatge, però té tota la informació necessària per a crear una imatge. Emmagatzemar fotografies en format RAW en una càmera, permet un marge dinàmic més elevat i permet alterar la configuració, com ara el balanç de blancs, després de prendre la fotografia. La majoria dels fotògrafs professionals utilitzen el format RAW, ja que els ofereix la màxima flexibilitat. L'inconvenient és que els fitxers RAW poden ser molt grans.

Recomanem que us abstingueu d'arxivar en format RAW (en lloc de disparar en format RAW, que recomanem). No hi ha res de bo en emmagatzemar imatges en un format RAW natiu. Té moltes varietats i totes són propietàries. També és molt probable que d'aquí a uns anys ja no pugueu utilitzar els fitxers RAW antics. Ja hem vist persones canviant de càmeres, perdent els seus perfils de color i tenint grans dificultats per a treballar correctament amb els seus fitxers RAW antics. Suggerim que canvieu al format DNG.

El format DNG o «negatiu digital» (Digital Negative) és un format d'imatge RAW obert i sense cànons, dissenyat originalment per Adobe Systems. El DNG va ser la resposta a la demanda d'unificar un format de fitxer RAW de les càmeres. Està basat en el format TIFF/EP i requereix l'ús de metadades. Ja hi ha alguns fabricants de càmeres que han adoptat el DNG. Esperem que els grans competidors (Canon i Nikon) l'utilitzin algun dia. El format ProRAW d'Apple disponible des de l'iPhone 12 Pro Max està basat en DNG.

El digiKam proporciona una eina per lots per a convertir des de RAW a DNG en el Gestor de la cua per lots

Es recomana que convertiu els fitxers RAW a DNG per a arxivar. Malgrat que el DNG va ser creat per Adobe, és un estàndard obert i àmpliament acceptat per la comunitat de codi obert (el qual sol ser un bon indicador de la longevitat d'un format). Alguns fabricants ja han adoptat el DNG com a format RAW. I finalment però no menys important, Adobe és la font més important de programari gràfic actual i, per descomptat, donen suport al seu invent propi. Es tracta d'un format d'arxiu ideal, amb les dades en brut dels sensors conservades com a tals en format TIFF dins del DNG, de manera que s'alleuja el risc associat als formats RAW propietaris. Tot això fa que la migració a un altre sistema operatiu sigui més senzilla.

El digiKam proporciona una eina per a convertir des de RAW a DNG durant la baixada des de la càmera

L'XML per al «llenguatge de marcatge extensible» o RDF per al «marc de treball de descripció del recurs». L'XML és com l'HTML, però on l'HTML es preocupa més per presentar les dades, l'XML s'ocupa de la representació de les dades. A més, l'XML no és propietari, independent del sistema operatiu, és senzill d'interpretar, es basa en text i és de baix cost. El RDF és la solució del WC3 per a integrar una varietat d'aplicacions diferents, com ara catàlegs bibliogràfics, directoris mundials, fonts de notícies, programari, així com col·leccions de música, imatges i esdeveniments utilitzant l'XML com a sintaxi per a l'intercanvi. En conjunt, les especificacions proporcionen un mètode que utilitza una ontologia lleugera, basada en el Dublin Core, el qual també admet la «web semàntica» (intercanvi fàcil de coneixements sobre el web).

IPTC va XMP

Probablement, aquest és un dels motius pels quals, al voltant de 2001, Adobe va introduir la seva tecnologia XMP basada en XML per a substituir la tecnologia bloc de recursos d'imatge dels anys noranta. XMP significa plataforma extensible de metadades, és a dir, una mescla d'XML i RDF. Es tracta d'una tecnologia d'etiquetatge que permet als usuaris incrustar dades sobre un fitxer en el mateix fitxer. La informació del fitxer es desa amb l'extensió *.xmp* (significa l'ús d'XML/RDF).

El XMP: per molt que ODF sigui llegible per sempre (ja que el text que conté està escrit en text pla), el XMP conservarà les vostres metadades en un format XML fàcil d'entendre. No hi ha perill de no poder llegir-lo més tard. Es pot incrustar dins dels fitxers d'imatge o com a fitxer acompanyant independent (concepte de lateral). El XMP es pot utilitzar en els fitxers PDF, JPEG, JPEG2000, GIF, PNG, HTML, TIFF, Adobe Illustrator, PSD, Postscript, Postscript encapsulat i de vídeo. En els fitxers JPEG, la informació XMP s'inclou juntament amb les dades Exif ​​i IPTC.

El digiKam pot mostrar contingut XMP des d'imatge i vídeo

La incrustació de les metadades directament en els fitxers d'imatge, permet compartir i transferir fitxers entre productes, fabricants i clients sense perdre les metadades. Les etiquetes de metadades més habituals que s'emmagatzemen a les dades XMP són les que provenen de la Dublin Core Metadata Initiative, inclouen aspectes com el títol, la descripció, el creador, etc. L'estàndard està dissenyat per a ser extensible, que permet als usuaris afegir els seus propis tipus de metadades personalitzats a les dades XMP. XMP generalment no permet la incrustació de dades binàries. Això vol dir que totes les dades que vulgueu incloure al XMP, com ara imatges en miniatura, s'hauran de codificar en un format compatible amb XML com Base-64.

Molts fotògrafs prefereixen conservar un original de les seves fotografies (principalment RAW) per a l'arxiu. El XMP és adequat per a aquest enfocament, ja que manté les metadades separades del fitxer d'imatge. L'autor no comparteix aquest punt de vista. Pot haver-hi problemes associant el fitxer de metadades amb la imatge i, com s'ha dit anteriorment, els formats RAW es tornaran obsolets. Es recomana utilitzar el DNG com a contenidor i posar-ho tot dins del fitxer individual.

La Dublin Core Metadata Initiative és una organització oberta dedicada a desenvolupar estàndards per a la interoperabilitat de les metadades en línia que implementin una gran varietat de finalitats i models comercials. Les iniciatives de la DCMI inclouen treballar en arquitectura i modelització, debats i treball col·laboratiu a les comunitats i grups de treball de la DCMI, conferències i tallers anuals, alineació dels estàndards i esforços educatius per a promoure una àmplia acceptació i pràctica dels estàndards en les metadades.

El digiKam admet els fitxers laterals amb moltes opcions des del plafó de configuració

Protegir les vostres dades

  • Utilitzeu protectors de sobretensions (estàndard UL 1449), possiblement combinats amb un SAI.

  • Utilitzeu memòries ECC per a la correcció dels errors de memòria (fins i tot en desar fitxers).

  • Vigileu els discs durs (temperatura, soroll...) i crear còpies de seguretat.

  • Manteniu les còpies de seguretat en una altra ubicació, blocades, utilitzar magatzems de dades al web.

  • Utilitzeu suports d'arxiu i gravadores.

  • No desespereu en el cas d'una pèrdua de les dades, expliqueu el vostre pla de recuperació a una persona inexperta.

  • Trieu el sistema de fitxers, particions, carpetes perquè siguin fàcilment escalables.

  • Utilitzeu estàndards oberts i no privatius per a gestionar i desar les fotografies.

  • Reviseu la tecnologia/migració almenys cada 5 anys.