Datadeduplisering er en populær og populær lagringsteknologi som optimaliserer lagringskapasiteten. Den eliminerer overflødige data ved å fjerne dupliserte data fra datasettet, slik at bare én kopi blir igjen. Som vist i figuren nedenfor, kan denne teknologien redusere behovet for fysisk lagringsplass betraktelig for å møte den økende etterspørselen etter datalagring. Dedupliseringsteknologi kan gi mange praktiske fordeler, hovedsakelig inkludert følgende aspekter:
(1) | Møt kravene til ROI (Return On Investment)/TCO (Total Cost of Ownership); |
(2) | Den raske dataveksten kan kontrolleres effektivt; |
(3) | Øk effektiv lagringsplass og forbedre lagringseffektiviteten; |
(4) | Spar de totale lagringskostnadene og administrasjonskostnadene; |
(5) | Spar nettverksbåndbredden for dataoverføring; |
(6) | Spar drifts- og vedlikeholdskostnader som plass, strømforsyning og kjøling. |
Dedupe-teknologi er mye brukt i systemer for sikkerhetskopiering og arkivering av data, fordi det er mye duplikatdata etter flere sikkerhetskopier av data, noe som er veldig godt egnet for denne teknologien. Faktisk kan dedupe-teknologi brukes i mange situasjoner, inkludert online data, nærlinjedata og offline datalagringssystemer. Den kan implementeres i filsystemer, volumbehandlere, NAS og sans. Dedupe kan også brukes til datagjenoppretting etter katastrofer, dataoverføring og synkronisering, ettersom datakomprimeringsteknologi kan brukes til datapakking. Dedupe-teknologi kan hjelpe mange applikasjoner med å redusere datalagring, spare nettverksbåndbredde, forbedre lagringseffektiviteten, redusere sikkerhetskopieringsvinduet og spare kostnader.
Deduplisering har to hoveddimensjoner: dedupliseringsforhold og ytelse. Dedupliseringsytelsen avhenger av den spesifikke implementeringsteknologien, mens dedupliseringsraten bestemmes av egenskapene til selve dataene og applikasjonsmønstre, som vist i tabellen nedenfor. Lagringsleverandører rapporterer for tiden dedupliseringsrater fra 20:1 til 500:1.
Høy dedupliseringsrate | Lav dedupliseringsrate |
Data opprettet av brukeren | Data fra den naturlige verden |
Lav endringsrate i data | Data med høy endringsrate |
Referansedata, inaktive data | Aktive data |
Søknad med lav dataendringsrate | Høy dataendringsrateapplikasjon |
Full sikkerhetskopiering av data | Trinnvis sikkerhetskopiering av data |
Langtidslagring av data | Korttidslagring av data |
Bredt utvalg av dataapplikasjoner | Lite utvalg av dataapplikasjoner |
Kontinuerlig forretningsdatabehandling | Generell forretningsdatabehandling |
Liten datasegmentering | Stordatasegmentering |
Langvarig datasegmentering | Datasegmentering med fast lengde |
Oppfattet datainnhold | Datainnhold ukjent |
Deduplisering av tidsdata | Deduplisering av romlige data |
Dedupliseringsimplementeringspunkter
Ulike faktorer bør vurderes når man utvikler eller bruker Dedupe-teknologi, ettersom disse faktorene direkte påvirker ytelsen og effektiviteten.
(1) | Hva | Hvilke data er devektet? |
(2) | Når | Når vil vekten bli kvitt? |
(3) | Hvor | Hvor er vektreduksjonen? |
(4) | Hvordan | Hvordan redusere vekten? |
Dedupliseringsnøkkelteknologi
Dedupliseringsprosessen i et lagringssystem er generelt sett denne: først deles datafilen inn i et datasett, for hver datablokk beregnes fingeravtrykket, og deretter, basert på fingeravtrykk-hash-søkeord, indikerer matching dataene for de dupliserte datablokkene, lagrer kun datablokkindeksnummeret, ellers betyr det at datablokken er den eneste delen av en ny, lagring av datablokk og oppretter relevant metainformasjon. Dermed tilsvarer en fysisk fil i lagringssystemet en logisk representasjon av et sett med FP-metadata. Når du leser filen, les først den logiske filen, og ta deretter ut den tilsvarende datablokken fra lagringssystemet i henhold til FP-sekvensen, og gjenoppretter kopien av den fysiske filen. Det kan sees fra prosessen ovenfor at nøkkelteknologiene for Deduplisering hovedsakelig inkluderer fildatablokksegmentering, beregning av datablokkfingeravtrykk og henting av datablokker.
(1) Segmentering av fildatablokker
(2) Beregning av fingeravtrykk i datablokker
(3) Henting av datablokker
Slik finner du disse anbefalte modellene for å starte nettverkspakkededupliseringen:
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-640048*10GE SFP+ pluss 4*40GE/100GE QSFP28, maks. 880 Gbps
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-56606*40GE/100GE QSFP28 pluss 48*10GE/25GE SFP28, maks. 1,8 Tbps
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-506048*10GE SFP+ pluss 2*40GE QSFP, maks. 560 Gbps
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-486048*10GE SFP+, maks. 480 Gbps, Function Plus
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-481048*10GE SFP+, maks. 480 Gbps
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-2410P24*10GE SFP+, maks. 240 Gbps, DPI-funksjon
Mylinking™ Nettverkspakkemegler (NPB) ML-NPB-6400
48*10GE SFP+ pluss 4*40GE/100GE QSFP28, maks. 880 Gbps
Publisert: 18. oktober 2022