Tipos de storage: entenda as diferenças entre eles!

em Soluções.

Uma das características principais das evoluções que a tecnologia passou nos últimos anos é o crescimento da quantidade de informações armazenadas em meios digitais. Tendências como a computação em nuvem, a Internet das Coisas (IoT) e o Big Data causaram um boom no número de registros salvos por bancos de dados e infraestruturas de TI. É aí que surgiu a necessidade do storage.

Afinal, esse contexto criou desafios para as empresas, que agora precisam operar sistemas que lidam com os seus registros de múltiplas formas. Para cada obstáculo, existe um tipo de armazenamento.

Ele deve se adaptar às necessidades do usuário para proporcionar um acesso rápido, seguro e confiável aos dados importantes, seja um arquivo de música, seja o registro de uma transação financeira.

Se você quer conhecer mais sobre o tema e como os principais tipos de armazenamento são definidos, continue a leitura deste post. Nele, apresentamos os conceitos de Object e Block Storage, os formatos NAS e SAN, as diferenças existentes e como escolher o modelo ideal para o seu negócio.

Acompanhe!

O que é Object Storage?

Esse termo — também conhecido como Object-based Storage, ou índice de armazenamento listado por objetos, em uma tradução livre — é utilizado para descrever um conjunto de informações que inclui a própria informação digital, os seus metadados e um identificador único.

Em outras palavras, essa expressão define uma forma de armazenar e trabalhar com dados. Todas as características do sistema de arquivos permitirão que um documento seja acessado com agilidade, mesmo em uma solução distribuída por vários locais.

A própria informação

Um dado pode ser qualquer coisa armazenada em um meio digital. Isso inclui músicas em diferentes formatos, como o .mp3, um manual de 400 mil páginas para a construção de um avião comercial ou mesmo os arquivos de configuração de um sistema. Em geral, essa é a principal parte que o usuário modifica ou visualiza.

Esses dados podem ser acessados e analisados quando se transformam em interpretações. Assim, podem ser usados estrategicamente, especialmente no ambiente corporativo. O resultado é a obtenção de vantagem competitiva.

Atualmente, estamos na chamada Era da Informação, na qual os dados são fundamentais para a administração corporativa. É o conceito data driven, que aprimora o processo decisório — mais um motivo para investir em um armazenamento eficiente.

Um conjunto de metadados expansíveis

O metadado é um termo utilizado para se referir a informações contextuais sobre um arquivo. São registros que incluem o criador da informação, seus usos, o nível de confidencialidade e demais fatores relevantes.

Em outras palavras, são todos os dados que auxiliam o sistema ou o usuário a identificar como o arquivo está estruturado e quais utilizações são destinadas. Em um arquivo de música, por exemplo, são inseridos metadados com o nome do artista, álbum, ano de lançamento e estilo da canção.

Já em um documento de texto, é possível incluir dados sobre a organização que o criou e seus direitos de uso. Como são customizáveis, os metadados podem ser ampliados ou reduzidos livremente, conforme o usuário julgar necessário. Por isso, são conhecidos como expansíveis.

Um identificador global único

O identificador é um endereço conferido ao objeto que facilita seu acesso em qualquer sistema distribuído. Dessa forma, é possível encontrar um arquivo mesmo sem conhecer sua localização física. Funciona, portanto, como um CEP.

Em um banco de dados espalhado por diferentes data centers, por exemplo, essa propriedade é crucial para que o tempo de acesso a cada dado seja reduzido ao máximo. Além disso, a forma como os identificadores são criados facilita a expansão rápida de sistemas de armazenamento: basta adicionar novos nós para escalar a infraestrutura.

O que é Block Storage?

O chamado bloco de armazenamento é outra forma de guardar conjuntos de arquivos. Nesse caso, os dados são divididos em grupos de tamanho fixo, cada um deles com endereço próprio, mas sem metadados para fornecer ao usuário uma visão mais ampla sobre o que aquele registro representa.

Essa é uma forma popular de salvar documentos, e pode ser encontrada em diferentes sistemas no ambiente corporativo.

O que é NAS?

Esse terceiro tipo se refere ao Network Attached Storage, ou armazenamento conectado à rede, em tradução literal. Esse equipamento é utilizado para salvar e compartilhar dados por meio de conexão local. Há um ou mais processadores, além de fonte de alimentação, memória e outros componentes utilizados no computador.

A diferença é a confiabilidade e solidez do sistema de armazenamento, que geralmente é composto por dois ou mais módulos de memória ou discos rígidos. Além disso, o acesso aos arquivos é executado por meio de uma infraestrutura de rede que interliga os dispositivos aos servidores.

A conexão às portas de rede LAN é uma das principais características do NAS. Ele também é um repositório de informações. Há alguns anos, esse armazenamento era utilizado somente para salvar e compartilhar pastas. Com a chegada de discos rígidos rápidos e processadores de alto desempenho, diferentes recursos foram incorporados, como o protocolo iSCSI.

A partir disso, ficou mais fácil executar tarefas que antes eram impossíveis, como a capacidade de ser um servidor multimídia que suporta padrões como DLNA e UPnP. Eles contribuem para uma conexão fácil a tablets, console de games e smartphones. Outro benefício é a possibilidade de configuração do NAS como servidor web, de e-mail, FTP ou de impressão.

O que é SAN?

O Storage Area Network, ou rede de área de armazenamento, é dedicado e formado por  diferentes servidores e storages, que estão interligados por Fibre Channel (FC) ou conexões IP (iSCSI). O benefício é a consolidação e simplificação da produção de dados, que centraliza e aprimora a gestão das informações.

A consequência é o aumento da segurança e da velocidade no acesso aos arquivos. Isso ocorre porque essa rede é exclusiva para o armazenamento de informações. Uma de suas principais características é o tráfego de dados, que é semelhante aos usados internamente nos discos, como SCSI e ATA.

Vale a pena destacar que a infraestrutura é projetada para suportar um grande volume de dados. Por isso, há os formatos centralizado e distribuído. Ainda existem 2 variações:

  • uma rede para transferência de dados entre dispositivos de armazenamento e computadores, na qual o SAN fornece conexões físicas com camada de gerenciamento. Esta, por sua vez, organiza os elementos e as conexões para transferir arquivos de forma segura e robusta;
  • um sistema de armazenamento constituído por computadores e aplicações que é controlado por software e com comunicação por rede de equipamentos.

Quais as diferenças entre os 4 tipos de storage?

Os modelos são bastante diferentes, e cada um deles apresenta suas próprias características.

Object e Block Storage

Os sistemas de arquivos baseados nos índices de armazenamento listados por objetos ignoram a divisão dos arquivos em blocos de tamanho fixo. Em vez disso, grandes quantidades de registros são salvas em um único objeto, que contém o arquivo, seus metadados e seu identificador. Nesse caso, inexistem limites para o número ou o tipo de metadado que será salvo. Como consequência, esse modelo de arquitetura de armazenamento é altamente customizável.

Os metadados poderão incluir qualquer informação relevante, do nível de classificação de privacidade do arquivo vinculado ao objeto até o tipo de aplicação que é utilizado para sua visualização.

Hoje, o Object Storage é uma tecnologia que está presente em diferentes serviços que lidam com uma grande quantidade de dados simultaneamente. Esse é o caso, por exemplo, do Facebook e do Spotify. Tanto a rede social quanto o serviço de streaming de músicas utilizam esse recurso para tornar o acesso a arquivos mais simples, ágil e confiável.

Em outras palavras, o índice de armazenamento listado por objetos é utilizado principalmente em ambientes que necessitam de uma forma de guardar arquivos com alta disponibilidade e integrabilidade. Ele tem os mecanismos necessários para que uma informação seja salva em diferentes locais e encontrada em poucos instantes, por meio de um processo simples e direto.

Apesar dos benefícios que o Object Storage traz para empresas, ele apresenta algumas características que podem limitar seu uso em determinadas operações. Por exemplo: ele não tem os recursos para que o usuário ou o sistema consiga editar uma parte do arquivo de forma incremental, como o Block Storage permite.

Isso significa que os objetos devem ser trabalhados como uma única unidade. Essa peculiaridade exige que todo o dado seja acessado, atualizado e reescrito no sistema por completo sempre que um arquivo a ele vinculado for modificado. Como consequência, algumas rotinas computacionais podem ter uma performance reduzida quando comparadas com outras opções de armazenamento de arquivos.

Outra grande diferença está na forma como cada bloco de armazenamento pode ser acessado. Nesse contexto, o sistema operacional consegue visualizar os blocos como uma única unidade lógica, sem que ocorram perdas na performance geral. Isso não ocorre no caso dos sistemas de armazenamento de arquivos baseados no Object Storage, em que esse tipo de operação causa um grande prejuízo nas velocidades de leitura e escrita.

Por outro lado, existe um tradeoff para essa característica: com o Object Storage, as operações de gerenciamento de sobrecarga dos dispositivos de armazenamento (que são comuns nos blocos de dados) são desnecessárias.

NAS e SAN

O primeiro consegue elevar significativamente a disponibilidade dos dados se o dispositivo utilizar clustering ou RAID (Redundant Array of Inexpensive Disks, ou conjunto redundante de discos independentes). Além disso, a performance dos outros servidores pode ser aprimorada, porque o compartilhamento de arquivos é feito pelo próprio armazenamento, não por um servidor que tem outras responsabilidades.

Assim, fica evidente que o NAS é um servidor em si mesmo e, por isso, exige a maior parte dos componentes requeridos por um computador comum. Na prática, isso significa que sua confiabilidade depende da forma como foi projetado internamente.

O NAS também utiliza procolos presentes em diferentes sistemas operacionais, inclusive os 3 principais, Linux, Mac e Windows. Por isso, é rapidamente implementado em qualquer infraestrutura de TI. Outro benefício é a segurança, já que vários recursos de proteção de dados foram inseridos recentemente, como os discos reservas, também chamados de hot spare.

No mundo digital, o NAS se tornou uma ferramenta ideal para administrar os dados. Ele pode ter desde funções básicas até funcionalidades variadas, que permitem até 8 ou mais discos. Em qualquer caso, é uma solução pronta que atende à maior parte das redes de pequeno e médio portes. Porém, nem sempre é suficiente, situação que acontece quando é necessário amplo espaço, backup, boa performance e redundância.

Por sua vez, o SAN atua como unidade única de armazenamento, que é acessada de forma direta pelo servidor. Para exemplificar, é como um HD de 100 TB, em vez de 10 discos de 10 TB.

Perceba que, de maneira diversa, o NAS funciona como um servidor que permite acesso simultâneo por parte de vários clientes. Por outro lado, o SAN apresenta como benefício a capacidade de expansão do sistema pelo acréscimo de switches e racks. Por isso, é uma opção viável para o ganho de desempenho e segurança em aplicações críticas.

Para quem o Object Storage e o Block Storage são direcionados?

Com o crescimento da quantidade de dados armazenados em meios digitais, os sistemas de arquivos baseados em objetos passaram a ser cada vez mais utilizados. As soluções de armazenamento de dados evoluíram junto com a ampliação dos números de registros que ficam salvos localmente.

Nesse cenário, o índice de armazenamento listado por objetos soluciona problemas de durabilidade, integridade e demais limitações do bloco de dados. Rotinas como as de backup de arquivos e a hospedagem de páginas web estáticas são alguns dos exemplos em que o Object Storage se destaca.

Essa arquitetura é fácil de ser escalada a qualquer momento e gerenciada por um conjunto de nós digitais que são adicionados ou removidos pelo usuário sempre que for necessário. E graças ao sistema de índices, encontrar registros se torna uma operação simples e que não implica em perdas de performance, mesmo em grandes redes.

As infraestruturas baseadas em índices de armazenamento listados por objetos também são implementadas em locais com alta necessidade de disponibilidade. Como cada objeto é protegido por múltiplas cópias de dados espalhadas em sistemas distribuídos, caso algum nó apresente problemas, a informação poderá ser disponibilizada em outras pontas automaticamente. Tudo isso sem que ocorram falhas visíveis ao usuário.

Na maioria dos cenários, são criadas ao menos 3 cópias de cada registro salvo pelo usuário. Isso protege o sistema de contratempos comuns, como falhas de hardware, quedas de energia, problemas em servidores ou corrompimento de uma unidade de armazenamento.

Além disso, essa forma de gerenciar informações apresenta um custo muito menor em médio e longo prazos, quando comparada a outras formas de gerir dados. Em geral, os sistemas baseados em índices de armazenamento listados por objetos são utilizados nos seguintes ambientes:

  • serviços que armazenam grandes quantidades de dados, como músicas, vídeos e imagens;
  • armazenamento de grandes backups ou arquivos de logs de usuários e sistemas;
  • meios em que diferentes usuários fazem a leitura de uma única informação simultaneamente;
  • demais situações que envolvem grandes conjuntos de informações.

Já os blocos de armazenamento são utilizados em sistemas que necessitam de baixa latência e uma performance de acesso e leitura consistente. Esse é o caso das seguintes soluções:

  • aplicações que exigem funções de server side processing, como desenvolvimento nas linguagens PHP, .Net e Java;
  • utilização de aplicações corporativas de grande porte, como os sistemas da Oracle, SAP, Microsoft Exchange e Microsoft Office SharePoint.

Por outro lado, o NAS se configura hoje como a melhor forma de gerenciamento de dados, porque é mais que um centro de armazenamento. Ele foi possibilitado principalmente pelo cloud computing, já que passou a ser comum o desejo de criar e compartilhar informações em ambientes colaborativos.

As aplicações fundamentais para as empresas também são aprimoradas com o NAS. Enquadram-se nesse quesito o backup de dados centralizado, assim como a publicação de conteúdo em blogs e redes sociais. Nesse contexto, as aplicações mais comuns desse tipo de armazenamento são:

  • backup;
  • servidor DLNA;
  • nuvem privada;
  • replicação remota;
  • gravação de circuito fechado de TV (CFTV);
  • virtualização de servidores;
  • central de downloads;
  • servidor de arquivos.

Dessa forma, o NAS é um formato essencial se você busca replicação, backup e sincronização de conteúdo em diferentes locais. A consequência é segurança, capacidade e desempenho condizentes com o tamanho do orçamento para investimento e exigência da aplicação.

Por fim, o SAN é altamente direcionado para comportar um volume enorme de tráfego de dados. Devido a essa peculiaridade, oferece um acesso mais estável e rápido. É uma escolha comum para grandes corporações, já que diferentes HDs são ligados a uma unidade controladora, que por sua vez é conectada ao servidor por meio de uma interface dedicada.

Por isso, essa alternativa é ideal para um grande e-commerce, por exemplo. Nesse caso, o banco de dadospode ser acessado conjuntamente por todos os servidores do cluster, o que possibilita atender a um grande volume de solicitações por segundo. A agilidade, portanto, é a palavra-chave nesse formato de armazenamento.

Como fazer a escolha do tipo de storage certo para o seu negócio?

Os sistemas de armazenamento baseados no Object Storage têm o potencial de auxiliar empresas a conquistar uma infraestrutura de TI escalável e de alta performance. Essa arquitetura reduz custos com gestão de dados, permitindo o uso de hardwares mais econômicos sem comprometer os gastos do negócio.

Além disso, ela é flexível, o que permite que os usuários sempre tenham acesso aos seus registros. Isso ocorrerá independentemente dos eventuais problemas que podem ocorrer no ambiente de armazenamento, como falhas de hardware ou software.

Mas o índice de armazenamento listado por objetos pode ser uma escolha errada. Em alguns casos, uma opção mais tradicional, como o uso de blocos de dados, é capaz de fornecer ao usuário uma boa performance, disponibilidade e escalabilidade sem comprometer o desempenho dos aplicativos ou os custos operacionais.

Por outro lado, se a ideia é implementar o armazenamento em grandes corporações, o ideal é optar pelo SAN, que oferece agilidade com a permissão de tráfego em larga escala. O problema são os custos elevados, inviáveis para uma empresa de menor porte. Já o NAS é uma opção interessante para o compartilhamento fácil de dados a partir de uma infraestrutura dedicada.

Nessa circunstância, o gestor de TI deve identificar o perfil das aplicações do negócio, seus objetivos e as necessidades dos usuários para definir a melhor forma de gerenciar os dados. Isso permite a escolha de uma arquitetura que se adapta integralmente ao ambiente de trabalho de cada pessoa e que esteja sempre disponível e com baixa latência, sem causar um grande impacto no orçamento da empresa no final do mês.

Nesse contexto, o índice de armazenamento listado por objetos e o SAN se caracterizam, principalmente, pela grande escalabilidade. Isso garante que o usuário terá alta disponibilidade para arquivos que não são alterados regularmente e que precisam ser armazenados de forma estática.

Esse é o caso de músicas, vídeos e imagens, arquivos que, uma vez criados, passam por poucas modificações (ou mesmo nenhuma). Por outro lado, nem sempre um pedido de leitura pode retornar a versão mais recente de um dado.

Já os sistemas de blocos de dados são populares quando uma empresa precisa de grande consistência. Esse é o caso daquelas que modificam informações constantemente, mas que apresentam escalabilidade limitada e são tolerantes com problemas de disponibilidade que possam ser causados por falhas de hardware. Nesses cenários, a maior preocupação do usuário é sempre obter a versão mais recente de um registro.

Como criar uma nova forma de armazenar registros?

O Object Storage não é uma tecnologia nova, mas tem ganhado força nos últimos anos. O número de arquivos armazenados em todo o planeta já ultrapassou a marca de 1000 petabytes, chegando à escala dos exabytes, graças a serviços de Big Datacomputação em nuvem em ambientes públicos e às redes sociais.

Nesse cenário, é crucial contar com uma arquitetura de arquivos escalável, com alta disponibilidade e performance. Com o Object Storage, a empresa não fica limitada ao tamanho dos seus dados, podendo adicionar novos nós (e, consequentemente, expandir o seu ambiente) em poucos cliques.

O SAN também garante o alto volume de informações, principalmente para grandes ambientes corporativos. Dessa forma, a empresa garante que todos os seus usuários poderão trabalhar com serviços de alta performance, mesmo em momentos de muita demanda.

Ainda assim, o sistema de armazenamento em blocos continua a ser utilizado. A razão é simples: muitas aplicações deixam de demandar as características em que o Object Storage se destaca, exigindo um tipo de storage mais dinâmico e prático, como é o caso do bloco de dados.

Quer saber mais sobre as soluções da Locaweb Corp? Acesse nosso site!.