Geral 3min de Leitura - 26 de dezembro de 2019

Metadados: as informações ocultas sobre cada arquivo que você tem

Código binário, representando metadados.

This post is also available in: Português English Español

Cada foto feita por celular se torna um arquivo salvo no dispositivo ou em um sistema de cloud computing. Estes arquivos possuem uma parte dedicada ao registro de diversas informações, como a data em que a foto foi tirada, horário, local, nome do dispositivo, número de série e, muitas vezes, o nome do proprietário. Esses registros adicionais são chamados de metadados, e não estão presentes apenas em fotos.

Praticamente todo tipo de arquivo possui metadados associados, como documentos de Word, Excel e arquivos com extensões em PDF. Cada um deles tem seus próprios metadados, constando informações como nome do computador ou dispositivo, horários em que o arquivo foi acessado e alterações realizadas.

Por mais que sejam úteis para inúmeras atividades profissionais, e até para quem gosta de manter pastas organizadas, esses dados podem ser usados para expor a privacidade do usuário, dando a possíveis invasores informações fundamentais ao mapeamento de seus hábitos.

Exagero? Nem tanto. Já houve casos de empresas processadas por plágio alegando que, na realidade, possuíam arquivos novos, autênticos, criados por elas.

Os metadados, porém, provaram que se tratava de um arquivo de outra companhia, que foi modificado para parecer um documento original, pois os registros de tudo o que foi alterado nele estavam salvos nos metadados – como um histórico que registra toda a sua trajetória.

Dessa maneira, até mesmo um documento de Word enviado por um funcionário para um cliente, em um anexo de e-mail, pode carregar consigo informações essenciais sobre o negócio.

Por que então os metadados foram criados, se podem representar um eventual problema de segurança digital? Na realidade, seu conceito foi concebido há séculos. Ou seja, é desde os tempos antigos que esse tipo de informação é usada para classificar, organizar e pesquisar.

Nesse contexto, definições e regras de negócios, informação de domínios, detalhes de segurança e, entre outros, tags XML são metadados, e todos possuem mil possibilidades de uso.

Utilizações variadas

Imagine a utilidade dos metadados na gestão de arquivos e informações. No estoque físico de uma loja virtual, por exemplo, fornecem a localização, o número de caixa, etiqueta e todo o sistema de classificação, bem como os registros do remetente e quais dados devem acompanhar o pedido, como um número de telefone para contato na hora da entrega.

Indo além da gestão documental, tornam-se uma ferramenta estratégica. É o caso da tecnologia Data Warehouse, que trata da extração e consolidação de informações de múltiplas fontes, reunidas em uma base que permite ser consultada de várias maneiras pelos gestores.

Quando aplicados de uma maneira mais ampla, os metadados representam uma verdadeira revolução na internet. É o conceito de Web Semântica, que é uma interligação que proporcionará a chance de computadores e humanos atuarem em um nível diferenciado de cooperação.

Na Web Semântica, todas as informações virão com um significado bem definido, facilmente identificável e classificável pelos sistemas de busca. Ou seja, resultados genéricos ou pouco conectados aos propósitos da pesquisa ficarão cada vez mais raros.

Assim, a Web Semântica deve ser encarada como algo abrangente, com o objetivo de fazer da internet uma base de dados global refinada. Será possível então obter dados semanticamente inter-relacionados, e não apenas uma listagem de documentos nas buscas que fizermos na internet – muitas vezes sem ligação semântica entre si.

Cautela em cada arquivo

Os softwares possuem inúmeras maneiras de coletar dados dos usuários. No Word, por exemplo, notas de rodapé podem incluir informações de autores, que então são registradas nos metadados.

Além disso, existem funções que permitem fazer com que diversas mudanças desapareçam da tela, mas permanecerão nos metadados do arquivo – a exemplo da troca de nomes de proprietários ou de arquivos de imagem anexados que foram substituídos.

Em ambos os casos, os metadados registrarão que houve a troca de um por outro, apesar de apenas os mais recentes ficarem visíveis, já que os anteriores foram trocados.

Entretanto, metadados podem ser alterados pelos próprios usuários. Existem meios para isso, através do sistema operacional ou de softwares especiais.

Dependendo do caso, os metadados podem não ser confiáveis isoladamente, demandando a presença de outros registros para que se verifique sua veracidade. Nesse contexto, um funcionário mal-intencionado poderia deletar rastros de problemas causados por ele.

Assim, se os metadados podem reduzir a privacidade dos usuários, com possíveis exposições de informações, representam um problema para a segurança digital – algo mais acentuado em empresas. Afinal, são registros com nomes de funcionários envolvidos em determinados projetos, horários e dias em que estão trabalhando, entre outros.

Em uma eventual invasão, além da exposição dos arquivos, que por si só podem causar transtornos para as empresas, os metadados podem fornecer detalhes sobre como o trabalho é feito e quais profissionais estão envolvidos, por exemplo, algo valioso nas mãos da concorrência.

É algo que pode ser feito mesmo se os invasores não conseguirem abrir os arquivos, já que alguns metadados podem ser visualizados sem a abertura dos arquivos.

Gostou de saber mais sobre metadados? Quer saber mais sobre segurança digital? Siga-nos em nossas redes sociais e fique por dentro de todo nosso conteúdo: LinkedinInstagramFacebook.

This post is also available in: Português English Español