“Os dados devem ser uma prova e uma forma de separar o fato da ficção e a desinformação da verdade”, diz a CEO da Talend, Christal Bemont. “É fundamental que tenhamos uma abordagem comum para medir a integridade ou confiabilidade dos dados e uma maneira de dar aos tomadores de decisão clareza e confiança instantaneamente.”
Os dados da sua organização são fonte tanto de oportunidades quanto desafios para a inovação. A diferença é se você pode converter conjuntos de dados brutos em informações claras e acionáveis. E isso depende se você pode confiar em seus dados.
“Os ambientes de dados modernos são distribuídos, diversos e dinâmicos, tornando difícil para as organizações gerenciar e manter os níveis de qualidade, levando à desconfiança do ativo mais importante para a tomada de decisões na economia digital”, diz Stewart Bond, diretor de Integração de Dados e Pesquisa de Software de Inteligência no IDC.
Os dados sustentam a transformação digital das organizações e as tecnologias inovadoras essenciais para sua viabilidade a longo prazo, incluindo análises avançadas, inteligência artificial e aprendizado de máquina. No entanto, a maioria das empresas não consegue medir a saúde de seus dados e 62% de seus funcionários disseram que não confiam em seus dados, aponta uma recente pesquisa global realizada pela Talend.
Suas preocupações são justificadas: quase metade de todos os registros de dados recém-criados têm pelo menos um erro crítico. A IBM estima o custo anual de dados ruins em US$ 3 trilhões.
Pensando nisso, os especialistas em Talend costumam adotar uma prática para classificar os dados chamada “Os 5 Ts da confiança”, que são eles:
Transparente (Transparent)
Os dados precisam permanecer limpos (sem erros) e atendendo às regulamentações de privacidade e segurança vigentes, como a LGPD, por exemplo. Seguir essa linha como base irá garantir a precisão dos dados, aumentar a reputação da empresa e reduzir possíveis multas por violações de segurança;
Completo (Thorough)
Determinar a confiança dos dados significa verificar se um conjunto de dados é completo e amplo o suficiente para fornecer uma imagem completa, especialmente para cenários de envolvimento do cliente em que obter uma visão de 360 graus requer a compilação de dados de muitas fontes.
Oportuno (Timely)
Tão importante quanto obter os dados certos é obtê-los no momento certo, seja para detectar fraudes, prever falhas de equipamentos ou rastrear uma crise em rápida evolução. Quando a United Network for Organ Sharing reduziu o tempo necessário para disponibilizar novas fontes de informação de 18 horas para três, gerenciar dados com mais eficiência significou salvar vidas.
Certificado (Trending)
A confiança nos dados dentro das organizações pode ser estabelecida por meio das experiências de outros, observando a frequência que os conjuntos de dados são utilizados e as classificações – ou “certificações de dados” – de especialistas que criam ou usam os dados de perto ou frequentemente.
Significativo (Telling)
Assim como verificações de fatos são essenciais para entender se as informações públicas são confiáveis, os dados devem ser verificáveis. Um fator crítico para estabelecer a confiança nos dados é permitir que os usuários entendam por que um conjunto de dados é confiável e, se não for, fornecer mecanismos para que os usuários resolvam os problemas.
Resolver o problema dos dados ruins vai além da aplicação destes cinco pilares de confiança e do estabelecimento de um padrão para a integridade dos dados. O novo Talend Trust Score, projetado para ajudar os usuários a classificar dinamicamente conjuntos de dados com base em cada um desses cinco critérios, pode mudar fundamentalmente a maneira como usamos todos os dados e percepções para tomar decisões.
Saiba mais sobre o Talend Trust Score.