Empresa orientada a dados: o poder da colaboratividade
Por Marcell Biemann, arquiteto de Soluções Analíticas da Via Consulting
No terceiro texto da série sobre “Dados”, iremos falar sobre colaboração e a importância do envolvimento de outros profissionais, equipes e conhecimentos nas análises dos dados.
“Talent wins games, but teamwork and intelligence win championships.”
Michael Jordan
Uma empresa orientada a dados aproveita o conhecimento de todos e trabalha de forma colaborativa.
Grupos de profissionais de dados (cientistas, arquitetos, engenheiros, etc) que vivem em uma bolha estão perdendo o melhor das comunidades por aí. As atividades que promovem a ciência de dados para o bem social, incluindo competições abertas ou internas, são uma ótima maneira de aprimorar e aprender novas habilidades ou simplesmente colaborar com outros profissionais. Um exemplo é a plataforma Kaggle, considerada hoje a maior comunidade global de cientistas de dados e aprendizagem de máquina (machine learning).
Além disso, as equipes de profissionais de dados amadurecem e não tentam agir sozinhas, mas trabalham em colaboração com o restante da empresa. Uma tática de sucesso é patrocinar competições internas entre áreas de negócio, que são ótimas para a formação e integração de equipes. Uma empresa madura na ciência de dados tem uma cultura colaborativa na qual a equipe de dados trabalha lado a lado com o negócio para resolver problemas críticos usando dados.
Outra abordagem é o crowdsourcing interno (em português, contribuição colaborativa ou colaboração coletiva) – isso é particularmente forte para apresentar as melhores questões para os profissionais de dados abordarem. Uma equipe madura de dados agrupa internamente várias tarefas diferentes no ciclo de vida do processo de dados, como a seleção de dados; limpeza de dados; preparação e transformações dos dados; geração de modelo de conjunto; avaliação de modelo; e refinamento de hipóteses. Como a limpeza e a preparação de dados podem consumir facilmente de 50% a 80% do esforço de todo um projeto, é possível economizar tempo e reduzir os riscos ao paralelizar (através de crowdsourcing) os esforços de limpeza e preparação, especialmente por profissionais da empresa que estão mais familiarizados com produtos e bancos de dados específicos.
Além disso, os algoritmos não resolvem todos os problemas. Ainda é incrivelmente difícil para um algoritmo entender todos os possíveis contextos de um resultado e escolher o caminho certo. Os seres humanos ainda precisam estar no circuito, e uma profunda compreensão do contexto do desafio é essencial para a interpretação sólida dos dados e a criação de modelos precisos.
Traduzido e adaptado de:
www.oreilly.com/data/free/files/ten-signs-of-data-science-maturity.pdf