7 Formas de Pensar Como Um Cientista de Dados

Um Cientista de Dados representa uma evolução da função de análise de dados. Esse profissional possui uma base sólida tipicamente em Ciência da Computação, Estatística, Matemática, Modelagem Preditiva e Programação.

A profissão de Cientista de Dados continua crescendo na mesma velocidade em que os dados são gerados pela humanidade. Conceitos como Big Data e Ciência de Dados ganham cada vez mais importância dentro das empresas e profissionais atentos a esta expansão, buscam entender como aproveitar o conhecimento que já possuem e evoluir nesta carreira que já domina o cenário de contratações na América do Norte e Europa. E esse fenômeno agora chega ao Brasil. Veja aqui esta reportagem da TV Record sobre o salário de Cientistas de Dados.

Mas como pensa um Cientista de Dados? O que torna esse profissional especial no universo da análise de dados? O Cientista de Dados William Chen, Gerente de Data Science do Quora (um dos maiores fóruns de perguntas e respostas do mundo), listou as 7 Formas de Pensar Como Um Cientista de Dados, as quais trazemos na íntegra aqui para você. Confira!

1. Saciar sua curiosidade através de dados

cientista-dados-curiosidade-profissional-data-analytics

Como Cientista de Dados, seu objetivo é encontrar respostas para as mais variadas perguntas de negócios, desde uma previsão de vendas até a previsão de quando um cliente pode cancelar um contrato. Os Cientistas de Dados são naturalmente curiosos sobre os dados que estão analisando e são criativos com as maneiras de abordar e resolver qualquer problema que precisa ser resolvido.

Grande parte da Ciência de Dados é um trabalho de descoberta, o que é feito usando ferramentas oferecidas pela Matemática, Estatística e Ciência da Computação.

Desafio: Pense em um problema ou tópico que você está interessado e tente responder usando análise de dados!

2. Leia notícias com um olhar cético

cientista-dados-profissional-cetico-data-analytics

Grande parte da contribuição de um Cientista de Dados (e porque é realmente difícil substituir um Cientista de Dados por uma máquina) é que um Cientista de Dados lhe dirá o que é importante e o que é espúrio. Esse ceticismo persistente é saudável em todas as ciências, e é especialmente necessário em um ambiente acelerado, onde é muito fácil deixar que um resultado espúrio seja mal interpretado.

Você pode adotar essa mentalidade lendo notícias com um olhar crítico. Muitos artigos de notícias têm inerentemente falhas nas premissas principais e também falhas técnicas.

Desafio: Faça isso todos os dias quando você encontrar um artigo de notícias: Comente sobre o artigo e aponte as falhas (caso existam).

3. Veja os dados como uma ferramenta para melhorar os produtos de consumo

cientista-dados-analise-estatistica-melhorar-produtos

Visite um site de produtos de consumo na Internet e pense no funil principal (cursos online, livros ou mesmo pizzas). Eles têm um funil de checkout? Eles têm um funil de inscrição? Eles têm um funil de engajamento?

Percorra o funil várias vezes e formule hipóteses sobre diferentes maneiras de melhorar a métrica principal (taxa de conversão, compartilhamentos, inscrições, etc.). Crie uma experiência para verificar se a alteração sugerida pode realmente alterar a métrica principal.

Desafio: Depois de fazer esta análise sobre o funil de vendas de uma empresa, envie seus resultados por e-mail para a própria empresa. São grandes as chances que você seja contratado como consultor.

4. Pense como um Bayesiano

cientista-dados-probabilidade-estatistica-bayesiano

Para pensar como um bayesiano, evite a falácia da taxa básica. Isto significa formar novas crenças incorporando tanto a informação recém-observada como informação prévia formada através da intuição ou experiência.

Ao verificar o seu Dashboard de Conversão de Vendas, os números de engajamento dos usuários estão significativamente baixos hoje. Qual das alternativas a seguir é mais provável?

  1. Os usuários estão subitamente menos envolvidos
  2. Algum recurso do site deixou de funcionar
  3. A página de inscrição está com bug

Mesmo que o item #1 explique completamente a queda nas conversões de vendas, #2 e #3 devem ser mais prováveis ​​porque têm uma probabilidade anterior muito maior.

Você é um Gerente Sênior da Tesla e cinco dos modelos S da Tesla pegaram fogo nos últimos cinco meses. Qual é a razão mais provável?

  1. A qualidade da fabricação diminuiu e os veículos da Tesla agora devem ser considerados inseguros.
  2. A segurança não mudou e os incêndio nos veículos Tesla Model S ainda são muito mais raros do que seus equivalentes em carros a gasolina.

Embora o número 1 seja uma explicação fácil (e ótima para a cobertura da mídia), a probabilidade anterior deve ser forte na segunda opção, devido aos testes de qualidade regularmente executados pela Tesla. No entanto, você ainda deve buscar informações que possam atualizar suas crenças de #1 versus #2 (e ainda encontrar maneiras de melhorar a segurança). E que informação você deve procurar? Isso é trabalho para um Cientista de Dados.

Desafio: Identifique a última vez que você cometeu a falácia da taxa básica e tente evitá-la.

5. Conheça as limitações de suas ferramentas

cientista-dados-ferramentas-variacoes-conhecimento

“O conhecimento é saber que um tomate é uma fruta, a sabedoria é não colocá-lo em uma salada de frutas.” – Miles Kington

O conhecimento é dominar cinco variações diferentes de clustering K-means, a sabedoria é perceber como raramente os dados reais podem ser agrupados de forma limpa e como é difícil obter bons resultados com muitos recursos.

O conhecimento é dominar uma vasta gama de técnicas sofisticadas, mas a sabedoria é ser capaz de escolher aquela que fornecerá a maior quantidade de impacto para a empresa em um período de tempo razoável.

Nos cursos da Data Science Academy, procura-se sempre ensinar aos alunos diversas técnicas e ferramentas e compará-las em termos de performance, efetividade e facilidade de uso. Não existe uma ferramenta universal e cada problema requer ferramentas e técnicas diferentes.

Desafio: Aplique várias ferramentas a um conjunto de dados real e descubra as compensações e limitações de cada ferramenta. Quais ferramentas funcionaram melhor? Você pode descobrir porquê?

6. Ensine um conceito complicado

cientista-dados-ensinar-conceito-data-analise

Richard Feynman, um famoso Físico americano e também um ótimo professor, se orgulhava de ser capaz de conceber maneiras de explicar até mesmo as ideias mais profundas aos alunos iniciantes. Certa vez, um aluno perguntou a ele: “Dick, explique, para que eu possa entender, porque girar metade das partículas obedece à estatística de Fermi-Dirac”. Avaliando perfeitamente seu público, Feynman disse: “Vou preparar uma palestra sobre isso”. Mas ele voltou alguns dias depois para dizer: “Eu não pude fazê-lo. Não consegui reduzi-lo ao nível de calouro. Isso significa que não o entendemos realmente”. – David L. Goodstein, Feynman’s Lost Lecture: The Motion of Planets Around the Sun.

O que distinguia Richard Feynman era sua capacidade de destilar conceitos complexos em ideias compreensíveis. Da mesma forma, o que distingue os principais Cientistas de Dados é a capacidade de compartilhar suas ideias de maneira convincente e explicar suas análises. O Cientista de Dados possui uma habilidade raríssima de se encontrar atualmente: profissionais que saibam usar o jargão técnico com a equipe técnica e a linguagem de negócios com os gestores da empresa. Essa habilidade pode ser aprendida, assim como qualquer outra!

Desafio: Ensine um conceito técnico a um amigo em um fórum público, como o Quora ou StackOverflow. Será difícil da primeira vez, mas com o tempo essa habilidade poderá mudar sua vida profissional e até mesmo pessoal, e tornar você um comunicador muito melhor.

7. Convencer os outros sobre o que é importante

cientista-dados-convencer-explicar-outros

Talvez ainda mais importante do que a capacidade de um Cientista de Dados explicar sua análise, seja sua capacidade de comunicar o valor e o impacto potencial dos insights acionáveis.

Certas tarefas de Ciência de Dados serão comoditizadas à medida que ferramentas de Ciência de Dados se tornarem melhores. Novas ferramentas tornarão certas tarefas obsoletas, como a criação de painéis de controle, Data Wrangling desnecessário e até tipos específicos de modelagem preditiva.

No entanto, a necessidade de um Cientista de Dados para extrair e comunicar o que é importante nunca ficará obsoleta. Com quantidades crescentes de dados e insights em potencial, as empresas sempre precisarão de Cientistas de Dados (ou pessoas em funções de ciência de dados) para fazer a triagem de tudo o que pode ser feito e priorizar tarefas com base no impacto.

O papel do Cientista de Dados na empresa é servir como o embaixador entre os dados e a empresa. O sucesso de um Cientista de Dados é medido pelo quão bem ele pode contar uma história e causar impacto. Todas as outras habilidades são amplificadas por essa habilidade.

Desafio: Conte uma história com estatísticas. Comunique as descobertas importantes em um conjunto de dados. Faça uma apresentação convincente com a qual seu público se preocupa.

Quer aprender a desenvolver estas 7 habilidades? Então confira o programa Formação Análise Estatística Para Cientistas de Dados, 100% online e 100% em português. Clique no banner abaixo, confira o programa completo e inscreva-se!

Redação PTI

Mais artigos deste autor »

Portal dedicado ao compartilhamento de conteúdos relacionados a carreira em Tecnologia da Informação. Siga-nos nas redes sociais acima e acompanhe publicações diariamente :)


1 Comentários

edy
1

Nesse ítem “Pense como um Bayesiano” evitando o pensamento básico, me lembrou o livro “Freakonomics – O lado oculto e inesperado de tudo que nos afeta” do economista Steven Levitt onde os autores debatem problemas decorrentes de assimetria de informação.

Deixe seu comentário

Seu endereço de e-mail não será publicado. Campos com * são obrigatórios!