Vous êtes sur la page 1sur 7

Cientista de dados: o emprego mais sexy do século 21

Quando Jonathan Goldman chegou ao trabalho em junho de 2006 no LinkedIn,


o site de redes de negócios, o local ainda parecia uma start-up. A empresa tinha pouco
menos de 8 milhões de contas, e o número estava crescendo rapidamente conforme os
membros existentes convidavam seus amigos e colegas para participar. Mas os usuários
não procuravam conexões com as pessoas que já estavam no site na proporção
esperada pelos executivos. Algo aparentemente estava faltando na experiência social.
Como disse um gerente do LinkedIn: “Foi como chegar a uma recepção de conferência
e perceber que você não conhece ninguém. Então você fica no canto tomando sua
bebida e provavelmente vai embora mais cedo.
Goldman, PhD em física de Stanford, ficou intrigado com a ligação que viu e com
a riqueza dos perfis dos usuários. Tudo feito a partir de dados confusos e de análises
complicadas. Mas quando ele começou a explorar as conexões das pessoas, ele
começou a ver possibilidades. Ele começou a formar teorias, testando palpites e
encontrando padrões que lhe permitissem prever em quais redes um dado perfil se
basearia. Ele poderia imaginar que novos recursos que capitalizassem a heurística que
ele estava desenvolvendo poderiam fornecer valor aos usuários. Mas a equipe de
engenharia do LinkedIn, envolvida nos desafios de expandir o site, parecia
desinteressada. Alguns colegas rejeitaram abertamente as ideias de Goldman. Por que
os usuários precisariam do LinkedIn para descobrir suas redes para eles? O site já tinha
um importador de catálogo de endereços que podia acessar todas as conexões de um
membro.
Felizmente, Reid Hoffman, co-fundador e CEO do LinkedIn na época (agora seu
presidente executivo), tinha fé no poder da análise por causa de suas experiências no
PayPal e concedeu ao Goldman um alto grau de autonomia. Por um lado, ele deu ao
Goldman uma maneira de contornar o ciclo tradicional de lançamento de produtos
publicando pequenos módulos na forma de anúncios nas páginas mais populares do site.
Por meio de um desses módulos, o Goldman começou a testar o que aconteceria
se você apresentasse aos usuários nomes de pessoas com quem eles ainda não haviam
se relacionado, mas pareciam saber - por exemplo, pessoas que compartilhavam o
período em que frequentaram escolas e locais de trabalho. Ele fez isso criando um
anúncio personalizado que exibia as três melhores novas correspondências para cada
usuário com base no plano de fundo inserido em seu perfil no LinkedIn. Em alguns dias
ficou óbvio que algo notável estava ocorrendo. A taxa de cliques nesses anúncios foi a
mais alta já vista. Goldman continuou a refinar como as sugestões foram geradas,
incorporando ideias de rede como "fechamento de triângulo" - a noção de que, se você
conhece Larry e Sue, há uma boa chance de que Larry e Sue se conheçam. Goldman e
sua equipe também receberam a ação necessária para responder a uma sugestão com
apenas um clique.
A escassez de cientistas de dados está se tornando uma séria restrição em alguns
setores.
Não demorou muito para que os principais gerentes do LinkedIn reconhecessem
uma boa ideia e a tornassem um recurso padrão. Foi quando as coisas realmente
decolaram. Os anúncios "Pessoas que você pode conhecer" alcançaram uma taxa de
cliques 30% maior do que a taxa obtida por outros prompts para visitar mais páginas no
site. Eles geraram milhões de novas visualizações de página. Graças a esse recurso, a
trajetória de crescimento do LinkedIn mudou significativamente para melhor.

Uma nova raça

O Goldman é um bom exemplo de um novo player importante nas organizações:


o "cientista de dados". É um profissional de alto nível com o treinamento e a curiosidade
para fazer descobertas no mundo do Big Data. O título existe há apenas alguns anos.
(Ele foi cunhado em 2008 por um de nós, DJ Patil, e Jeff Hammerbacher, na ocasião os
respectivos líderes de dados e esforços de análise no LinkedIn e no Facebook.) Mas
milhares de cientistas de dados já estão trabalhando tanto em start-ups quanto em
empresas bem estabelecidas. Sua aparição súbita no cenário empresarial reflete o fato
de que as empresas estão agora lutando com informações que vêm em variedades e
volumes nunca antes encontrados. Se sua organização armazena vários petabytes de
dados, se as informações mais importantes para sua empresa residirem em formulários
diferentes de linhas e colunas de números, ou se responder à sua maior pergunta
envolver um "mashup" de vários esforços analíticos, você conseguiu uma oportunidade
de big data.
Grande parte do entusiasmo atual pelo big data se concentra em tecnologias que
tornam possível domar, incluindo o Hadoop (a estrutura mais usada para
processamento de sistemas de arquivos distribuídos) e ferramentas de código aberto
relacionadas, computação em nuvem e visualização de dados. Embora esses sejam
avanços importantes, pelo menos tão importantes são as pessoas com o conjunto de
habilidades (e a mentalidade) para colocá-las em bom uso. Nesta frente, a demanda
correu à frente da oferta. De fato, a falta de cientistas de dados está se tornando uma
séria restrição em alguns setores. A Greylock Partners, uma firma de capital de risco que
tem apoiado empresas como Facebook, LinkedIn, Palo Alto Networks e Workday, está
bastante preocupada com o conjunto de mão-de-obra restrita que construiu sua própria
equipe de recrutamento especializada para canalizar talentos para o portfólio da
empresa. "Uma vez que eles têm dados", diz Dan Portillo, que lidera a equipe, "eles
realmente precisam de pessoas que possam gerenciá-los e encontrar insights."

Quem são essas pessoas?

Se capitalizar o big data depender da contratação de escassos cientistas de


dados, o desafio para os gerentes é aprender como identificar esse talento, atraí-lo para
uma empresa e torná-lo produtivo. Nenhuma dessas tarefas é tão direta quanto é com
outras funções organizacionais estabelecidas. Comece com o fato de que não há
programas universitários oferecendo graduação em ciência de dados. Há também pouco
consenso sobre onde o papel se encaixa em uma organização, como os cientistas de
dados podem agregar mais valor e como seu desempenho deve ser medido.
O primeiro passo para preencher a necessidade de cientistas de dados, portanto,
é entender o que eles fazem nas empresas. Então pergunte: Quais habilidades eles
precisam? E, em quais campos são essas habilidades mais facilmente encontradas?
Mais do que tudo, o que os cientistas de dados fazem é realizar descobertas
enquanto nadam em dados. É o método preferido deles de navegar pelo mundo ao seu
redor. À vontade no mundo digital, eles são capazes de estruturar grandes quantidades
de dados sem forma e possibilitar a análise. Eles identificam fontes de dados ricas,
conectam-se a outras fontes de dados potencialmente incompletas e limpam o conjunto
resultante. Em um cenário competitivo em que os desafios continuam mudando e os
dados nunca param de fluir, os cientistas de dados ajudam os tomadores de decisão a
mudar da análise ad hoc para uma conversa contínua com os dados.
Os cientistas de dados percebem que enfrentam limitações técnicas, mas não
permitem que isso atrapalhe a busca por novas soluções. Ao fazer descobertas, eles
comunicam o que aprenderam e sugerem suas implicações para novas direções de
negócios. Frequentemente, são criativos em exibir informações visualmente e fazer com
que os padrões sejam claros e convincentes. Eles aconselham executivos e gerentes de
produto sobre as implicações dos dados para produtos, processos e decisões.
Dado o estado nascente de seu comércio, é comum os cientistas de dados
criarem suas próprias ferramentas e até mesmo conduzirem pesquisas de estilo
acadêmico. O Yahoo, uma das empresas que empregou um grupo de cientistas de dados
desde o início, foi fundamental para o desenvolvimento do Hadoop. A equipe de dados
do Facebook criou o idioma Hive para programar projetos do Hadoop. Muitos outros
cientistas de dados, especialmente em empresas voltadas para dados, como Google,
Amazon, Microsoft, Walmart, eBay, LinkedIn e Twitter, adicionaram e refinaram o kit de
ferramentas.
Que tipo de pessoa faz tudo isso? Quais habilidades tornam um cientista de
dados bem-sucedido? Pense nele como um híbrido de hacker de dados, analista,
comunicador e consultor confiável. A combinação é extremamente poderosa e rara.
A habilidade universal mais básica dos cientistas de dados é a capacidade de
escrever códigos. Isso pode ser menos verdadeiro em cinco anos, quando mais pessoas
terão o título de “cientista de dados” em seus cartões de visita. Mais duradoura será a
necessidade de os cientistas de dados se comunicarem em uma linguagem que todos os
interessados compreendam - e demonstrar as habilidades especiais envolvidas na
narração de histórias com dados, seja verbalmente, visualmente ou - idealmente -
ambos.
Mas nós diríamos que o traço dominante entre os cientistas de dados é uma
intensa curiosidade - um desejo de ir abaixo da superfície de um problema, encontrar
as questões em seu coração, e destilá-las em um conjunto muito claro de hipóteses que
podem ser testadas. Isso muitas vezes implica o pensamento associativo que caracteriza
os cientistas mais criativos em qualquer campo. Por exemplo, sabemos de um cientista
de dados que estuda um problema de fraude que percebeu que era análogo a um tipo
de problema de sequenciamento de DNA. Ao reunir esses mundos diferentes, ele e sua
equipe conseguiram criar uma solução que reduziu drasticamente as perdas por fraude.
Talvez esteja ficando claro por que a palavra "cientista" se encaixa nesse papel
emergente. Os físicos experimentais, por exemplo, também precisam projetar
equipamentos, coletar dados, realizar múltiplos experimentos e comunicar seus
resultados. Assim, empresas que procuram pessoas que possam trabalhar com dados
complexos têm tido sorte no recrutamento de pessoas com formação educacional e
profissional nas ciências físicas ou sociais. Alguns dos melhores e mais brilhantes
cientistas de dados são PhDs em campos esotéricos como ecologia e biologia de
sistemas. George Roumeliotis, chefe de uma equipe de ciência de dados da Intuit no
Vale do Silício, é doutor em astrofísica. Um pouco menos surpreendente, muitos dos
cientistas de dados que trabalham nos negócios de hoje foram formalmente treinados
em ciência da computação, matemática ou economia. Eles podem emergir de qualquer
campo que tenha um forte foco computacional e de dados.
É importante manter essa imagem do cientista em mente, porque a palavra
"dados" pode facilmente enviar uma pesquisa por talentos no caminho errado. Como
Portillo nos disse, “os históricos tradicionais de pessoas que você viu de 10 a 15 anos
atrás não funcionam hoje em dia”. Um analista quantitativo pode ser ótimo em analisar
dados, mas não em subjugar uma massa de dados não estruturados e colocá-los em uma
forma em que pode ser analisada. Um especialista em gerenciamento de dados pode
ser ótimo em gerar e organizar dados de forma estruturada, mas não em transformar
dados não estruturados em dados estruturados - e também em não analisar de fato os
dados. E enquanto pessoas sem fortes habilidades sociais podem prosperar em
profissões de dados tradicionais, os cientistas de dados devem ter essas habilidades para
serem eficazes.
Roumeliotis foi claro conosco que ele não contrata com base em recursos
estatísticos ou analíticos. Ele começa sua busca por cientistas de dados perguntando aos
candidatos se eles podem desenvolver protótipos em uma linguagem de programação
mainstream como Java. Roumeliotis busca tanto um conjunto de habilidades - uma base
sólida em matemática, estatística, probabilidade e ciência da computação - quanto
certos hábitos mentais. Ele quer que as pessoas tenham uma ideia de questões de
negócios e empatia pelos clientes. Então, ele diz, ele se baseia em tudo isso com
treinamento no trabalho e um curso ocasional em uma tecnologia particular.
Várias universidades estão planejando lançar programas de ciência de dados, e
os programas existentes em análise, como o programa de Mestrado em Análises no
estado da Carolina do Norte, estão se ocupando de inserir exercícios com big data em
seus cursos. Algumas empresas também estão tentando desenvolver seus próprios
cientistas de dados. Depois de adquirir a empresa de big data Greenplum, a EMC decidiu
que a disponibilidade de cientistas de dados seria um fator determinante em sua própria
exploração - e de seus clientes - de big data. Por isso, sua divisão de Serviços de Educação
lançou um programa de treinamento e certificação de dados científicos e big data
analytics. A EMC disponibiliza o programa para funcionários e clientes, e alguns de seus
graduados já estão trabalhando em iniciativas internas de Big Data.
Os cientistas de dados querem construir coisas, não apenas dar conselhos. Eles
descrevem que ser consultor é como atuar "na zona morta".
À medida que as ofertas educacionais se proliferam, o fluxo de talentos deve se
expandir. Os fornecedores de tecnologias de big data também estão trabalhando para
torná-los mais fáceis de usar. Enquanto isso, um cientista de dados criou uma
abordagem criativa para preencher a lacuna. O programa Insight Data Science Fellows
Programme, uma bolsa de pós-doutorado desenvolvida por Jake Klamka (físico de alta
energia por treinamento), leva cientistas da academia e em seis semanas os prepara
para ter sucesso como cientistas de dados. O programa combina a orientação de
especialistas em dados de empresas locais (como Facebook, Twitter, Google e LinkedIn)
com a exposição a desafios reais de big data. Originalmente com o objetivo de 10
bolsistas, a Klamka acabou aceitando 30, de um pool de candidatos totalizando mais de
200. Mais organizações estão fazendo fila para participar. “A demanda das empresas
tem sido fenomenal”, disse Klamka. "Eles simplesmente não conseguem esse tipo de
talento de alta qualidade."
Por que um cientista de dados quer trabalhar aqui?

Mesmo com a escalada dos cientistas de dados, a competição por talentos de


alto nível permanecerá feroz. Espere que os candidatos dimensionem as oportunidades
de emprego com base em quão interessantes são os desafios do Big Data. Como um
deles comentou: "Se quiséssemos trabalhar com dados estruturados, estaríamos em
Wall Street". Como as perspectivas mais qualificadas de hoje vêm de ambientes não-
comerciais, os gerentes de contratação talvez precisem descobrir como pintar um
quadro interessante do potencial de avanços que seus problemas oferecem.
O pagamento será, obviamente, um fator. Um bom cientista de dados terá
muitas portas abertas para ele, e os salários ofertados serão altos. Vários cientistas de
dados que trabalham em start-ups comentaram que exigiram e obtiveram grandes
pacotes de opções de ações. Mesmo para alguém que aceita uma posição por outras
razões, a compensação indica um nível de respeito e o valor que a função deve adicionar
ao negócio. Mas a nossa pesquisa informal sobre as prioridades dos cientistas de dados
revelou algo mais fundamentalmente importante. Eles querem estar “na ponte”. A
referência é ao seriado de TV de 1960, Star Trek, no qual o capitão da nave estelar, James
Kirk, depende muito dos dados fornecidos por Spock. Os cientistas de dados querem
estar no meio de uma situação em desenvolvimento, com consciência em tempo real
do conjunto de escolhas em evolução que apresenta.
Considerando a dificuldade de encontrar e manter os cientistas de dados,
alguém poderia pensar que uma boa estratégia envolveria contratá-los como
consultores. A maioria das empresas de consultoria ainda precisa reunir muitos deles.
Até mesmo as maiores empresas, como a Accenture, a Deloitte e a IBM Global Services,
estão nos estágios iniciais dos principais projetos de Big Data para seus clientes. As
habilidades dos cientistas de dados que eles têm em seus staffs estão sendo aplicadas
majoritariamente aos problemas de análise quantitativa mais convencionais.
Firmas offshore de análise de serviços, como a indiana Mu Sigma, podem ser as
primeiras a fazer as primeiras grandes incursões com os cientistas de dados. Mas os
cientistas de dados com quem falamos dizem que querem construir coisas, não apenas
dar conselhos a um tomador de decisões. Um descreveu ser um consultor como "a zona
morta - tudo o que você consegue fazer é contar a outra pessoa o que as análises dizem
que devem fazer". Ao criar soluções que funcionem, elas podem ter mais impacto e
deixar suas marcas como pioneiras de sua profissão.

Cuidado e alimentação

Os cientistas de dados não se dão bem estão com as rédeas curtas. Eles devem
ter a liberdade de experimentar e explorar possibilidades. Dito isso, eles precisam de
relacionamentos próximos com o resto do negócio. Os laços mais importantes para eles
são os executivos encarregados de produtos e serviços, e não as pessoas que
supervisionam as funções de negócios. Como a história de Jonathan Goldman ilustra,
sua maior oportunidade de agregar valor não está na criação de relatórios ou
apresentações para executivos seniores, mas na inovação com produtos e processos
voltados para o cliente.
O LinkedIn não é a única empresa a usar cientistas de dados para gerar ideias de
produtos, recursos e serviços de valor agregado. Na Intuit, os cientistas de dados são
solicitados a desenvolver insights para clientes e consumidores de pequenas empresas
e a se reportar a um novo vice-presidente sênior de big data, design social e marketing.
A GE já está usando a ciência de dados para otimizar os contratos de serviço e intervalos
de manutenção para produtos industriais. O Google, é claro, usa cientistas de dados
para refinar seus algoritmos principais de busca e veiculação de anúncios. A Zynga usa
cientistas de dados para otimizar a experiência do jogo, tanto para o envolvimento de
longo prazo quanto para a receita. A Netflix criou o bem conhecido Prêmio Netflix,
concedido à equipe de ciência de dados que desenvolveu a melhor maneira de melhorar
o sistema de recomendação de filmes da empresa. A empresa de preparação de testes
Kaplan usa seus cientistas de dados para descobrir estratégias efetivas de aprendizado.
Os cientistas de dados hoje são parecidos com os "quants" de Wall Street nos
anos 80 e 901.
Há, no entanto, uma desvantagem potencial de ter pessoas com habilidades
sofisticadas em um campo de rápida evolução que passam seu tempo entre colegas de
gerência geral. Eles terão menos interação com especialistas semelhantes, que precisam
manter suas habilidades afiadas e seu kit de ferramentas de última geração. Os
cientistas de dados precisam se conectar com comunidades de prática, seja dentro de
grandes empresas ou externamente. Novas conferências e associações informais estão
surgindo para apoiar a colaboração e o compartilhamento de tecnologia, e as empresas
devem incentivar os cientistas a se envolverem nelas, com o entendimento de que “mais
água no porto flutua todos os barcos”.
Os cientistas de dados também tendem a ser mais motivados quando mais se
espera deles. Os desafios de acessar e estruturar big data às vezes deixam pouco tempo
ou energia para análises sofisticadas envolvendo previsão ou otimização. No entanto,
se os executivos deixarem claro que relatórios simples não são suficientes, os cientistas
de dados dedicarão mais esforços à análise avançada. Big data não deve ser igual a
"pequena matemática".

O trabalho top2 da década

Hal Varian, economista-chefe do Google, é conhecido por ter dito: “O trabalho


sexy nos próximos 10 anos será estatístico. As pessoas acham que estou brincando, mas
quem teria adivinhado que engenheiros de computação teriam sido o trabalho sexy dos
anos 90? ”.
Se "sexy" significa ter qualidades raras que são muito procuradas, os cientistas
de dados já estão lá. Eles são difíceis e caros de contratar e, devido ao mercado muito
competitivo de seus serviços, são difíceis de reter. Simplesmente não há muitas pessoas
com sua combinação de experiência científica e habilidades analíticas e computacionais.
Os cientistas de dados hoje são parecidos com os “quants” de Wall Street dos
anos 80 e 90. Naquela época, as pessoas com formação em física e matemática eram
direcionadas a bancos de investimento e fundos de hedge, onde podiam criar algoritmos
e estratégias de dados inteiramente novos. Depois, várias universidades desenvolveram
programas de mestrado em engenharia financeira, que criaram uma segunda geração
de talentos mais acessível às empresas tradicionais. O padrão foi repetido mais tarde

1
Nota da tradutora: Quants, de análise quantitativa, estatística. Ver documentário “Quants – Os
Alquimistas de Wall Street”, disponível em < https://youtu.be/kFQJNeQDDHA>. Acesso em 7 set. 2018.
2
Optou-se por utilizar top no lugar de quente, nessa tradução.
nos anos 90, com engenheiros de busca, cujas habilidades raras logo passaram a ser
ensinadas em programas de ciência da computação.
Uma questão levantada por essa questão é se algumas empresas seriam sensatas
em esperar até que a segunda geração de cientistas de dados surgisse, e os candidatos
sejam mais numerosos, menos caros e mais fáceis de examinar e assimilar em um
ambiente de negócios. Por que não deixar o trabalho de caçar e domesticar talentos
exóticos para as empresas iniciantes de big data e para empresas como a GE e o
Walmart, cujas estratégias agressivas exigem que elas estejam na vanguarda?
O problema com esse raciocínio é que o avanço do big data não mostra sinais de
desaceleração. Se as empresas enfrentam os primeiros dias da tendência por falta de
talento, correm o risco de ficar para trás à medida que os concorrentes e os parceiros
de canal ganham vantagens quase inatacáveis. Pense no big data como uma onda épica
se formando agora, começando a se destacar. Se você quiser pegá-la, você precisa de
pessoas que possam surfar.

Uma versão deste artigo apareceu na edição de outubro de 2012 da Harvard Business
Review.

Thomas H. Davenport é Professor de Gestão e Tecnologia da Informação do Babson


College, pesquisador do MIT em Economia Digital e consultor sênior da Deloitte
Analytics. Autor de mais de uma dúzia de livros de gestão, seu mais recente é Apenas
seres humanos precisam aplicar: vencedores e perdedores na era das máquinas
inteligentes (Only Humans Need Apply: Winners and Losers in the Age of Smart
Machines.).

D.J. Patil é a cientista de dados residente na Greylock Partners, foi a diretora de produtos
de dados do LinkedIn e autora do Data Jujitsu: A arte de transformar dados em produto
(Data Jujitsu: The Art of Turning Data into Product) (O’Reilly Media, 2012).

Citação:

PATIL, T. H. D. J.; DAVENPORT, T. H. Cientista de dados: o emprego mais sexy do século


21. (Tradução Livre: GRAZIANO, D.C.). Data scientist: The sexiest job of the 21st
century. Harvard Business Review, 2012.

Vous aimerez peut-être aussi