Ciência dos Dados (ou Data Science em inglês) é um termo que
já existe há algumas décadas e não se trata apenas de big data. Ouvimos muitas pessoas mencionando estas expressões
juntas, como se andassem de mãos dadas, o que não deixa de ser verdade, mas não
é algo absoluto. Big data precisa de data science, mas data science não necessariamente precisa de big data. Mesmo os
gigantes de dados, como Facebook e Google, são capazes de segmentar seus dados
em partes menores que sejam possíveis de trabalhar, apesar do big data ser
rotina para eles.
Data
Science é algo grande, pequeno, estruturado, não estruturado, bagunçado,
arrumado, tudo ao mesmo tempo; está além de conter apenas analytics. Como um cientista de dados, você será um elo
entre o departamento de TI e a área de negócios. Você tem que falar as duas
línguas e tem que entender a hierarquia dos dados, ou seja, você não pode ser
apenas um arquiteto ou apenas um expert
em dados. O que realmente importa em data
science é o esforço do time e seu papel como elo. Sua empresa possui uma
enorme quantidade de dados e você quer ter certeza que sua queries estão corretas.
Outra coisa relevante é que não importa a
ferramenta que você use: você tem que ter certeza que seus dados estão limpos,
organizados para a consulta, além de estarem normalizados e devidamente
indexados para que tudo corra bem. Além de analisar os dados, você terá que ser
capaz de dar insights, o que requer
conhecimento do negócio e de seus clientes. Você tem que estar preparado para
tirar conclusões e também estar preparado para fazer as perguntas certas. Este
é o papel de um cientista de dados.
Qual tipo de personalidade é característica de um cientista de dados?
Como qualquer tipo de cientista,
ser curioso faz toda a diferença. Querer saber o “por quê?” é a grande questão
da ciência dos dados. “Por que isto está acontecendo?” “Por que existe esse
padrão?” “É por que existe algo de errado com os dados ou é realmente um padrão
que explica o fenômeno?”. Ser naturalmente curioso te dará bases para ser um
grande profissional.
Para aspirantes a cientistas de dados, por onde começar?
Existem muitas posições
para começar se desenvolver como cientista de dados; não é preciso começar
sendo um “engenheiro de dados”. Existem pessoas que começaram como analistas
juniores. E, começar de baixo não é um problema, pois existem muitas opções e
dados open source para começar a
praticar. É provável que sua empresa não te dê acesso à base completa de dados,
mas provavelmente existirá uma base voltada para o desenvolvimento onde você
poderá se aprimorar e treinar bastante. É importante também que você sinalize
para o seu líder que tem interesse em ser um cientista de dados.
Ser curioso é uma característica
fundamental, certo? Então se inscreva em cursos, aprenda linguagens de
programação e também aprenda sobre negócios. Você terá que aprender o que é budget, o que é (e também como fazer) um
business case, como calcular o
retorno de um investimento. E todas essas coisas juntas fazem da ciência dos
dados uma área incrível. Experimente!
Este texto é de autoria de Carla
Genty (@data_nerd) que, gentilmente, permitiu sua tradução e publicação no blog
Arte dos Dados. Carla é fundadora da Analytical-Solution, uma empresa que
oferece soluções em Data Science. Obrigado!
O link original é http://analytical-solution.com/2013/06/19/data-science-rocks/
0 comentários:
Postar um comentário