segunda-feira, 12 de agosto de 2013

      Ciência dos Dados (ou Data Science em inglês) é um termo que já existe há algumas décadas e não se trata apenas de big data. Ouvimos muitas pessoas mencionando estas expressões juntas, como se andassem de mãos dadas, o que não deixa de ser verdade, mas não é algo absoluto. Big data precisa de data science, mas data science não necessariamente precisa de big data. Mesmo os gigantes de dados, como Facebook e Google, são capazes de segmentar seus dados em partes menores que sejam possíveis de trabalhar, apesar do big data ser rotina para eles.
     Data Science é algo grande, pequeno, estruturado, não estruturado, bagunçado, arrumado, tudo ao mesmo tempo; está além de conter apenas analytics. Como um cientista de dados, você será um elo entre o departamento de TI e a área de negócios. Você tem que falar as duas línguas e tem que entender a hierarquia dos dados, ou seja, você não pode ser apenas um arquiteto ou apenas um expert em dados. O que realmente importa em data science é o esforço do time e seu papel como elo. Sua empresa possui uma enorme quantidade de dados e você quer ter certeza que sua queries estão corretas.
     Outra coisa relevante é que não importa a ferramenta que você use: você tem que ter certeza que seus dados estão limpos, organizados para a consulta, além de estarem normalizados e devidamente indexados para que tudo corra bem. Além de analisar os dados, você terá que ser capaz de dar insights, o que requer conhecimento do negócio e de seus clientes. Você tem que estar preparado para tirar conclusões e também estar preparado para fazer as perguntas certas. Este é o papel de um cientista de dados.

Qual tipo de personalidade é característica de um cientista de dados?
Como qualquer tipo de cientista, ser curioso faz toda a diferença. Querer saber o “por quê?” é a grande questão da ciência dos dados. “Por que isto está acontecendo?” “Por que existe esse padrão?” “É por que existe algo de errado com os dados ou é realmente um padrão que explica o fenômeno?”. Ser naturalmente curioso te dará bases para ser um grande profissional.

Para aspirantes a cientistas de dados, por onde começar?
     Existem muitas posições para começar se desenvolver como cientista de dados; não é preciso começar sendo um “engenheiro de dados”. Existem pessoas que começaram como analistas juniores. E, começar de baixo não é um problema, pois existem muitas opções e dados open source para começar a praticar. É provável que sua empresa não te dê acesso à base completa de dados, mas provavelmente existirá uma base voltada para o desenvolvimento onde você poderá se aprimorar e treinar bastante. É importante também que você sinalize para o seu líder que tem interesse em ser um cientista de dados.
    Ser curioso é uma característica fundamental, certo? Então se inscreva em cursos, aprenda linguagens de programação e também aprenda sobre negócios. Você terá que aprender o que é budget, o que é (e também como fazer) um business case, como calcular o retorno de um investimento. E todas essas coisas juntas fazem da ciência dos dados uma área incrível. Experimente!



Este texto é de autoria de Carla Genty (@data_nerd) que, gentilmente, permitiu sua tradução e publicação no blog Arte dos Dados. Carla é fundadora da Analytical-Solution, uma empresa que oferece soluções em Data Science. Obrigado!


0 comentários:

Postar um comentário