Aprender
Data Science: Por onde começar a estudar?[Parte 1]
Por Lidiane Monteiro,
Fundadora do Blog InspirAda na Computação
Cientista de Dados é a profissão que tem chamado bastante a atenção e tem sido manchete nos portais de tecnologia:
Cientista de dados: o trabalho mais sexy do século 21
Considerada a Profissão do futuro, Cientista de Dados ganha até R$12 mil
obs.: Em São Paulo o salário é bem maior que informado na matéria. Fora do Brasil facilmente é acima de R$12mil mensais e em alguns casos chega a 128mil dólares por ano.
Onde estudar para ser um Cientista de Dados
Antes desse "boom" eu já estava bem interessada na área pelas possibilidades e aplicações:
Melhor ainda foi quando descobri que as linguagens mais utilizadas pelos Cientistas de Dados é R ou Python. Para mim foi uma combinação perfeita pois decidi investir em Python para outros projetos. E por todas as vantagens que a linguagem proporciona nada melhor que usar na profissão que deseja alcançar.
Decidi começar a estudar por conta própria e pesquisei alguns materiais. Nesse período lançaram o curso "Big Data em Saúde no Brasil" e decidi fazer. O curso começa pelo básico, o professor Alexandre Chiavegatto é bem didático e as linguagens adotadas R e Python. O conteúdo é excelente e aborda também conhecimentos de saúde pública. Mas, não consegui dar continuidade e parei na primeira semana. Senti dificuldade por não ter base em estatística (o calo da maioria dos aspirantes a DS), o pré-requisito do curso.
Já havia cursado Cálculo I/II/III, Álgebra Linear e Geometria Analítica e Estatística há uns anos quando cursava Física, mas pelo tempo esqueci bastante coisa.
E agora? Por onde começar a estudar antes de me meter a fazer cursos oferecidos no Coursera/edX/etc, como o da USP e de universidades internacionais, e que oferecem conteúdos ainda mais especializados em Data Science?!
A Ciência de Dados precisa de vários conhecimentos de áreas diferentes. É necessário ter base de Programação, Estatística, Cálculo e Álgebra linear. Ainda que não use profundamente todas os conceitos e teorias no início, saber o máximo que puder vai facilitar a vida e imersão na área de Ciência de Dados.
Para desenvolver uma base sólida é necessário saber estudar: Saber teoria, praticar bastante exercícios, relacionar o estudo/prática de matemática com programação. Mas, antes de tudo é preciso escolher bons materiais de estudo.
Afinal, como adquirir uma boa base em Programação e Matemática + Estatística para conseguir dar passos mais largos? Segue alguns materiais que é ideal para quem nunca estudou o assunto ou está precisando revisar:
Inglês:- Estude urgentemente. A maioria dos cursos e livros são em inglês, principalmente nessa área recente.
Programação/Python:
- Curso em Vídeo: Python para Zumbis
- Livro: Como pensar como um cientista da Computação
*Intermediário:
- Livro: Algoritmos e estrutura de Dados em Python
- Curso em Video: Algoritmo e estrutura de Dados com Python3
*Intermediário:
- Livro: Guia de Mineração de Dados
Update Bônus: Confira a apresentação "Por que Python é o melhor para Ciência de Dados" e conheça as possibilidades que a linguagem oferece.
*Basicão:
Matemática + Estatística:
- Curso em Vídeo: Introdução a Estatística (Univesp)
- Curso em Vídeo: Probabilidade e Estatística (Khan Academy)
- Análise de Dados e Inferência Estatística (Coursera)
- Curso em Vídeo: Cálculo I (Unicamp)
- Curso em Vídeo: Cálculo III (Unicamp)
- Curso em Vídeo: Pré-Álgera, Álgebra I, Álgebra II (Khan Academy)
- Livro: Álgebra Linear - Steinbruch e Winterle
Big Data:
- Cursos da Big Data University
Muitos cursos não precisam de pré-requisito ou são os próprios cursos: Fundamentos do Big Data, Fundamentos de Hadoop I, Introdução a programação MapReduce, Movendo Dados para o Hadoop, Acessando Dados do Hadoop Utilizando Hive, Utilizando HBase para Acesso em Tempo Real para seu Big Data - v2, Controlando Hadoop Jobs utilizando Oozie, Introdução a Jaql, Introdução a Pig, Desenvolvendo Aplicações Distribuídas Utilizando ZooKeeper, Fundamentos de Análise de Texto, Fundamentos de Spark, Usando BigSheets para Análise de Planilhas, Acesso SQL para Hadoop(Big SQL v3).
Comunidade/Fórum:- Data Science Brasil
Algo mais? Deixe sua opinião/sugestão no comentário!
Para não perder nada:
- Assine nossa Newsletter
- Curta e acompanhe a Fan Page InspirAda na Computação
APRENDER
Data Science Ciência de Dados Cientista de Dados Profissão do Futuro Big Data R Python Álgebra Estatística