Cómo convertirse en Data Scientist?

Skinbracer

Miembro Regular
Se incorporó
28 Noviembre 2013
Mensajes
30
Hola comunidad.

Soy profesional de las ciencias sociales y suelo trabajar con bases de datos. Sin embargo, y dado que cada vez existen más datos públicos para trabajar, se necesitan más herramientas para poder procesar tal cantidad de datos. He aprendido a usar R a nivel usuario, pero quisiera aprender a usar Python y, eventualmente, mover bases en SQL y JSON.

Cual es un buen inicio para esto? tomar un diplomado? clases online?

Que recomiendan aquellos que tengan experiencia en el tema?
 
Última modificación:

Dettlaff

El primero con su Nick
Miembro del Equipo
ADMIN
Se incorporó
27 Octubre 2010
Mensajes
19.323
Me suscribo, me pareció interesante el tema, si pudieras comentar más sobre R te estaría muy agradecido.

Saludos
 

Skinbracer

Miembro Regular
Se incorporó
28 Noviembre 2013
Mensajes
30
Me suscribo, me pareció interesante el tema, si pudieras comentar más sobre R te estaría muy agradecido.

Saludos

R es un lenguaje de programación especializado para el análisis de datos. Para sacarle el jugo se utiliza RStudio, programa que es como un Stata o SPSS con más herramientas.

El problema es que cuando hay que obtener datos de diferentes fuentes se queda corto. Para ello es mucho mejor Python.
 

Lonerwalker

Main Support (LoL,Rol,OW)
Se incorporó
15 Marzo 2012
Mensajes
292
Python es mucho mas versatil en mi poca experiencia aprendiendo por mi mismo DataScience dado que quiero trabajar en ello algun dia, de momento es recomendable aprender a programar en si, para luego utilizar los modulos que tiene python, como Numpy, Mathplotlib.Pyplot, Pandas, entre otros, al mismo tiempo buscar un IDE (Interface Development Enviroment, creo) que mas se te haga facil, yo solia usar PyCharm que es bien completo, y amigable de usar, tambien puedes usar Jupyter, pero hay otro IDE exclusivo para Datascience el cual no recuerdo, salia en un post de datacamp, whats is the best IDE for Datascience?

GitHub - abhat222/Data-Science--Cheat-Sheet: Cheat Sheets

usa este link tiene muchas hojas de ayuda para casi cualquier lenguaje, saludos !

TL,DR, usa yutun, datacamp o codeacademy, estos 2 ultimos pagados
 

Skinbracer

Miembro Regular
Se incorporó
28 Noviembre 2013
Mensajes
30
Python es mucho mas versatil en mi poca experiencia aprendiendo por mi mismo DataScience dado que quiero trabajar en ello algun dia, de momento es recomendable aprender a programar en si, para luego utilizar los modulos que tiene python, como Numpy, Mathplotlib.Pyplot, Pandas, entre otros, al mismo tiempo buscar un IDE (Interface Development Enviroment, creo) que mas se te haga facil, yo solia usar PyCharm que es bien completo, y amigable de usar, tambien puedes usar Jupyter, pero hay otro IDE exclusivo para Datascience el cual no recuerdo, salia en un post de datacamp, whats is the best IDE for Datascience?

GitHub - abhat222/Data-Science--Cheat-Sheet: Cheat Sheets

usa este link tiene muchas hojas de ayuda para casi cualquier lenguaje, saludos !

TL,DR, usa yutun, datacamp o codeacademy, estos 2 ultimos pagados

Muy interesante lo que cuentas. Revisaré el Git que compartes!

Entre Datacamp y Codeacademy cual será mejor? haz probado alguno?
 

Sago7

Tibetan Mod
Miembro del Equipo
MOD
Se incorporó
5 Julio 2006
Mensajes
6.151
Me anoto, para ver que pasa...
 

Lonerwalker

Main Support (LoL,Rol,OW)
Se incorporó
15 Marzo 2012
Mensajes
292
Muy interesante lo que cuentas. Revisaré el Git que compartes!

Entre Datacamp y Codeacademy cual será mejor? haz probado alguno?
probe ambos, y si, por desgracia o buena suerte (depende de ti) estan en ingles todo,

codecademy lo use en version free harto tiempo (antes que fuera freemium) lo unico que no te dan es el certificado y los examenes para reforzar, pero de manera introductoria, sirve

datacamp, se paga mensual y es lo que avances a mas no poder mientras te dure la membresia, es sistema de aprendizaje a mi me gusto muchisimo pero justo entre a trabajar y quedo ahi ahaha, quiza en vacaciones lo retome.

un buen codder por yutun es codigofacilito, el canal es super bueno

https://github.com/GokuMohandas/practicalAI

otro github que propone IA, pero en base a python todo colorido bajo el IDE de Jupyter, si tienen linkedIn, sigan a indios, son unas bestias de conocimiento
 

Mesita

Capo
Se incorporó
3 Mayo 2007
Mensajes
100
Hola comunidad.

Soy profesional de las ciencias sociales y suelo trabajar con bases de datos. Sin embargo, y dado que cada vez existen más datos públicos para trabajar, se necesitan más herramientas para poder procesar tal cantidad de datos. He aprendido a usar R a nivel usuario, pero quisiera aprender a usar Python y, eventualmente, mover bases en SQL y JSON.

Cual es un buen inicio para esto? tomar un diplomado? clases online?

Que recomiendan aquellos que tengan experiencia en el tema?
Recomendaría seguir los siguientes pasos:
1.- Curso básico de python (tener experiencia en R te servirá). No necesitas ser un programador experto para trabajar en data science. Con respecto a esto creo que cosas importantes a aprender son:
1.1.- Elementos de flujos de control (IF, ELSE, FOR, etc)
1.2.- Funciones
1.3.- Importar, exportar datos de distintos tipos de fuentes
1.3.1.- Bases de datos (consultas básicas)
1.4.- Visualización de información en gráficos
1.5.- Limpiar y trabajar la data (merge, append, pivoteo, eliminar data, etc)

2.- Curso de estadística
2.1.- Varianza
2.2.- Desviación estándar
2.3.- Normalización
2.4.- Promedio, Media, Mediana
2.5.- Regresión lineal, regresión logística, etc
2.6.- Algoritmos de optimización

3.- Machine learning (opcional, aunque cada vez más requerido)
3.1.- Familiaridad con cálculo (derivadas)
3.2.- Álgebra lineal (vectores, matrices)
3.3.- Distintos tipos de algoritmos de clasificación y modelos predictivos

Creo que esos son los conocimientos mínimos que necesitas tener para empezar a trabajar como data scientist. Actualmente hay varias universidades que están dando diplomados/magister en Data Science, pero revisando las mallas te pasan muchas cosas en muy poco tiempo, o sea, te serviría para tener una pincelada inicial de todos los conocimientos más que una práctica más técnica(profundización) de los temas.
En lo personal te recomendaría tomar cursos online, son baratos y buenos (coursera, udacity, etc)
 
Última modificación:

PangKüll

Capo
Se incorporó
23 Septiembre 2011
Mensajes
471
Me suscribo también me interesa el tema,

Enviado desde mi SM-G955F mediante Tapatalk
 

frank_shelby

Miembro Activo
Se incorporó
16 Agosto 2019
Mensajes
14
me suscribo, me interesa mucho el tema para crecer profesionalmente, actualmente trabajo como Analista BI y creo que es el paso que sigue para mi carrera!
 

soulstuff

REPORTERO
REPORTERO
Se incorporó
26 Agosto 2019
Mensajes
19
Recomendaría seguir los siguientes pasos:

Secundo todos esos pasos! Pero lo que diría que es lo más importante es ser busquilla, hay harto material allí afuera para jugar y con Jupyter Notebook de python es mucho más dinámico. Lo mejor después de esos pasos es tomar algo de kaggle.com y buscar algun dataset que te interese y empezar a correlacionar la data y trabajarlo con algoritmos geneticos, machine learning, deep learning etc. Además que te prestan procesamiento para usar en cosas brigidas como BIG QUERY o machine learning por si no tienen la máquina para probar.
 

SpheXz

Pro
Se incorporó
10 Enero 2013
Mensajes
648
Buen tema, yo tome un curso en la u de r y data science.

Estamos partiendo con rstudio

Sent from my VTR-L29 using Tapatalk
 

mrdotpy

Miembro Activo
Se incorporó
8 Julio 2020
Mensajes
15
Vengo a revivir el tema y contar mi exp.

Soy del área de las geo ciencias. En la U aprendí python por mi cuenta para trabajar los datos de mi tesis, por diversas cosas, mi tema mutó y no tuve que usar python. Sin embargo, me gustó tanto que empecé a usarlo para trabajos de otros ramos y proyectos personales. Fue tanto así, que terminando la U participé en un proyecto de investigación desarrollando un algoritmo de evaluación del peligro sísmico.
En ese proyecto tuve que aprender SQL y por mi cuenta estudiaba estadística y Machine Learning con python (vi unos cursos del MIT online y un par de libros: Introduction to Statistical Learning y Deep Learning with Python de Francoise Choilet, el creador de keras de tensorflow)

Salí de la U y cómo soy del sur y quería seguir por acá, busqué pega como data scientist (sin experiencia, con la pura perso). Encontré pega altiro en el área salmonicultora como Data Scientist. Al principio tenía dudas, que podía quedar cojo por no tener experiencia, pero al final me ha ido impeque (humildemente). He aprendido mucho más dentro de la pega que afuera, web scrapping, data mining, más sql, data visualization. Todo con python principalmente. Igual trato de usar mi background de geociencias para la pega, sobre todo para trabajos con datos georreferenciados.

Mi consejo es hacer proyectos interesantes, eso te da mucha experiencia, te permite ensuciarte las manos, pasas por todos las etapas y problemas del manejo de datos. Los libros y la teoría son importantes, pero la práctica te permite asentar ese conocimiento. No hay que desanimarse, porque igual es harto lo que hay que aprender. Llevo cómo 4 años dedicado solo al data science y siento que me queda un mundo por explorar.

Al principio pensaba que tener un background distinto a las ciencias de la información me iba a jugar en contra, ahora lo veo como una fortaleza y una carta de bajo la manga.

Ánimo!
 
Última modificación:

Oveja Negra

Lagartija de Exportación
Se incorporó
23 Abril 2006
Mensajes
11.333
Vengo a revivir el tema y contar mi exp.

Buen post.

Oye y así en términos generales, ¿cuánto gana un DS? Lo pregunto porque cuando estaba todo el show del "análisis" que el gobierno quiso mostrar sobre la intervención extranjera a propósito del 18O, en Última Mirada, el Paulsen entrevistó a un tipo que tiene una empresa de esto y que se supone es capo y decía que en Chile encontrar a un DS era como encontrar un diamante, que eran muy escasos y por ende, se les pagaba muy bien.
 

mrdotpy

Miembro Activo
Se incorporó
8 Julio 2020
Mensajes
15
Igual ahora no creo que sean tan escasos, hay harto interés y harta gente se está metiendo a esta área (oferta/demanda). En cuanto al sueldo depende harto del lugar, en Santiago pagan mucho más que en regiones. Acá comencé con 1MM, pero no tenía nada nada de experiencia laboral, mientras que en STGO he visto ofertas sobre 2MM por la misma pega que hago acá.

La he pensado, pero me gusta la calidad de vida que tengo acá.
 

frank_shelby

Miembro Activo
Se incorporó
16 Agosto 2019
Mensajes
14
Vengo a revivir el tema y contar mi exp.
Ánimo!

Que bacán tu experiencia, me llamó la atención lo de los datos georeferenciados, justo en mi pega necesito resolver un gran tema con esto y lo que comentas entonces afirma mi opción de empezar a estudiar esta materia. Recomiendo si es que pueden hacerse de una cuenta en platzi , hace como un mes tiraron una ruta de estudio de data science, donde van desde lo más básico hasta coosas mas complejas, eso sí hay que tener una cierta noción de programación pero nada complejo si se entra desde 0 por ejemplo, me paso que una vez me pasaron un material de coursera referente a python y aplicacion a ciencia de datos pero encontre que era algo demasiado muy básico para la potencialidad que ofrece python por ejemplo. Yo ya tengo la Base de saber SQL y he trabajado ya bastante en el ambito de Business Intelligence ya aprendí R y python dentro de lo que imparte Platzi y es una buena opción para empezar por ahí.
 
Subir