Qué interesante tener un background humanista y ligarse al DS. ¿Cómo encontraste la dificultad de ese curso? creo que es principalmente manejo de datos con pandas. Eso es sólo una parte, aunque importante.
Dentro de las herramientas y librerias de python, te aconsejo que domines las siguientes.
- Manejarte bien en python (obvio)
- Pandas para manejo de datos
- Numpy para todo lo que es álgebra lineal, transformaciones vectoriales etc.
- Librerías de visualización de datos. Yo uso matplotlib, seaborn y plotly. Hay otras interesantes como bokeh y altair.
- Librerías de Machine Learning clásicas = scikit-learn principalmente. Acá tienes el estado del arte en algoritmos clásicos, desde simples regresiones lineales hasta support vertor machine. Varios algorítmos de clusters (e.g. el clásico k-means), reducción de dimensiones cómo PCAs etc.
- Librerías de deep learning: Acá las dos grandes son tensorflow (de Google, yo uso esta) y pytorch (Facebook). Acá es un mundo gigante igual, donde encuentras desde redes neuronales someras, hasta GAN's. A mi me gusta tensorflow (aunque no he probado pytorch), es relativamente fácil, tiene harta documentación y cursos. Tiene una librería bien interesante detrás, llamada keras.
El creador de keras tiene este libro de deep learning en python y es super completo:
This repository is a collection of famous books that a person who has keen to learn programming, should go through in his career. - letspython3x/Books
github.com
Ahí podrás encontrar todo el proceso del trabajo con deep learning en python de una manera muy sencilla, sin matemática avanzada y con las librerías que te mencioné antes. Además tiene ejemplos con código bien didácticos. El libro cubre un gran espectro de estructuras de deep learning, para trabajar con series de tiempo, imágenes, videos, texto, Natural Language Processing (NPL) que puede que te interese por tu background, generación de contenido nuevo (en vez de clasificación y predicción), etc.
Ahora eso es sólo lo de librerías, igual te aconsejo que le eches un ojo a la teoría que hay detrás de los algoritmos y repasar o aprender un poco de algebra lineal y estadística. No es necesario peinarte, ni comprender al revés y al derecho todo, porque la mate no es tu fuerte. Pero es bueno tener una comprensión general de lo que pasa detrás y no asumir que todo es una caja negra.
Para no desmotivarte, porque es harto que aprender, te sugiero que hagas un proyecto. A partir de una idea, algo simple e idealmente relacionado a tu área. Por ejemplo, quieres hacer un modelo en que clasifica las emociones detrás de los twits y relacionarlo con momentos particulares (protestas, covid, elecciones, etc). Entonces a partir de tu idea tienes que ver cómo lo harías. Tendrías que aprender a sacar info de twitter a partir de su API, a transformar esas palabras en vectores con un sentido (word embedding), aprender de algoritmos de NPL, crear tu modelo, ver los resultados, mejorarlo, publicarlo, etc. Este tipo de proyectos ya existen, así que puedes ver el enfoque de esos proyectos y aplicarlo al tuyo.
Es harto, pero con ganas se puede, la constancia es la clave.