Graduados de Henry desarrollan un proyecto de Data Science que busca predecir el comportamiento del mercado de taxis en Nueva York
Se graduó el primer cohorte de la Carrera de Data Science y hablamos con graduados sobre la construcción de su portfolio a partir de este gran proyecto final.
El mundo necesita data scientists y en Henry estamos trabajando para formar el talento del futuro. Hoy, todas las compañías del mundo trabajan con datos y data scientists para crear productos y servicios alineados con estos nuevos desarrollos tecnológicos convirtiendo este rol en uno de los más buscados por el mercado.
Juliana Aragón, Francisco Lugo Reyes, Paula Villar y Andrés Fuentes son cuatro graduados de la Carrera de Data Science que se animaron a incursionar en un nuevo campo y formarse en las tecnologías que demanda la industria de los Datos para despegar su carrera tech y cambiar su vida.
Con distintas trayectorias profesionales, edades y países de origen, nuestros Henry’s estudiaron de manera intensiva 5 meses para desarrollar su perfil como Especialistas de Datos.
Juliana (Buenos Aires, Argentina) tiene 33 años, es bailarina y estudiante de la carrera de Actuario: “estaba buscando un cambio de rumbo, y sin Henry no lo hubiese logrado”. Además, hoy forma parte del Staff de Henry dando soporte a los estudiantes de nuestra carrera.
“Fue una experiencia realmente enriquecedora, exigente, pero muy satisfactoria. Estaba realmente comprometido a aprenderlo todo, días y noches practicando. El conocer gente de otros países me gustó mucho, todos aprendimos mucho de todos”, cuenta Francisco, de 25 años y oriundo de Querétaro, México. Francisco, que trabajaba como Ingeniero Químico de Materiales en el sector automovilístico, apostó al mundo de los datos para potenciar su carrera en tecnología.
Con 27 años y una carrera en Ingeniería, Paula (Buenos Aires, Argentina), también encontró en Data Science un campo para crecer profesionalmente. Hoy, está dando sus primeros pasos dentro del Staff de Henry y así vivió esta etapa: “Antes de entrar a los proyectos, sentía que enfrentaba a una problemática, no sabía cómo complementar las herramientas vistas durante el bootcamp para elaborar todo un proyecto. Pero, ya llegando a la etapa de proyectos, me di cuenta que éstos están hechos para orientarte de la forma más sutil posible y que por tu propia cuenta vayas hilando todos estos contenidos que vimos durante la primera etapa”.
Desde Acacías, Colombia, Andrés, de 25 años, apostó a cambiar de carrera dejando atrás su rol como economista para salir a buscar un trabajo en la industria de la Data. ¿Lo mejor de esta experiencia? “En Henry mejoré y descubrí un montón de habilidades y herramientas que me ayudan a ser un mejor profesional”.
En la Carrera de Data Science, el programa de estudios culmina con un Proyecto Final de cuatro semanas, muy desafiante, donde además de trabajar en equipo con personas de toda la comunidad de estudiantes, se ponen en juego los conocimientos adquiridos en la etapa del Bootcamp.
¿Quieres saber cómo fue la experiencia de este equipo transitando esta etapa final? Lo escuchamos de la mano de sus protagonistas en esta nota???
¿Cómo surgió la idea del proyecto?
Paula nos cuenta: “En el caso de la Carrera de Data, Henry te plantea opciones de proyectos (para asegurar cierto nivel en los datos escogidos) y tuvimos dos opciones. Uno era estos datos abiertos de los taxis amarillos de Nueva York, lo cual nos pareció interesante de desarrollar, ya que era distinto a los casos que vimos durante nuestra cursada”.
Al respecto, Andrés amplía la idea central del proyecto: “Una empresa busca incursionar en el mercado del transporte público particular en Nueva York y desconocen el movimiento actual de ese mercado, ahí es cuando solicitan nustros servicios para dar una perspectiva real de tal mercado tomando como punto de partida datos públicos de registros de viajes de taxis amarillos en esta ciudad”.
?Artículo recomendado: Trabajar en Data Science: todo lo que tienes que saber
¿Cuál es el objetivo?
“El objetivo es proporcionar un marco sólido acerca de cómo se mueve el negocio en el sector transportista para una empresa que quiere invertir en el sector, ofreciendo servicios como Uber o DiDi”, cuenta Francisco.
“Para lograrlo generamos un proceso de Extracción, Transformación y carga de datos (ETL), y a partir de estos datos limpios generamos reportes y dashboards (KPI) que respondieran las interrogantes de la empresa en torno al mercado”, cuenta Andrés, y agrega: “Además, este escenario nos dio la posibilidad de implementar dos modelos de Machine Learning para generar un estimado de tarifa para un viaje desde cualquier punto de la ciudad y para generar una predicción de demanda futura del mercado de taxis”.
¿Qué problema soluciona?
Sobre este punto, Andrés explica: “Lo que este proyecto viene a generar es una limpieza de datos de acuerdo a los parámetros de buenas prácticas e ingesta incremental para seguir nutriendo el análisis. Da una perspectiva completa del mercado de taxis, con dashboards interactivos, para que el usuario tenga la capacidad de resolver cientos de interrogantes de manera autónoma”. Además, agrega, “los modelos de Machine Learning brindan herramientas que pueden llegar a generar un ventaja relativa frente a los competidores”.
En este sentido, Juliana cuenta: “La necesidad de información de la situación presente fue el motor de este proyecto. Se llevó a cabo un análisis histórico, y además, se realizaron predicciones (de la tarifa y la demanda) para nutrir ese análisis. En vistas a la continuidad del negocio y de que el proyecto sea escalable, lo realizamos en un entorno cloud y se llevaron a cabo modelos de Machine Learning que podrían ser de utilidad para futuros desarrollos en la dinámica del negocio”.
?¿Por qué deberías considerar una carrera en Data Science? Descubre más en este artículo
¿Qué tecnologías utilizaron para desarrollarlo?
“Todo el proceso de ETL se generó con AWS (S3, Glue, Crawlers, Athena y Redshift)”, explica Andrés y detalla: “dentro de Glue y mediante un script de Python, se usaron herramientas como Pandas, Numpy y SciPy. Los reportes y visualizaciones se hacen a través de Microsoft Power BI, Matplotlib y Pyplot, y los modelos se desarrollan con herramientas como Scikit-learn y se visualizan a través de Streamlit”.
?Estudió Data Science en Henry y hoy trabaja para Estados Unidos. Conoce la historia de Jonathan aquí
¿Cuál fue la mayor dificultad a la que se enfrentaron para llevarlo a cabo?
“A mi punto de vista -cuenta Paula- creo que la mayor dificultad estuvo en atrevernos a utilizar herramientas que nunca habíamos aplicado durante la carrera o que incluso nunca las vimos y que nos fueron de mucha ayuda. En cada parte del trabajo teníamos varias posibilidades de herramientas a usar y saber cuál nos convenía más fue todo un desafío".
Esta sensación es compartida por Juliana, que cuenta que “lo más complejo fue la utilización de herramientas desconocidas por nosotros, y en un breve período de tiempo. Pero el resultado fue exitoso”.
Por su parte, Francisco explica que la mayor dificultad que enfrentó fue “la migración de una arquitectura local a una infraestructura en AWS services”, y para Andrés “en primera instancia, encarando el proceso de ETL nos vimos cortos con la capacidad de nuestras máquinas, esto se resuelve con la posterior migración del ETL a un entorno cloud como AWS”.
¿Qué aprendieron de este proceso a nivel técnico?
Tanto para Paula como para Francisco, cabe destacar el aprendizaje de una nueva tecnología como AWS. Puntualmente, “aprendimos el concepto de borrado lógico, para el filtrado de valores y pulimos nuestras habilidades al momento de la creación de bases de datos”.
?¿Por qué deberías aprender Python en 2022? Te sugerimos este artículo
Sobre este tema Juliana explica: “En el ámbito técnico, todos estamos de acuerdo que aprendimos un montón. Este aprendizaje va desde poder tener una idea clara en la cabeza de cómo funciona cada etapa de un proyecto con datos, hasta aprender y manejar a un mayor nivel herramientas que no vimos dentro del bootcamp o herramientas que sólo habíamos aplicado con casos académicos, los cuales eran una situación más idealizada que no es lo que ocurre en la realidad”.
?Te recomendamos este artículo: Mi historia estudiando Data Science y consiguiendo trabajo a remoto
Y en este sentido, Andrés destaca: “encarar un proyecto de estas dimensiones nos deja con una capacidad para afrontar nuevos retos en escenarios como la ingeniería, la analítica y la ciencia de datos”.
¿Y a nivel personal? ¿Qué es lo que más disfrutaron al hacerlo?
“A nivel personal, aprendí a trabajar con gente fuera de mi país, conocí diferentes formas de pensar, aprendí a utilizar metodologías para la organización del trabajo”, cuenta Francisco y agrega: “lo que más disfruté fue la planeación diaria para la asignación de tareas, donde compartimos avances, hacíamos sugerencias y dábamos dirección al proyecto, conviviendo con todo el equipo”.
En este sentido, Juliana comparte la experiencia de trabajar en equipo y comenta: “es algo nuevo para mí, pero descubrí que me siento muy cómoda y que me garantiza un aprendizaje continuo. Los éxitos se disfrutan el doble, y los fracasos se hacen más llevaderos”.
Por su parte, Paula recuerda dos cuestiones puntuales que disfrutó en su experiencia: “lo primero fue la satisfacción de llegar al final de esta etapa, sentirme con un conocimiento mucho más enriquecido y estar satisfecha con nuestro resultado. Y segundo, disfruté mucho la buena dinámica que teníamos como grupo, siento que como personas nos llevamos super bien (y por lo mismo todo salió fluido) y además cada uno tenía algo especial que aportar”.
“Las dinámicas de grupo son una de las cosas más valiosas que te deja un proyecto de estas características”, resume Andrés y reflexiona “ver nuestros resultados y sentir orgullo de lo que logramos es sumamente gratificante”.
¿Cómo saber si la carrera de Data Science es para mí?
Si te gustan los números y te entusiasma insertarte en una de las industrias con más proyección a futuro; si te apasiona la tecnología y los desafíos; si tienes compromiso y disciplina para estudiar todos los días junto a referentes de la industria… ¡Data Science es para ti!
Aplica aquí. Si tienes dudas siempre puedes escribir a admisiones@soyhenry.com para resolver todas tus consultas.
¿Cómo es el proceso de admisión?
Aplicar a la Carrera de Data Science de Henry es muy sencillo:
1. Ya sabes que quieres dar un salto en tu carrera, así que solo debes aplicar aquí
2. Una vez que aplicas y completas el formulario con tus datos, deberás inscribirte al Henry Challenge, un examen técnico donde evaluaremos conceptos básicos de Python y Matemática.
3. No te preocupes, para realizarlo podrás acceder a nuestro Prep Course, un curso gratuito de conceptos básicos de Python y Matemática que te brindará las bases para rendir el Henry Challenge con éxito. Además de ser gratuito, tienes la opción de cursar en vivo siguiendo nuestras clases o de manera on demand, a tu ritmo.
4. Una vez que apruebas, ¡ya estás listo para comenzar! Solo resta realizar un onboarding que consiste en dar de alta tu cuenta e inscribirte en alguno de los próximos cohortes disponibles.
Este contenido fue pensado para inspirar a más personas a desarrollar sus habilidades en tecnología y acceder al mundo de los datos ¿Todavía no conoces Henry? Conoce todo lo que tienes que saber sobre nuestra carrera aquí ?