Trabajar en Data Science: todo lo que tienes que saber
Hablamos con los líderes de Data Science de Ualá y Kavak.
Sabemos que es el momento para aprender sobre datos, por eso lanzamos nuestra Carrera de Data Science, un programa muy completo que te prepara para trabajar en el mundo de los datos en solo cinco meses y sin costo inicial. Para entender mejor en qué roles puedes desempeñarte una vez que decides despegar tu carrera en tecnología, y cuáles son las tendencias de la industria de la Data, invitamos a Pablo Guzzi, CDO de Ualá y a Anders Christiansen, VP de Data Science en Kavak a conversar junto con Agustina Razetti, Data Scientist y Consultora en Henry.
¡Sigue leyendo!??????
¿Qué es un Data Scientist? ¿En qué roles se puede desempeñar?
“Hay muchísimas definiciones dando vueltas. La sencilla y la escapista es decir cualquier persona que hace Data Science. El tema es que tenemos que definir inherentemente qué es Data Science y ahí entramos en un problema importante. Más que decir qué es Data Science y ponernos a filosofar, podemos decir cómo se está aplicando hoy en las empresas y en esa línea creo que hay hoy dos tipos de aplicación o tipos de perfiles de Data Scientist distintos”, cuenta Pablo Guzzi, CDO de Ualá, y explica: “uno de esos perfiles está más orientado al Full Stack, especialmente en empresas medianas y pequeñas en las que tienen que hacer absolutamente todo, por eso la propuesta de valor de Henry es un poco más abarcativa. En otra escala, se puede llegar a ser un data scientist con un foco más puntual, ya sea centrado en el modelado, en la parte de ML Engineering, la puesta de producción del modelo o distintos perfiles.”
Para cerrar, el CDO de Ualá agrega: “Me parece que en vez de hablar de cuál es la definición, lo oportuno acá es que hay una aplicación muy vasta de lo que se puede hacer. Lo bueno de Data Science es que te abre muchísimas puertas. Después es uno quien tiene que elegir dónde quiere entrar y explorar porque es infinito”
Para Agustina Razetti, “es una pregunta muy difícil de responder justamente porque es una disciplina que es nueva. Es nueva y antigua a la vez porque los científicos siempre trabajaron con datos, quiero decir, un biólogo trabaja con datos, lo que hace es medir y trabajar esos datos. La cantidad de datos y aplicaciones que tienen esos datos es lo que abre la puerta a que ya no son solo los biólogos los que estudian datos sino todas las empresas”.
Desde la óptica de Kavak, Anders Christiansen reflexiona: “Creo que para mí hay dos categorías grandes que son, los que trabajan más con decisiones de alto nivel, con decisiones estratégicas, que normalmente trabajan más con reportes, dashboards, A/B Testing; y otro tipo de data scientist enfocado en Machine Learning, en decisiones muy granulares que se hacen miles de veces al día y que son parte del producto. Creo que tienen mucho en común, porque para los dos lo más importante es el entendimiento del negocio, cómo armar un dataset, todos trabajamos con Python… tienen mucho en común pero esas son las principales categorías”.
?Artículo recomendado: Por qué deberías aprender Python en 2022
Para Agustina Razetti, “podemos encontrar partes apasionantes en todo el ciclo de vida del dato. Obviamente, si uno trabaja modelado, le va a encantar eso; o también toda la parte de Engineering de extraer el dato, trabajarlo un poco y ponerlo a disposición, porque ningún Machine Learning Engineering podría hacer algo si no tuviera ese dato a disposición en ese momento, o un Data Analytics que lo trabaje después.”
¿Cuáles son los principales roles en Data Science que encontramos en empresas como Ualá o Kavak?
“Todas las empresas están en una época formativa respecto a cómo estructuran los equipos de Data y demás, pero particularmente en Ualá tenemos cuatro equipos a grandes rasgos: uno más dedicado a lo que es Engineering donde velamos por el desarrollo evolutivo de la herramienta de datos. Tenemos también un área dedicada a Governance, que básicamente se dedica a hacer catálogo de datos, linaje y todo lo que sea relativo a este sector; un equipo de BI que también está un poco más dedicado a lo que es visualización de datos y resolver algunas preguntas basadas en datos que no entran necesariamente en un reporte; y el equipo de Machine Learning que está más dedicado a lo que es modelos”, cuenta Pablo Guzzi, y aclara: “sí es una realidad que en este último equipo encontramos perfiles de todo tipo. Primero, a nivel disciplina, hay politólogos, economistas, estadísticos, de todo, es muy versátil el tipo de perfil que podemos encontrar ahí. Y por otro lado, también tenemos gente que no necesariamente tiene estudios universitarios pero que fue haciendo sus armas, o incluso vienen de disciplinas completamente lejanas a lo que uno pensaría para un equipo de Data Science y es algo que honestamente festejamos bastante.
“¿Y hay rotación?”, le preguntamos. Así nos cuenta cómo se puede hacer carrera en Ualá: “La realidad es que hay una rotación interna, o por lo menos lo nosotros promovemos porque hay un interés muy particular de todos los colaboradores que tenemos en el equipo de pasar a una u otra área dependiendo el interés que vaya teniendo, y la necesidad de desarrollar eso. No sería para nada extraño ver cómo alguien arranca como data scientist y termina dedicándose más a la parte de MLOps o arranca como data engineering y termina yendo a algo como ML Enginieering, o incluso BI pasa a otro tipo de puestos. Fomentamos mucho la rotación interna."
Con respecto a las habilidades que miran al captar nuevo talento, el CDO de Ualá remarca: “creemos que los perfiles de Data Science tienen que tener una curiosidad muy inherente en su ser, es parte condicionante de poder dedicarse a esto porque es algo que está en continuo cambio, y en general los mejores perfiles son los que más van allanando su camino y esos nuevos desafíos que se van dando cuando terminás algo. El ejemplo más claro es que cuando uno habla de esa magia o esa parte divertida por ahí hace algo de computer vision y genera algo re lindo, re 'fancy', que tiene mucho impacto, pero después, cuando querés llevarlo a producción y te sentís frustrado por no tener las skills, te dan muchísimas ganas de meterte a hacer la parte de ML Engineering o MLOps, y está bien que así sea.”
En este sentido, y como parte del equipo que diseñó la Carrera de Data Science en Henry, Agustina Razetti enfatiza: “lo que contás apoya mucho el estilo que quisimos darle a la carrera en Henry, justamente ser generalistas. Nosotros lo hemos pensado en la concepción, y la realidad, es que en la industria lo que se valora es tener las herramientas de Full Stack, que no quiere decir que uno después no se desempeñe más puntualmente en una tarea u en otra, pero entender qué es lo que pasa detrás de cada etapa es super importante para poder migrar y también, simplemente, para poder trabajar bien. Yo como Data Scientist muchas veces programo yo misma mis modelos.”
Para Anders Christiansen a veces es común caer en ciertos estereotipos respecto a lo que es ser un data scientist, “a veces pensamos solo en la aparte de modelado de Machine Learning que muchas veces creemos que es lo más cool”, y cuenta: “en Kavak tenemos perfiles muy generalistas que pueden entender qué es lo que buscamos conseguir en el negocio, entender los datos y qué representan, y cómo podemos generar una predicción que nos ayuda a alcanzar nuestros objetivos. También poder escribir el código que genere un modelo de Machine Learning, lanzar a producción, monitorearlo… creo que hay muchas sinergias en todo el flujo ¿Quién es la mejor persona para saber qué cosas hay que monitorear en un modelo de machine learning proactivo? Bueno, la persona que creó el modelo sabe mejor que nadie qué hacer. ¿Quién es la mejor persona para hacer Data Engineering? La persona que está creando las variables… hay muchas sinergias.
Al final del día tenemos equipos de Data Engineering, equipos de Analytics, pero con los modelos de Machine Learning muchas veces necesitamos acceder a la data cruda, crear nuestros propios flujos de datos. Si tú puedes hacer todo el flujo de datos de inicio a fin, es super útil y te ayuda también en la parte de modelaje. Si tú entiendes todo el flujo vas a crear modelos de machine learning mucho más poderosos”.
Sobre esta sinergia, apunta Razetti: “Todo está conectado. En una empresa real, si uno está solamente enfocado en su partecita de Machine Learning pero no entiende qué datos podemos tener no va a comprender qué sentido va a tener lo que vamos a mostrar. El conocimiento global de cómo es la ingeniería, de cómo se obtiene ese dato, cómo se pone en producción ese modelo, realizar el modelo, pero también cómo se va a usar, cuál es el impacto, cuál es el KPI que queremos modificar… todo eso finalmente es algo que hay que tener en cuenta en cada parte del proceso.”
¿Cómo ven en los próximos años la evolución de la Data Science?
Sobre el futuro de la disciplina y la industria, el VP de Data Science de Kavak confía en que “cada día los modelos son más automatizados y fáciles de implementar. Creo que cada vez vamos a tener soluciones más amigables. En Kavak tenemos una arquitectura serverless, y no tienes que preocuparte por los servidores o las redes, puedes enfocarte solo en el código. Principalmente son estas herramientas que permite iterar más rápido, hacer más experimentos, y esto es lo que va a hacer el Data Science mucho más poderoso”.
Para Pablo Guzzi, “a nivel negocio creo que hoy hacer Data Science es un diferencial, creo que el día de mañana va a ser un commoditie, y empezar a tener el diferencial va a tener que ver más con el cómo lo aplicás que con el solo mero hecho de hacerlo. Sí creo que hay muchas tecnologías nuevas que se están viniendo y creo que en algún momento se va a achicar el funnel y va a haber menos tecnologías, más centralizadas en los grandes monstruos. Hoy, armar un modelo de computer vision en Python para hacer face recognition es hermoso, es una linda experiencia, pero no sé si se justifica en contraste con utilizar un servicio de alguien como Google. Entonces, en esa línea, creo que los que se destaquen van a ser aquellos que sepan trazar bien su estrategia entre desarrollar algo propio y utilizar algo que ya viene hecho (y que no le quita validez). Después en términos de tendencias tecnológicas creo que falta explotar muchísimo todo lo que es grafos, y después, en términos de redes neuronales, que son las grandes vedettes del momento…”
Desde Henry, Agustina Razetti se anima a afirmar que “hay dos caras del futuro de la Data Science. Por un lado, la democratización porque claramente hay más herramientas, no necesitamos que el data scientist sea un matemático de base que desarrolle un algoritmo desde cero, porque el algoritmo ya está, entonces se puede simplemente, entendiendo algunos parámetros, utilizarlo, lo cual está muy bueno. Creo que como desafío del lado de la educación lo que necesitamos es generar profesionales que entiendan y sepan cuándo y cómo utilizar esas herramientas. El profesional que se destaque, y eventualmente las genere, es algo espectacular, pero también es importante entender que a veces un modelo estadístico tradicional es suficiente, es robusto, es fácil,rápido y resuelve muy bien. Parte de nuestro desafío para el futuro es entender bien qué usar, no caer siempre en, por ejemplo, redes neuronales porque es fancy… A veces hay soluciones bastante triviales que funcionan muy bien en la industria.”
¿Qué consejo le darían a una persona que está buscando iniciarse en el mundo de la Data Science?
Desde la óptica de Pablo Guzzi, lo más importante al momento de empezar una carrera profesional en el mundo de los datos, ya sea estudiando o trabajando, es “no dejarse llevar por las cosas ‘fancy’. Hay cosas extremadamente complejas que están buenísimas pero no hacen necesariamente lo que tienen que hacer para agregar valor. Creo que es el consejo más importante de todos. Y después, tienen que ser muy curiosos, esta es una ciencia que está en pleno desarrollo, que va a seguir creciendo, que va a haber cada vez más puertas por abrir y nunca terminás de aprender todo, y tampoco tiene que ser así.”
Y aclara: “me parece que desde ese punto de vista, los más curiosos y los que más tengan capacidad de aprender o incluso puedan formar esa capacidad aprendiendo a aprender, son las personas que van a terminar destacándose porque estamos en un momento el cual Data Science está creciendo muchísimo y todavía queda más por crecer.”
Anders también coincide en esta visión al decir que “Machine Learning es un campo muy abierto para aprender, hay muchos recursos, y esta capacidad de aprender y ser curioso es importante. Este es un campo perfecto para aprender cuáles son las mejores herramientas a utilizar”, y enfatiza: “creo que cualquier persona con curiosidad, con interés, con ganas, puede aprender y tener un impacto enorme.”
¿Hay límite de edad para conseguir trabajo en Data Science?
Desde Ualá, el no a esta pregunta es rotundo. Como explica Pablo Guzzi, “tenemos personas de todas las edades y no es un problema”. En este sentido, Anders explica: “los data scientist vienen de todos los campos, de todas las edades.” Y agrega, con respecto al background que puede tener un futuro profesional del mundo de la Data que “hoy en día es muy fácil de aprender todas las herramientas para tener un impacto y lo más importante es cómo las usas. Si además tienes experiencia en entender el negocio o en otro cargo esto también agrega mucho valor a tu trabajo como data scientist”. En la misma línea, Razetti recuerda que “la edad no es un problema, pero de todas maneras hay que tener muchas ganas, mucha motivación y hay que ser muy curioso.”
¿Por qué es importante estudiar Data Science?
“Es un momento histórico interesante para arrancar a estudiar algo como esto”, reconoce Guzzi y remarca: “si bien no hice la carrera en Henry, por la propuesta que estuve viendo, tienen un programa bastante abarcativo que te abre muchísimas puertas. Después uno tiene que saber en cuál entrar o en cuál explorar por demás. Estamos en un momento único, en el cual, créanme, Data Science va a ser EL diferencial de las empresas exitosas. Poder ser el protagonista en esta era, siendo una de las personas entre tantas que manejan datos, me parece que es una oportunidad única. En esa línea, aplaudo iniciativas como la de Henry porque me parece que acelera muchísimo la democratización y el conocimiento que hay que tener de cara a trabajar con datos y a nosotros nos hace mucha falta”.
Respecto a la escasez de profesionales en el área y la urgencia por cubrir muchísimos puestos en toda la región, Agustina Razetti cuenta: “el recruiting es complicado, nos falta gente, así que por eso yo también estoy muy contenta de participar en Henry porque vamos a tener más profesionales, vamos a poder contratar más y mejor”.
Por último, Anders Christiansen de Kavak coincide en que es un gran momento para estudiar Data Science, “también porque cuando llegas a un equipo, muchas veces hay muchísimas oportunidades que no han explotado, entonces es muy fácil entrar, tener un impacto grande, ver el resultado y medirlo”, y concluye: “si lo que te gusta es resolver problemas y tener un gran impacto es el lugar perfecto y también el momento perfecto”.
¿Quieres saber más? Visita nuestro canal de YouTube y disfruta del evento completo:
Data Science es un campo de muchísimas posibilidades. Al igual que en el mundo del desarrollo web, solo hacen falta ganas, curiosidad y mucha motivación para aprender las tecnologías del futuro.
¿Quieres saber por qué deberías considerar una carrera en Data Science? Te recomendamos este artículo. Si además quieres conocer nuestra Carrera de Data Science, puedes leer más aquí.
??¿Qué estás esperando? Aplica ahora en www.soyhenry.com/carrera-data-science y acelera tu carrera en tecnología ?? To the moon!