Entrevistas en Diferido
744 subscribers
12 photos
686 links
Canal donde se realizan entrevistas en un formato diferente.
https://linktr.ee/JoseAJimenez
Todo el contenido de este mensaje, esta bajo licencia CC BY-NC-SA 3.0
Icon made by Becris from www.flaticon.com
Download Telegram
#EntrevistaBeaHernandez

@verdicion

Empezamos nueva entrevista para esta semana, la entrevistada es Beatriz Hernández científica de datos y mucho mas.

Pero antes....

¿Cómo te encuentras?

Y después...
¿Te podrías presentar en una líneas?
Buenos días a todos! Muchas gracias Jose por contar conmigo para este formato tan curioso, seguro que es una semana muy interesante.

La verdad es que ha sido un fin de semana un poco triste, con todo lo que ha pasado en Valencia, España, creo que todos nos vemos afectados por noticias tan trágicas y más cuando las tenemos cerca.

Por lo demás bien, dirigiéndome al trabajo, ahora mismo llevo el equipo global de medición de Making Science, una agencia de publicidad que tiene presencia en varios países. Llevo muy pocos meses en esta empresa, anteriormente trabajaba en una consultora de tecnología y anterior a eso he trabajado en varias industrias: inmobiliaria, periodismo, salud. Siempre desde el departamento de data science.

A parte de trabajo, hace unos años fundé con unas amigas rladies madrid, una comunidad de código y estuvimos activas durante unos 4 años. He dado varias charlas por varias conferencias aunque últimamente por motivos personales no tengo mucho tiempo, espero volver en un tiempo!
@verdicion

Para empezar, unas cuantas  preguntas cortas para conocerte mejor a ti  y a tu entorno tecnológico.

¿Qué ordenador utilizas habitualmente?
¿Sistema operativo?
¿Qué lenguaje de programación usas y cual te gustaría aprender?
¿Herramienta imprescindible en tus equipos?

¿R o Python?
Ya llevo unos años usando productos de apple tanto para el trabajo como personal y la verdad es que me he hecho comodona…. En el trabajo lo más normal es que tuviese un Linux pero mi MacBook Pro no lo cambio…

En general utilizo Python y r, lo normal para data science. Me gusta mucho pycharm si trabajo con Python, ya tengo algunas automatizaciones hechas que me dan mucha rapidez, sobre todo el debugeo de pycharm me parece ultra cómodo. La integración con copilot también la agradezco, sobre todo para hacer documentación. Supongo que esos son mis imprescindibles de programación!

Y la última pregunta me niego a contestarla !! Jajajaja aunque si voy a desarrollar soluciones en cloud Python me ahorra muchos dolores de cabeza….
@verdicion

Pregunta fija en las entrevista que cambia en función del perfil del entrevistado. En tu caso me centro en tu trabajo de científica de datos...

¿Qué añadirías?
¿Qué modificarías?
¿Qué eliminarías?
¿Qué dejarías igual?
@verdicion

La verdad de tu campo no se mucho, he leído algo y he hecho alguna entrevista en este canal a gente del mismo perfil. Pero hay algo que me gustaría que me explicaras y es sobre la calidad y veracidad de los datos, me explico...

¿Cómo sabes si un conjunto de datos es real o no?

Con la cantidad de datos que debes recoger o procesas, me imagino que todos los datos no tienen el mismo valor.

¿Qué escala, parámetro, baremo u otro factor existe para saber que un dato es mejor que otro?
Entrevistas en Diferido
@verdicion Pregunta fija en las entrevista que cambia en función del perfil del entrevistado. En tu caso me centro en tu trabajo de científica de datos... ¿Qué añadirías? ¿Qué modificarías? ¿Qué eliminarías? ¿Qué dejarías igual?
la verdad es que en los últimos años ha cambiado muchísimo, te diría que pediría un poco más de conocimiento de software a la hora de crear soluciones pero por fortuna eso también está cambiando para bien!!!

Los proveedores cloud son bastante insistentes en usar python... me gustaría ver más cambios en este aspecto. Si más gente pudiese usar con facilidad entornos colaborativos creo que el trabajo en equipo sería mucho más sencillo.
La llegada de la IAGenerativa al código también ha supuesto un cambio pero sin duda no cambiaría programar por usar IAGen ;) Aunque la ayuda a la hora de descifrar código ajeno y crear documentación es para mí, el mejor uso.
Casi se me olvida!! Más testing en datos!! Por supuesto! Creo que es un tema que está por explorar y que nos evitaría muchos errores de herramientas en producción
Entrevistas en Diferido
@verdicion La verdad de tu campo no se mucho, he leído algo y he hecho alguna entrevista en este canal a gente del mismo perfil. Pero hay algo que me gustaría que me explicaras y es sobre la calidad y veracidad de los datos, me explico... ¿Cómo sabes si…
La verdad es que esto es todo un tema...

Siempre intento que las fuentes sean oficiales, de todos los datos. Para los datos externos eso es esencial. Si tenemos varias fuentes lo esencial es el contraste entre ellas, no es normal que si dos indicadores apuntan a lo mismo uno suba y otro baje. Ese es el tipo de cosas que hay que tener en cuenta. La temporalidad (que estén actualizados), consistencia, representatividad de la población, son algunas de los conceptos a mirar para ver si un dato es útil.
En general solemos usar mucho lo que llamamos la fuente de la verdad (source of truth) donde definimos nuestras variables, de donde vienen, por qué son así y el comportamiento esperado y de ahí trabajamos. Esto es importante sobre todo porque te sirve para crear comparativas y ver como evolucionan tus datos, kpis, modelos....
Creo que no hay una respuesta única a la pregunta ya que depende mucho del contexto en el que nos encontremos
@verdicion

El otro día vi un diagrama con los conocimientos que necesitaba un científico de datos, eran los siguientes:

▪️Programación.
▪️Fundamentos en matemáticas.
▪️Análisis de datos.
▪️Machine Learning.
▪️Web Scrapping.
▪️Visualización de datos.

¿Te parece bien, algo en falta o sobra?

Con esto conocimiento tengo una duda.
¿Es necesario ser ingeniero de informática para ser científico de datos?
@verdicion

Ahora esta de moda IA, en muchos ámbitos se está usando en mayor o menor proporción.

¿Cómo se usa la IA una científica de datos?
¿Qué hará una científica de datos dentro de 10 años?
Entrevistas en Diferido
@verdicion El otro día vi un diagrama con los conocimientos que necesitaba un científico de datos, eran los siguientes: ▪️Programación. ▪️Fundamentos en matemáticas. ▪️Análisis de datos. ▪️Machine Learning. ▪️Web Scrapping. ▪️Visualización de datos. ¿Te…
La verdad es que me resulta curioso que haya un webscraping allí en medio! Si tienes mucho requerimiento de datos externos es posible que sea necesario. Yo lo sustituiría por un: experiencia con APIs. Creo que últimamente se divide la cosa en españa en data scientist más analista de datos que está más cerca del negocio y lo que se ve mucho de machine learning engineer donde también es una persona con conocimientos en modelos pero más cerca de la tecnología. Creo que data science sigue siendo un poco cajón desastre de una persona que modela y que sabe programar. No creo que sea imprescindible ser ingeniero informático para trabajar en data science, creo que te dará ventajas en algunos aspectos y tendrás que aprender de otros aunque ahora todo este mix de habilidades se cubre bastante bien en las enseñanzas superiores. De la misma manera que tengo compañeros de económicas que están muy cerca del negocio, compañeros lingüistas que modelan con iagen. Todos hemos tenido algunas partes débiles que trabajar! Yo estudié matemáticas y sigo aprendiendo diseño de software, testing, y muchas cosas más!
Entrevistas en Diferido
@verdicion Ahora esta de moda IA, en muchos ámbitos se está usando en mayor o menor proporción. ¿Cómo se usa la IA una científica de datos? ¿Qué hará una científica de datos dentro de 10 años?
Me gustaría pensar que seguimos trabajando en el sector! Jajajaja en este momento la ia generativa no me da la respuesta a problemas de medición en publicidad pero lo cierto es que he hecho otros proyectos donde lo he incluido en etls para procesamiento del dato y ha resuelto una pieza del proceso. También lo uso para programar, crear datos de testeo, crear etiquetas,… trabajo que me resuelve a la perfección en este momento. Ojalá en 10 años este tipo de tareas sean un poco más complejas y yo me pueda dedicar a problemas más profundos, creativos, o a desarrollar conocimiento.
@verdicion

Por tu trabajo sabras como recopilar datos, lo habrás analizado, creado informes y gráficas, junto con otras serie de acciones. Dicho de otro modo, sabes mucho de los datos.

Por eso me gustaría preguntarte.

¿Existe la privacidad de datos?
@verdicion

Eres una de las fundadoras de Rladies, hay varias asociaciones enfocadas a desarrolladoras, por ejemplo Django Girls. Aunque me imagino los objetivos de este tipo de asociaciones pero aprovechando que entrevisto a una fundadora, que mejor que preguntarle.

¿Por qué este tipo de asociaciones de desarrolladoras?
¿Qué diferencia hay con asociación de desarrolladores en general?
Entrevistas en Diferido
@verdicion Por tu trabajo sabras como recopilar datos, lo habrás analizado, creado informes y gráficas, junto con otras serie de acciones. Dicho de otro modo, sabes mucho de los datos. Por eso me gustaría preguntarte. ¿Existe la privacidad de datos?
Si! Por supuesto siempre se pueden hacer las cosas bien o mal pero por supuesto que hay muchísimas empresas que lo hacen bien. En Europa por fortuna existen leyes al respecto y muchas auditorías, sobre todo en datos sensibles como médicos.

Supongo que otra cuestión importante es: que datos estamos cediendo sin saberlo? Como pasó con el escáner de retina por unos cuantos bitcoin.

Y otra importante es que empresas se saltan la privacidad del usuario? Sé que alguna empresa que no quiero nombrar 😋 tuvo problemitas por recoger geolocalización incluso después de que el usuario se lo negase pero creo que esas son las que menos.

La conclusión es que si que existe pero tenemos que informarnos antes. Después de varios años haciendo consultoría os puedo asegurar que hay empresas que lo quieren hacer bien!
Entrevistas en Diferido
@verdicion Eres una de las fundadoras de Rladies, hay varias asociaciones enfocadas a desarrolladoras, por ejemplo Django Girls. Aunque me imagino los objetivos de este tipo de asociaciones pero aprovechando que entrevisto a una fundadora, que mejor que…
Pues creo que es importante que en un sector competitivo y masculinizado haya un espacio donde no lo sea. Cierto es que rladies nació como una iniciativa para mujeres pero luego nos dimos cuenta de que lo importante es que simplemente no fuese un espacio mayoritariamente masculino. Esto permite dar voz a personas que normalmente no lo tendrían, por pereza, por vergüenza, por lo que sea. Es sobre todo un espacio donde hay seguridad y asi crece la seguridad de los asistentes. Bien cierto es que si estos sesgos empiezan desde bien pequeños y nos condicionan los gustos y las oportunidades, cuando hablamos de un sector competitivo como puede ser la tecnología es necesario para algunas personas (que curioso que demos casi siempre con los mismos perfiles) el sentirse en comunidad.
@verdicion

El Viernes es el último día con este formato de preguntas, el fin de semana cambia un poco, finalizamos  con dos preguntas algo diferentes.

La primera.

Si vivieras en la Edad Media.

¿A qué se dedicaría Beatriz Hernández?
Me encanta la pregunta!! Sin duda a diseñar y construir muebles! Me encanta hacerlo ahora así que me parece ideal que fuese a tiempo completo 😋
@verdicion

La segunda pregunta...

¿Qué pasaría si...?
Completa la pregunta para el próximo entrevistado.

El anterior entrevistado completo la pregunta y te toca responderla.

¿Qué pasaría si todos tuviéramos un asistente de IA que llevase cuenta de las tareas que tenemos que hacer y pudiéramos preguntarle como vamos y cuál es nuestra siguiente acción?
Es buena pregunta! Por una parte creo que sería bastante útil, es lo mismo que hacemos nosotros con nuestras listas, no? Y si añades la parte de responder ante alguien o algo lo mismo hariamos las cosas sin procrastinar 😂 pero por otra parte, la vida no es solo hacer tareas y necesitamos tiempo para descomprimir y no seguir una lista de tareas. Me gustaría pensar que es un mundo ideal que esa lista sería totalmente personal y no se usaría la información para otras cosas pero creo que todos sabemos que eso es el mundo ideal. Aunque en realidad todo esto de un asistente gestionando nuestras tareas se me parece más a un capítulo de black mirror, seguramente sería un sistema de puntos donde al final nos perderíamos en el sistema simplemente haciendo tareas asignadas 😂

Lo cierto es que seguramente no quede mucho si no existe ya para tener un servicio así así que lo veremos pronto 😊