Ciencia de datos, ¿qué es y para qué sirve?
Un científico de datos es una persona que conjunta distintas habilidades. Es muy bueno entendiendo de tecnología y aprovecha sus recursos de cómputo como procesamiento, almacenamiento, velocidad de red, sabe de técnicas para almacenar y exportar datos de bases de datos, API’s o incluso en archivos dentro de su organización; así como construye modelos estadísticos y matemáticos para sacar relevancia de los datos que tiene la organización.
Por Antonio Galindo
Un científico de datos debe ser bueno comunicando, y una de sus responsabilidades es decirle a la organización si cuenta con madurez en cuanto al uso de sus datos; además, debe tener la suficiente ética para transmitirle que sus datos son insuficientes o si su calidad de información son o no aptas para responder preguntas relevantes de negocio.
Las ciencias de datos implican muchos conocimientos; por un lado, las ciencias de la computación (incluida la programación, la cual usa para analizar estos datos y darles sentido); las matemáticas y estadística, para generar modelos que representen un fenómeno que se requiere estudiar, o bien para hacer ajustes y validaciones de los modelos.
Para ser un científico de datos no es necesario que seas ingeniero en sistemas, sólo se necesita un gran entendimiento de cómo funciona la vida real y bajarlo a modelos matemáticos, y justo al bajar este tipo de sistemas es cuando la tecnología resulta necesaria. Existen bioquímicos que estudian secuencias de ADN en modelos computacionales para ver la influencia de una proteína en el desarrollo de una enfermedad, ingenieros civiles que con estos estudios generan modelos que predicen los daños estructurales que pudieran presentar las construcciones y cómo crear edificios que sean más resistentes a los eventos que se enfrentan.
La pandemia aceleró la adopción de la tecnología en todas las industrias, al generar una sistematización en la operación se generan muchos datos y si queremos mejorar la permanencia de nuestros negocios, tenemos que ver cómo aprendemos a partir de aquellos que tenemos; y si esa información no es suficiente, debemos buscar otras fuentes sobre cómo se mueve el mercado (como estudios de organizaciones privadas o públicas).
Las industrias son muy variadas, pueden ser financieras como las Fintech, la farmacobiologa o instituciones de investigación; estas -entre otras- son las que están usando la ciencia de datos.
La aplicación de las ciencias de datos es como un músculo, mientras más lo hagas más lo refuerzas; cada problema exige modelos y herramientas distintas, esa experiencia es la que te permitirá trabajar en una industria u otra y aplicar estas ciencias.
En México casi no se usan estas herramientas, aún tenemos miedo a la tecnología y deberíamos quitarnos la idea de que sólo las empresas grandes pueden usar estas herramientas, ya que este conocimiento podría aplicarse para cualquier negocio.
Otra de las limitantes es que se cree que es costoso. Una inversión fuerte vale la pena cuando se tiene claridad en lo que se quiere resolver y ya se cuenta con una dinámica bien organizada en la empresa para el uso de datos, pero si solo quieren explorar hay muchas opciones open source que se están utilizando y no requieren tanto poder de cómputo; incluso corren en capas en la nube de forma gratuita.
Incluir en tu organización las ciencias de datos es una inversión, puesto nos brinda la oportunidad de entender el contexto en que nos desempeñamos y valorar qué podemos aportar a un mercado que cada vez está más competido.
Los resultados pueden suceder a corto plazo en tu organización, teniendo la información suficiente; mientras más complejo se requiere más información, el reto es romper el miedo y en cuanto lo haces puedes resolver cada problema que tengas en tu negocio, aplicando los modelos y algoritmos correspondientes a cada problema. Una ventaja es que se pueden plantear modelos base y poco a poco irlos mejorando (ya sea en su nivel de exactitud, especificidad, sensibilidad y/o velocidad)
Para aprender estas ciencias, se recomienda tener a un experto que sepa del tema y te pueda guiar y acompañar en el proceso. Ocurre también en las organizaciones, a veces sólo cuentan con talento junior, pero con un experto que las guíe todos pueden crecer. Que una persona experimentada te instruya es la mejor opción para aprender.
De igual manera, estas ciencias tienen que estar apoyadas en la ética y la información real, no se pueden crear soluciones basadas en datos robados o falsos, porque la solución creada no le ayudará a nadie.
Si las empresas no adoptan este tipo de perfiles, en el mediano plazo correrán riesgos, ya que perderán visibilidad de su organización y lo que sucede afuera.
Acerca del autor
Antonio Galindo estudió Ing. en Computación en la UNAM. Perteneció a las primeras generaciones de certificados por Linux Professional Institute, así como de la Linux Foundation. Cuenta con más de 20 años de experiencia en la industria de la tecnología. Actualmente es VP of Engineering en BEDU.