En 2012, HBR denominó a "científico de datos" como el "trabajo más sexy del siglo". Pero, ¿qué implica realmente la ciencia de datos? Y más importante aún, ¿cómo puede adquirir las habilidades necesarias para llamarse a sí mismo un científico de datos?
¿Qué es Data Science?
Érase una vez, los científicos de datos estaban principalmente en el espacio académico. Ahora, con el aumento de la recopilación de datos grandes y la necesidad de análisis, los científicos de datos se han convertido en una gran demanda en una amplia gama de empresas e industrias, pequeñas y grandes.
La ciencia de los datos como profesión incorpora una gama de habilidades dentro de las matemáticas, estadísticas y programación de computadoras. Es una industria dominada por hombres, las estimaciones de las mujeres en ciencia de datos rondan el 10%.
Según Glassdoor, el salario nacional promedio para los científicos de datos es de $ 113,436. Considerando solo la compensación, la ciencia de datos es mucho más atractiva que otras carreras similares.
Habilidades necesarias para ser un científico de datos
Al igual que todos los trabajos, las habilidades específicas requeridas para llenar los puestos de ciencia de datos dependen de la compañía individual.
Pero hay ciertos conjuntos de habilidades / herramientas de software que se mantienen consistentes.
- Lenguajes de programación estadística, como R y SAS
- Lenguaje de consulta de base de datos como SQL
- Estadísticas básicas como pruebas estadísticas, distribuciones, estimadores de máxima verosimilitud, etc.
- Métodos de aprendizaje automático como k-Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.
- Cálculo multivariable y álgebra lineal
- Registro de datos y desarrollo de nuevos productos basados en datos
- Familiaridad con la plataforma Hadoop
- Herramientas de visualización como Flare, HighCharts o AmCharts
Cómo convertirse en un científico de datos
Hoy en día, hay tres opciones viables para convertirse en un científico de datos:
- Autoaprendizaje a través de programas como Udacity
- Asistir a un campo de entrenamiento de ciencia de datos
- Ir a la escuela de postgrado para obtener un título de maestría
Por supuesto, existen ventajas y desventajas para cada método.
Autoestudio
Pros:
- Conveniente: se puede hacer en su propio tiempo en cualquier entorno y a cualquier ritmo
- Asequible: podría costar entre $ 0-600.
- Ahorra tiempo: los cursos en línea se pueden completar dentro de 8-18 meses.
Contras:
- Solo recibir un certificado una vez completado
- Sin participación de igual a igual o de maestro a alumno
- Sin ayuda con la búsqueda de empleo
Boot Camp de Ciencias de Datos
Pros:
- Poco tiempo de compromiso: se puede completar en 6 semanas a 3 meses
- Relativamente asequible, al menos en comparación con obtener un título de maestría (los campos de entrenamiento van desde gratis - $ 16,000)
- Ideal para aquellos que buscan cambiar de carrera rápidamente
- Muchos campamentos de entrenamiento ofrecen asistencia en el proceso de búsqueda de empleo después de la finalización
Contras:
- Solo obtenga una cartera de proyectos, sin experiencia laboral "real"
- Mucho que aprender en poco tiempo
- Podría ser hasta 40 horas a la semana de trabajo (a diferencia del autoaprendizaje, donde puede ir a su propio ritmo y seguir trabajando a tiempo parcial / tiempo completo)
Maestría
Pros:
- Diploma al finalizar
- Aprendizaje estructurado con instructores entrenados profesionalmente
- Experiencia en el mundo real: muchos programas incluyen pasantías que se sumarán a la experiencia y el conocimiento
- Amplio tiempo para aprender y absorber toda la información
Contras:
- Caro: podría costar entre $ 20,000- $ 70,000 - sin incluir los gastos de mantenimiento
- Tiempo: también puede tomar más tiempo (9-20 meses)