📊 El dataset de los ejercicios
Todos los comandos del juego trabajan sobre empleados.csv . Descárgalo y practícalo de verdad en tu Jupyter.
empleados.csv — 43 filas, 8 columnas
Columna Qué es
id identificador
nombre nombre del empleado (algunos traen espacios → str.strip)
departamento IT · Ventas · RH · Finanzas (tiene nulos → moda)
salario sueldo mensual (nulos → mediana; outliers 185000 y 160000)
edad edad en años
antiguedad años en la empresa
codigo código tipo "12A" = 1-2 dígitos + letra A–J (algunos inválidos)
email correo
Además tiene filas duplicadas a propósito (para practicar drop_duplicates).
Muestra (primeras filas)
id,nombre,departamento,salario,edad,antiguedad,codigo,email
1,Rosa Luna,Ventas,20226.0,47,20,1B,rosa@empresa.com
2,Raul Cano,IT,30835.0,45,18,1I,raul@empresa.com
3, Sofia Reyes ,IT,32082.0,27,13,7B,... <- ojo: espacios
4,Pedro Gil,IT,185000.0,57,13,1J,... <- outlier de salario
5,Juan Soto,Ventas,,25,18,10G,... <- salario vacío (NaN)
7,Hugo Rios,Ventas,15998.0,56,3,99Z,... <- codigo inválido
ventas.csv (producto, categoria, precio, cantidad, region, vendedor) y clientes.csv (ciudad, plan, edad, gasto_mensual) son para los ejemplos resueltos.
Cerrar