Carreras por sector · 7 min read

CV de Data Engineer: cómo mostrar pipelines, escala y fiabilidad en una página

CV de Data Engineer: cómo mostrar pipelines, escala y fiabilidad en una página

Los CV de data engineering fallan de dos formas predecibles. O listan cada herramienta del modern data stack sin contexto, o describen resultados vagos del estilo mejora de la calidad de datos que podrían significar cualquier cosa. Las dos cosas matan la tasa de respuesta.

Esta guía muestra la estructura exacta, las bullets y el layout de la sección de habilidades para un CV de data engineer que pasa el ATS y gana la atención del reclutador.

Lo que busca un reclutador de data engineering

En los primeros 25 segundos, un reclutador o hiring manager escanea:

  1. El stack: ingesta, almacenamiento, transformación, orquestación, BI. ¿Las herramientas mencionadas son actuales y relevantes?
  2. La escala: volúmenes por día, latencia, coste ahorrado, uptime
  3. La mentalidad de fiabilidad: SLAs, monitorización, on-call, data contracts
  4. El contexto de equipo: en solitario, equipo pequeño, equipo plataforma grande
  5. El lenguaje de resultados: impacto de negocio, no solo pipelines entregados

Si esas señales no son visibles en la mitad superior de la primera página, no hay segunda pasada.

La estructura que funciona

```

Nombre | Cargo | Email | Teléfono | LinkedIn | GitHub | Ubicación

Resumen (3 líneas)

Habilidades (categorizadas, escaneables en 5 segundos)

Experiencia (más reciente primero, 3 a 5 bullets por puesto con resultados medibles)

Proyectos (1 o 2 solo si estás empezando o reconvirtiéndote)

Formación

Certificaciones y open source (si aplica)

```

Una página si tienes menos de 8 años de experiencia, dos por encima. Nunca tres.

El resumen que aterriza

Tres líneas máximo. Cada línea se gana su sitio.

Débil: Data engineer con experiencia y sólidas habilidades en big data y cloud, en busca de un puesto retador.

Fuerte:

```

Data Engineer con 6 años construyendo pipelines batch y streaming en AWS y GCP. Owner de la plataforma de datos en una fintech de 300 personas, procesando 4.000M de eventos/día con 99,95 % de uptime. Abierto a roles senior IC o tech lead en B2B SaaS.

```

La segunda versión responde a tres preguntas en 30 palabras: qué haces, prueba de escala y qué quieres a continuación.

El formato de la sección de habilidades

Categoriza. Los reclutadores escanean, no leen.

```

Habilidades

Lenguajes: Python (avanzado), SQL (avanzado), Scala (intermedio), Go (básico)

Ingesta: Kafka, Kinesis, Fivetran, Airbyte, CDC propio

Almacenamiento: Snowflake, BigQuery, Redshift, Postgres, Iceberg sobre S3

Transformación: dbt, Spark (Databricks), Flink, Beam

Orquestación: Airflow, Dagster, Prefect

Infra: AWS (Lambda, ECS, RDS, S3), GCP (BigQuery, Dataflow, Pub/Sub), Terraform, Docker

Observabilidad: Datadog, Monte Carlo, Soda, tests dbt propios

BI: Looker, Mode, Metabase

```

No listes cada herramienta que has tocado. Elige entre 25 y 35 que coincidan con los puestos que quieres. El resto diluye la señal.

Etiquetas de nivel (avanzado, intermedio, básico) solo en las dos primeras líneas. Más allá, los niveles se vuelven ruido.

Cómo escribir las bullets de data engineering

La fórmula: qué construiste o de qué eras owner, la escala, la decisión técnica, el resultado de negocio.

Bullets débiles:

  • Construí pipelines ETL en Airflow
  • Trabajé con Spark y Kafka
  • Responsable de la calidad de datos

Bullets fuertes:

  • Migré 80+ DAGs de Airflow de cron a Dagster basado en eventos, reduciendo la latencia media de pipelines de 4h a 35 min y los pages de on-call un 60 % al mes
  • Diseñé la capa de streaming (Kafka + Flink + Iceberg) que sustituyó un batch nocturno, permitiendo scoring de fraude en tiempo real y reduciendo pérdidas por fraude en 1,8 M$ anualizados
  • Construí el framework de data contracts adoptado por 14 equipos fuente, bajando los incidentes por rotura de esquema de 9 por trimestre a 1

Cada bullet muestra alcance, escala, elección técnica e impacto. El reclutador no tiene que interpretar.

Bullets por seniority

Junior (0 a 2 años)

Céntrate en lo que has tenido en propiedad, aunque sea pequeño. Cita el proyecto.

  • Construí y entregué los modelos dbt para el dataset de atribución de marketing (40 modelos, 200+ tests), usado por el equipo de growth para el análisis semanal de campañas
  • Migré tres jobs batch de Pandas a Spark, recortando el runtime diario de 6h a 22 min

Mid (3 a 6 años)

Liderazgo de pequeñas iniciativas, mentoring de juniors, trabajo cross-equipo.

  • Lideré la migración de Redshift a BigQuery para 1,2 PB de datos en 9 sistemas fuente, completada en 8 meses sin downtime
  • Mentoricé a dos ingenieros junior en sus primeras rotaciones de on-call; ambos lideran ya sus propios post-mortems

Senior y staff (7+ años)

Visión de plataforma, impacto cross-funcional, contratación y arquitectura.

  • Diseñé la plataforma de datos de toda la empresa para 60 analistas, 12 equipos de ML y 4.000M de eventos/día; coste medio por query bajado de 0,14 a 0,04 $ en 18 meses
  • Contraté a 5 data engineers en dos equipos en 14 meses; retención al 100 % al cierre del último trimestre

Sección de proyectos: cuándo incluirla

Incluye una sección de proyectos si:

  • Estás al principio de tu carrera y quieres mostrar trabajo concreto
  • Te estás reconvirtiendo desde otro campo (backend, analytics, ML)
  • Contribuyes a herramientas de datos open source

Limítala a 1 o 2 proyectos con la misma estructura de bullets que la experiencia. Enlaza el repo de GitHub. Sin enlace, el proyecto pesa menos.

Omite la sección de proyectos si tienes 5+ años de experiencia relevante. Empuja el trabajo real hacia abajo.

Herramientas a manejar con cuidado

  • Spark vs Pandas: lista las dos si aplica, pero deja claro a qué escala usaste realmente Spark (10 GB no es Spark; 5 TB sí)
  • `Big data`: evita la expresión. Indica el volumen
  • `Cloud`: nombra el cloud y los servicios (AWS Lambda, S3, RDS), no solo AWS
  • `ETL/ELT`: elige el que de verdad haces. Las dos si has hecho las dos en serio
  • `Machine learning`: solo si has entregado pipelines que alimentan ML en producción, con el framework

Errores frecuentes

  1. Inflación de stack. Listar 60 herramientas indica que eres intermedio en la mayoría. Entre 25 y 35 es el punto óptimo.
  2. Resultados genéricos. Mejora de la calidad de datos no dice nada. Bajada del null rate en la tabla orders del 4,3 % al 0,2 % en el Q3 sí.
  3. Sin escala en ningún lado. Volumen, latencia, coste, uptime — al menos tres de esas métricas deberían aparecer en las dos primeras bullets por puesto.
  4. On-call olvidado. El trabajo de fiabilidad es la mitad del puesto. Si lo has hecho, dilo.
  5. Liderazgo técnico oculto. Mentoring, contratación, revisiones de arquitectura, RFCs — todo eso va en el CV a partir de mid-level.
  6. Buzzwords sin prueba. Streaming-first, cloud-native, data mesh — cada uno necesita una frase de prueba o es papel pintado.

Checklist de formato ATS-friendly

  • Layout a una sola columna
  • Tipografías estándar: Calibri, Helvetica, Inter, Source Sans, Arial
  • Sin tablas, sin cuadros de texto, sin infografías, sin foto
  • Nombre de archivo: Nombre-Apellido-DataEngineer-CV.pdf
  • Exporta en PDF, no en Word, pero guarda un backup .docx
  • Pruébalo subiéndolo a Greenhouse o Lever y revisa la salida parseada

Sección de habilidades por puesto objetivo

Roles streaming-heavy

Encabeza con Kafka, Flink, Kinesis, Spark Structured Streaming. Quita peso al ETL clásico.

Roles de plataforma analítica

Encabeza con dbt, Snowflake o BigQuery, Looker. Muestra ownership de la capa semántica.

Roles más infra

Encabeza con Terraform, Kubernetes, herramientas de observabilidad, ownership de on-call.

Roles cercanos a ML

Feature stores (Feast, Tecton), pipelines de training data, bases vectoriales si aplica.

Nunca envíes el mismo CV a los cuatro. Adapta la mitad superior al puesto que apuntas esa semana.

Repaso QA antes de enviar

  • [ ] Las 6 primeras líneas cuentan una historia clara: qué haces, escala, qué quieres a continuación
  • [ ] Las 3 hard skills de arriba coinciden con la oferta palabra por palabra
  • [ ] Cada puesto tiene al menos una bullet con un número (filas, tiempo ahorrado, coste, uptime)
  • [ ] Puedes defender cada herramienta de tu sección de habilidades en una conversación de 15 minutos
  • [ ] El CV se parsea limpio en un previsualizador de ATS gratuito (Resume Worded, Jobscan, o súbelo a un ATS real)

Eso es lo que separa un CV que consigue la llamada de screening de uno que desaparece en la pila.

Prueba Postulit

Adapta tu CV en 30 segundos.

Crear mi CV — gratis
◆ The Postulit Brief

¡Mantente conectado!

Recibe los últimos artículos directamente en tu bandeja de entrada

No spam · Unsubscribe anytime