[JOB-29751] Senior Engenheiro(a) de Dados Sênior — IA Generativa, Dados e MDM, Brasil
Quick Summary
Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,
Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados Sênior em um projeto estratégico voltado à concepção, construção e evolução de soluções inteligentes baseadas em IA Generativa, agentes e multiagentes, aplicadas ao domínio de Cadastro de Clientes, com foco em integração, processamento, análise autônoma de dados, identificação de padrões, geração de recomendações e suporte à tomada de decisão.
O profissional será responsável por transformar dados cadastrais em inteligência acionável, utilizando engenharia de dados, Analytics avançado, Machine Learning, LLMs, Databricks, PySpark e soluções em ambientes cloud, apoiando a evolução do Golden Record, da qualidade de dados e da governança de MDM.
Além disso, atuará na construção e sustentação de pipelines escaláveis, processamento de dados em ambiente Big Data, produtização de modelos de Machine Learning e aplicação de boas práticas de desenvolvimento, versionamento e qualidade.
Essência do papel:
Não buscamos apenas um profissional para construir pipelines isolados.
Buscamos um Engenheiro de Dados Sênior capaz de estruturar, integrar, transformar e disponibilizar dados com inteligência, utilizando dados, IA e engenharia para apoiar recomendações, automações e ações sobre o Cadastro de Clientes, gerando valor mensurável para o negócio.
Principais tecnologias e competências envolvidas:
* IA Generativa e LLMs
* Arquiteturas de agentes e multiagentes
* RAG, agentes autônomos e workflows inteligentes
* Machine Learning aplicado
* Analytics avançado
* Python
* SQL
* Databricks com PySpark
* Spark
* Azure Databricks
* GCP e Gemini
* Processamento de dados em tempo quase real com Kafka
* MLOps e produtização de modelos no Databricks
* Esteiras de CI/CD com GitHub e GitHub Actions
* Qualidade de dados, governança e MDM
* Golden Record e dados cadastrais
* Experiência com metodologias ágeis
Principais responsabilidades:
* Desenvolver, otimizar e manter pipelines de dados escaláveis utilizando Databricks, Spark e PySpark.
* Atuar na integração, transformação, tratamento e disponibilização de dados cadastrais em larga escala.
* Construir e manter produtos de dados em ambiente Big Data na nuvem, assegurando escalabilidade, performance, confiabilidade e qualidade.
* Trabalhar com dados do domínio de Cadastro de Clientes, apoiando iniciativas relacionadas a Golden Record, qualidade de dados, governança e MDM.
* Projetar e implementar soluções de dados que apoiem sistemas inteligentes baseados em IA Generativa, agentes e multiagentes.
* Preparar, estruturar e disponibilizar dados para consumo por modelos de Machine Learning, LLMs, agentes autônomos e workflows inteligentes.
* Apoiar a construção de agentes e multiagentes capazes de analisar dados cadastrais em larga escala.
* Apoiar a identificação de padrões, inconsistências, gaps, duplicidades, anomalias e oportunidades de melhoria em dados cadastrais.
* Desenvolver mecanismos de dados para geração de alertas, recomendações explicáveis e suporte à tomada de decisão.
* Aplicar técnicas de Analytics e Machine Learning para detecção de anomalias, classificação, clusterização e scoring de dados cadastrais.
* Apoiar estratégias de qualificação, enriquecimento, priorização e governança de dados.
* Utilizar IA Generativa para apoiar a geração, evolução, validação e explicação de regras de negócio.
* Explorar e apoiar a implementação de arquiteturas como RAG, agentes autônomos, multiagentes e workflows inteligentes.
* Atuar com processamento de dados em tempo quase real utilizando Kafka.
* Apoiar a produtização de modelos de Machine Learning no Databricks, aplicando conceitos de MLOps.
* Criar, manter e evoluir esteiras de CI/CD utilizando GitHub e GitHub Actions.
* Garantir boas práticas de desenvolvimento, assegurando que as soluções sigam padrões de qualidade, eficiência, manutenibilidade e governança.
* Otimizar o uso dos dados disponíveis para maximizar seu valor para as áreas de negócio e tecnologia.
* Colaborar com equipes de MDM, Dados, Tecnologia e Negócio, garantindo que as soluções desenvolvidas sejam mensuráveis, governáveis e aplicáveis.
* Apoiar refinamentos técnicos e funcionais, garantindo clareza, viabilidade e aderência das histórias às necessidades do projeto.
* Apoiar a construção de histórias de usuário claras, bem definidas e tecnicamente viáveis.
* Participar do desenho AS-IS e TO-BE, documentando processos atuais e futuros, identificando débitos técnicos, riscos e oportunidades de melhoria.
* Desenvolver histórias refinadas e aprovadas, garantindo qualidade, eficiência e aderência aos padrões técnicos.
* Atuar na identificação de débitos técnicos e propor melhorias contínuas em arquitetura, processos, dados e soluções.
* Trabalhar em parceria com focais de dados e de negócio para garantir alinhamento entre soluções técnicas, melhores práticas e necessidades estratégicas.
Qualificações necessárias:
Conhecimentos técnicos:
* Experiência sólida como Engenheiro(a) de Dados, Engenheiro(a) de Dados Sênior ou papel equivalente.
* Forte conhecimento em Python para engenharia de dados, automação, análise de dados e apoio a soluções de IA.
* Sólido conhecimento em SQL e exploração de dados estruturados.
* Experiência com Databricks, PySpark e Spark.
* Experiência na construção, otimização e sustentação de pipelines de dados escaláveis.
* Experiência em ambientes cloud, preferencialmente Azure Databricks e GCP.
* Conhecimento ou experiência com Gemini para apoio a soluções GenAI.
* Conhecimento em IA Generativa, LLMs e aplicações inteligentes baseadas em dados.
* Conhecimento em arquiteturas de agentes, multiagentes e sistemas autônomos.
* Vivência com RAG, workflows inteligentes, recomendação baseada em dados e automação cognitiva.
* Experiência com técnicas de Machine Learning aplicado, incluindo anomalias, classificação, clustering e scoring.
* Experiência com processamento de dados em tempo quase real, preferencialmente com Kafka.
* Experiência com produtização de modelos de Machine Learning no Databricks e práticas de MLOps.
* Experiência com esteiras de CI/CD, especialmente GitHub e GitHub Actions.
* Domínio de boas práticas de engenharia de dados, versionamento, testes, revisão de código e qualidade de dados.
* Conhecimento em lógica de programação, desenvolvimento de aplicações e otimização de performance.
* Capacidade de transformar problemas de negócio em soluções de dados, analíticas e inteligentes.
* Experiência em squads ágeis e metodologias ágeis.
Diferenciais:
* Experiência com dados críticos, como clientes, identidade, cadastro ou KYC.
* Conhecimento em qualidade de dados, governança, MDM e Golden Record.
* Experiência prática com multiagentes, automação cognitiva ou sistemas baseados em decisões autônomas.
* Vivência em ambientes regulados.
* Conhecimento em estratégias de enriquecimento, deduplicação, matching e consolidação de dados cadastrais.
* Experiência com uso de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado.
Qualidades comportamentais:
* Proatividade e curiosidade analítica.
* Interesse por inovação, IA e novas tecnologias.
* Perfil hands-on, com autonomia para conduzir atividades técnicas complexas.
* Capacidade analítica para interpretar bases de dados, regras de negócio, padrões e anomalias.
* Habilidade de resolução de problemas, identificando causas, riscos, impactos e alternativas.
* Perfil consultivo, trazendo ideias, soluções e melhorias para o projeto sem aguardar apenas direcionamentos.
* Visão 360º, entendendo o projeto como um todo e avaliando impactos técnicos, operacionais e de negócio.
* Comunicação assertiva, com clareza, confiança e respeito.
* Boa capacidade de interação com áreas técnicas, de negócio, dados, MDM e governança.
* Foco em resultados, produtividade e melhoria contínua.
* Capacidade de colaboração com times técnicos e de negócio.
Location & Eligibility
Listing Details
- Posted
- June 5, 2026
- First seen
- June 5, 2026
- Last seen
- June 5, 2026
Posting Health
- Days active
- 0
- Repost count
- 0
- Trust Level
- 68%
- Scored at
- June 5, 2026
Signal breakdown
Please let Ciandt know you found this job on Jobera.
Similar Engenheiro jobs
View all →Browse Similar Jobs
Stay ahead of the market
Get the latest job openings, salary trends, and hiring insights delivered to your inbox every week.
No spam. Unsubscribe at any time.