[JOB-29751] Senior Engenheiro(a) de Dados Sênior — IA Generativa, Dados e MDM, Brasil

BrazilRemoteHomeofficesenior

OtherEngenheiro

2 views0 saves0 applied

Apply Now

Quick Summary

Overview

Na CI&T , ajudamos grandes empresas a transformar o potencial da AI em impacto real nos negócios com AI Deployment, execução AI-native e tech-integrated business solutions.

Technical Tools

OtherEngenheiro

Na CI&T , ajudamos grandes empresas a transformar o potencial da AI em impacto real nos negócios com AI Deployment, execução AI-native e tech-integrated business solutions.

Com 30 anos de experiência em transformação tecnológica, aceleramos inovação com expertise em agentic SDLC, application modernization, Data & AI, martech e business strategy.

Somos 8.000 CI&Ters em mais de 25 países, colaborando para construir soluções com impacto real. AI já faz parte da forma como trabalhamos, evoluímos e inovamos todos os dias.

Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.

Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados Sênior em um projeto estratégico voltado à concepção, construção e evolução de soluções inteligentes baseadas em IA Generativa, agentes e multiagentes, aplicadas ao domínio de Cadastro de Clientes, com foco em integração, processamento, análise autônoma de dados, identificação de padrões, geração de recomendações e suporte à tomada de decisão.

O profissional será responsável por transformar dados cadastrais em inteligência acionável, utilizando engenharia de dados, Analytics avançado, Machine Learning, LLMs, Databricks, PySpark e soluções em ambientes cloud, apoiando a evolução do Golden Record, da qualidade de dados e da governança de MDM.

Além disso, atuará na construção e sustentação de pipelines escaláveis, processamento de dados em ambiente Big Data, produtização de modelos de Machine Learning e aplicação de boas práticas de desenvolvimento, versionamento e qualidade.

Essência do papel:

Não buscamos apenas um profissional para construir pipelines isolados.

Buscamos um Engenheiro de Dados Sênior capaz de estruturar, integrar, transformar e disponibilizar dados com inteligência, utilizando dados, IA e engenharia para apoiar recomendações, automações e ações sobre o Cadastro de Clientes, gerando valor mensurável para o negócio.

Principais tecnologias e competências envolvidas:

* IA Generativa e LLMs
* Arquiteturas de agentes e multiagentes
* RAG, agentes autônomos e workflows inteligentes
* Machine Learning aplicado
* Analytics avançado
* Python
* SQL
* Databricks com PySpark
* Spark
* Azure Databricks
* GCP e Gemini
* Processamento de dados em tempo quase real com Kafka
* MLOps e produtização de modelos no Databricks
* Esteiras de CI/CD com GitHub e GitHub Actions
* Qualidade de dados, governança e MDM
* Golden Record e dados cadastrais
* Experiência com metodologias ágeis

Principais responsabilidades:

* Desenvolver, otimizar e manter pipelines de dados escaláveis utilizando Databricks, Spark e PySpark.
* Atuar na integração, transformação, tratamento e disponibilização de dados cadastrais em larga escala.
* Construir e manter produtos de dados em ambiente Big Data na nuvem, assegurando escalabilidade, performance, confiabilidade e qualidade.
* Trabalhar com dados do domínio de Cadastro de Clientes, apoiando iniciativas relacionadas a Golden Record, qualidade de dados, governança e MDM.
* Projetar e implementar soluções de dados que apoiem sistemas inteligentes baseados em IA Generativa, agentes e multiagentes.
* Preparar, estruturar e disponibilizar dados para consumo por modelos de Machine Learning, LLMs, agentes autônomos e workflows inteligentes.
* Apoiar a construção de agentes e multiagentes capazes de analisar dados cadastrais em larga escala.
* Apoiar a identificação de padrões, inconsistências, gaps, duplicidades, anomalias e oportunidades de melhoria em dados cadastrais.
* Desenvolver mecanismos de dados para geração de alertas, recomendações explicáveis e suporte à tomada de decisão.
* Aplicar técnicas de Analytics e Machine Learning para detecção de anomalias, classificação, clusterização e scoring de dados cadastrais.
* Apoiar estratégias de qualificação, enriquecimento, priorização e governança de dados.
* Utilizar IA Generativa para apoiar a geração, evolução, validação e explicação de regras de negócio.
* Explorar e apoiar a implementação de arquiteturas como RAG, agentes autônomos, multiagentes e workflows inteligentes.
* Atuar com processamento de dados em tempo quase real utilizando Kafka.
* Apoiar a produtização de modelos de Machine Learning no Databricks, aplicando conceitos de MLOps.
* Criar, manter e evoluir esteiras de CI/CD utilizando GitHub e GitHub Actions.
* Garantir boas práticas de desenvolvimento, assegurando que as soluções sigam padrões de qualidade, eficiência, manutenibilidade e governança.
* Otimizar o uso dos dados disponíveis para maximizar seu valor para as áreas de negócio e tecnologia.
* Colaborar com equipes de MDM, Dados, Tecnologia e Negócio, garantindo que as soluções desenvolvidas sejam mensuráveis, governáveis e aplicáveis.
* Apoiar refinamentos técnicos e funcionais, garantindo clareza, viabilidade e aderência das histórias às necessidades do projeto.
* Apoiar a construção de histórias de usuário claras, bem definidas e tecnicamente viáveis.
* Participar do desenho AS-IS e TO-BE, documentando processos atuais e futuros, identificando débitos técnicos, riscos e oportunidades de melhoria.
* Desenvolver histórias refinadas e aprovadas, garantindo qualidade, eficiência e aderência aos padrões técnicos.
* Atuar na identificação de débitos técnicos e propor melhorias contínuas em arquitetura, processos, dados e soluções.
* Trabalhar em parceria com focais de dados e de negócio para garantir alinhamento entre soluções técnicas, melhores práticas e necessidades estratégicas.

Qualificações necessárias:

Conhecimentos técnicos:

* Experiência sólida como Engenheiro(a) de Dados, Engenheiro(a) de Dados Sênior ou papel equivalente.
* Forte conhecimento em Python para engenharia de dados, automação, análise de dados e apoio a soluções de IA.
* Sólido conhecimento em SQL e exploração de dados estruturados.
* Experiência com Databricks, PySpark e Spark.
* Experiência na construção, otimização e sustentação de pipelines de dados escaláveis.
* Experiência em ambientes cloud, preferencialmente Azure Databricks e GCP.
* Conhecimento ou experiência com Gemini para apoio a soluções GenAI.
* Conhecimento em IA Generativa, LLMs e aplicações inteligentes baseadas em dados.
* Conhecimento em arquiteturas de agentes, multiagentes e sistemas autônomos.
* Vivência com RAG, workflows inteligentes, recomendação baseada em dados e automação cognitiva.
* Experiência com técnicas de Machine Learning aplicado, incluindo anomalias, classificação, clustering e scoring.
* Experiência com processamento de dados em tempo quase real, preferencialmente com Kafka.
* Experiência com produtização de modelos de Machine Learning no Databricks e práticas de MLOps.
* Experiência com esteiras de CI/CD, especialmente GitHub e GitHub Actions.
* Domínio de boas práticas de engenharia de dados, versionamento, testes, revisão de código e qualidade de dados.
* Conhecimento em lógica de programação, desenvolvimento de aplicações e otimização de performance.
* Capacidade de transformar problemas de negócio em soluções de dados, analíticas e inteligentes.
* Experiência em squads ágeis e metodologias ágeis.

Diferenciais:

* Experiência com dados críticos, como clientes, identidade, cadastro ou KYC.
* Conhecimento em qualidade de dados, governança, MDM e Golden Record.
* Experiência prática com multiagentes, automação cognitiva ou sistemas baseados em decisões autônomas.
* Vivência em ambientes regulados.
* Conhecimento em estratégias de enriquecimento, deduplicação, matching e consolidação de dados cadastrais.
* Experiência com uso de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado.

Qualidades comportamentais:

* Proatividade e curiosidade analítica.
* Interesse por inovação, IA e novas tecnologias.
* Perfil hands-on, com autonomia para conduzir atividades técnicas complexas.
* Capacidade analítica para interpretar bases de dados, regras de negócio, padrões e anomalias.
* Habilidade de resolução de problemas, identificando causas, riscos, impactos e alternativas.
* Perfil consultivo, trazendo ideias, soluções e melhorias para o projeto sem aguardar apenas direcionamentos.
* Visão 360º, entendendo o projeto como um todo e avaliando impactos técnicos, operacionais e de negócio.
* Comunicação assertiva, com clareza, confiança e respeito.
* Boa capacidade de interação com áreas técnicas, de negócio, dados, MDM e governança.
* Foco em resultados, produtividade e melhoria contínua.
* Capacidade de colaboração com times técnicos e de negócio.

Nossos benefícios:

- Plano de saúde e odontológico;

- Vale alimentação e refeição;

- Auxílio-creche;

- Licença parental estendida;

- Parceria com academias e profissionais de saúde e bem-estar via Wellhub (Gympass) TotalPass;

- Participação nos Lucros e Resultados (PLR);

- Seguro de Vida;

- Plataforma de aprendizagem contínua (CI&T University);

- Clube de descontos;

- Plataforma online gratuita dedicada à promoção da saúde física, mental e bem-estar;

- Curso gestante e parentalidade responsável;

- Parceria com plataformas de cursos online;

- Plataforma para aprendizagem de idiomas;

- E muitos outros

Mais detalhes sobre os nossos benefícios aqui: https://ciandt.com/br/pt-br/carreiras

Na CI&T, a inclusão começa no primeiro contato. Se você é pessoa com deficiência, é importante apresentar o seu laudo durante o processo seletivo. Consulte quais dados são necessários conter no laudo clicando aqui. Assim, podemos garantir o suporte e as adaptações que você merece. Se ainda não tem o laudo caracterizador, não se preocupe: podemos te apoiar para obtê-lo.

Temos um time dedicado de Saúde e Bem-estar, especialistas em inclusão e grupos de afinidade que estarão com você em todas as etapas. Conte com a gente para fazer essa jornada lado a lado.