[Job - 29613] Data Scientist, Brazil

BrazilRemoteHomeofficemid

Data ScientistData

0 views0 saves0 applied

Apply Now

Quick Summary

Overview

Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,

Technical Tools

Data ScientistData

Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.

Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.

A CI&T está buscando um Data Scientist para integrar um programa estratégico de dados para um cliente do setor financeiro com foco em crédito agrícola. O projeto visa transformar uma operação hoje altamente manual e fragmentada — em uma Plataforma de Inteligência de Dados escalável, com capacidade preditiva e integrada ao ecossistema tecnológico do cliente.

O profissional atuará em um ciclo iterativo de desenvolvimento: começa com dados estruturados disponíveis e evolui progressivamente para incorporar variáveis externas (clima, safra, cenário macroeconômico, dados não estruturados). Operará em um modelo de entrega IA-native, com Databricks, onde agentes de IA apoiam a geração de código e pipelines de modelagem, e o Data Scientist é responsável pela definição metodológica, seleção de features, validação estatística e ciclos de melhoria contínua.

Responsabilidades
Desenvolvimento de Modelos Preditivos: Desenvolver modelos de propensão a default utilizando técnicas de ML tradicional (classificação binária, modelos ensemble como Random Forest, Gradient Boosting e equivalentes), com foco em precisão, recall e estabilidade em produção.
Seleção e Engenharia de Features: Conduzir análise exploratória de dados (EDA), identificar e selecionar variáveis relevantes a partir de dados contratuais estruturados e, progressivamente, incorporar variáveis externas (clima, safra, cenário macroeconômico, dados de recuperação judicial e fontes de notícias).
Experimentação no Databricks: Desenvolver e versionar experimentos de modelagem utilizando Databricks e MLflow, garantindo rastreabilidade de runs, parâmetros, métricas e artefatos de modelos ao longo dos ciclos iterativos.
Validação e Avaliação de Modelos: Projetar e executar estratégias robustas de validação (cross-validation, backtesting temporal, análise de estabilidade de score) garantindo que os modelos performem de forma confiável em janelas de projeção crescentes (3, 6 e 12 meses).
Ciclos Iterativos de Melhoria: Participar ativamente dos ciclos iterativos de refinamento do modelo — a cada sprint, incorporar novas variáveis, reavaliar performance e documentar aprendizados na Base de Conhecimento do programa.
Colaboração com Engenharia de Dados: Trabalhar em estreita parceria com os Data Engineers para garantir que os pipelines de dados alimentem corretamente os modelos, e que as saídas dos modelos (scores, projeções, alertas) sejam disponibilizadas nas camadas corretas da plataforma.
Comunicação de Resultados: Traduzir resultados técnicos dos modelos para linguagem de negócio, apoiando o Data Strategist na comunicação com stakeholders do cliente (superintendências, crédito, liderança).
Documentação Técnica: Documentar metodologias, decisões de modelagem e resultados em formatos estruturados que alimentem a Base de Conhecimento e possam ser consumidos por agentes de IA em fases subsequentes.
Monitoramento em Produção: Acompanhar a performance dos modelos em produção, identificar desvios de distribuição (data drift, concept drift) e propor ações corretivas ou re-treinamentos.

Requisitos
Experiência sólida em ciência de dados com foco em modelagem preditiva para problemas de negócio em produção
Experiência comprovada com modelos de classificação e ensemble (Random Forest, Gradient Boosting, XGBoost ou equivalentes) em contextos de crédito, risco ou detecção de anomalias
Experiência com Databricks para desenvolvimento, experimentação e versionamento de modelos (Delta Lake, MLflow, Spark MLlib ou bibliotecas equivalentes em ambiente distribuído)
Sólido domínio de seleção de features, tratamento de dados desbalanceados e estratégias de validação temporal para modelos de risco
Experiência em análise e modelagem de dados no ecossistema AWS (S3, Athena, SageMaker ou serviços equivalentes de ML gerenciado em nuvem)
Capacidade de comunicar resultados e limitações de modelos para audiências não técnicas, com clareza e orientação para decisão de negócio
Experiência no setor de serviços financeiros (crédito, risco, inadimplência ou similares)

Diferenciais
Inglês em nível técnico de leitura e documentação
Experiência com modelos de crédito agrícola ou segmentos com sazonalidade e variáveis externas de clima e safra
Familiaridade com incorporação de dados não estruturados em pipelines de modelagem (NLP, embeddings, dados de mídia)
Experiência com monitoramento de modelos em produção (drift detection, retraining automatizado) usando MLflow ou ferramentas equivalentes
Conhecimento em técnicas de explicabilidade de modelos (SHAP, LIME ou equivalentes), relevante para ambientes regulados
Familiaridade com modelos de entrega IA-native e uso de agentes de IA para aceleração de ciclos de desenvolvimento
Certificações em ML/AI ou Databricks (Databricks Certified Machine Learning Associate/Professional, AWS Machine Learning Specialty ou equivalentes)

#LI-JP3

Nossos benefícios:

- Plano de saúde e odontológico;

- Vale alimentação e refeição;

- Auxílio-creche;

- Licença parental estendida;

- Parceria com academias e profissionais de saúde e bem-estar via Wellhub (Gympass) TotalPass;

- Participação nos Lucros e Resultados (PLR);

- Seguro de Vida;

- Plataforma de aprendizagem contínua (CI&T University);

- Clube de descontos;

- Plataforma online gratuita dedicada à promoção da saúde física, mental e bem-estar;

- Curso gestante e parentalidade responsável;

- Parceria com plataformas de cursos online;

- Plataforma para aprendizagem de idiomas;

- E muitos outros

Mais detalhes sobre os nossos benefícios aqui: https://ciandt.com/br/pt-br/carreiras

Na CI&T, a inclusão começa no primeiro contato. Se você é pessoa com deficiência, é importante apresentar o seu laudo durante o processo seletivo. Consulte quais dados são necessários conter no laudo clicando aqui. Assim, podemos garantir o suporte e as adaptações que você merece. Se ainda não tem o laudo caracterizador, não se preocupe: podemos te apoiar para obtê-lo.

Temos um time dedicado de Saúde e Bem-estar, especialistas em inclusão e grupos de afinidade que estarão com você em todas as etapas. Conte com a gente para fazer essa jornada lado a lado.