Quick Summary
Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,
A CI&T está buscando um Data Scientist para integrar um programa estratégico de dados para um cliente do setor financeiro com foco em crédito agrícola. O projeto visa transformar uma operação hoje altamente manual e fragmentada — em uma Plataforma de Inteligência de Dados escalável, com capacidade preditiva e integrada ao ecossistema tecnológico do cliente.
O profissional atuará em um ciclo iterativo de desenvolvimento: começa com dados estruturados disponíveis e evolui progressivamente para incorporar variáveis externas (clima, safra, cenário macroeconômico, dados não estruturados). Operará em um modelo de entrega IA-native, com Databricks, onde agentes de IA apoiam a geração de código e pipelines de modelagem, e o Data Scientist é responsável pela definição metodológica, seleção de features, validação estatística e ciclos de melhoria contínua.
Responsabilidades
Desenvolvimento de Modelos Preditivos: Desenvolver modelos de propensão a default utilizando técnicas de ML tradicional (classificação binária, modelos ensemble como Random Forest, Gradient Boosting e equivalentes), com foco em precisão, recall e estabilidade em produção.
Seleção e Engenharia de Features: Conduzir análise exploratória de dados (EDA), identificar e selecionar variáveis relevantes a partir de dados contratuais estruturados e, progressivamente, incorporar variáveis externas (clima, safra, cenário macroeconômico, dados de recuperação judicial e fontes de notícias).
Experimentação no Databricks: Desenvolver e versionar experimentos de modelagem utilizando Databricks e MLflow, garantindo rastreabilidade de runs, parâmetros, métricas e artefatos de modelos ao longo dos ciclos iterativos.
Validação e Avaliação de Modelos: Projetar e executar estratégias robustas de validação (cross-validation, backtesting temporal, análise de estabilidade de score) garantindo que os modelos performem de forma confiável em janelas de projeção crescentes (3, 6 e 12 meses).
Ciclos Iterativos de Melhoria: Participar ativamente dos ciclos iterativos de refinamento do modelo — a cada sprint, incorporar novas variáveis, reavaliar performance e documentar aprendizados na Base de Conhecimento do programa.
Colaboração com Engenharia de Dados: Trabalhar em estreita parceria com os Data Engineers para garantir que os pipelines de dados alimentem corretamente os modelos, e que as saídas dos modelos (scores, projeções, alertas) sejam disponibilizadas nas camadas corretas da plataforma.
Comunicação de Resultados: Traduzir resultados técnicos dos modelos para linguagem de negócio, apoiando o Data Strategist na comunicação com stakeholders do cliente (superintendências, crédito, liderança).
Documentação Técnica: Documentar metodologias, decisões de modelagem e resultados em formatos estruturados que alimentem a Base de Conhecimento e possam ser consumidos por agentes de IA em fases subsequentes.
Monitoramento em Produção: Acompanhar a performance dos modelos em produção, identificar desvios de distribuição (data drift, concept drift) e propor ações corretivas ou re-treinamentos.
Requisitos
Experiência sólida em ciência de dados com foco em modelagem preditiva para problemas de negócio em produção
Experiência comprovada com modelos de classificação e ensemble (Random Forest, Gradient Boosting, XGBoost ou equivalentes) em contextos de crédito, risco ou detecção de anomalias
Experiência com Databricks para desenvolvimento, experimentação e versionamento de modelos (Delta Lake, MLflow, Spark MLlib ou bibliotecas equivalentes em ambiente distribuído)
Sólido domínio de seleção de features, tratamento de dados desbalanceados e estratégias de validação temporal para modelos de risco
Experiência em análise e modelagem de dados no ecossistema AWS (S3, Athena, SageMaker ou serviços equivalentes de ML gerenciado em nuvem)
Capacidade de comunicar resultados e limitações de modelos para audiências não técnicas, com clareza e orientação para decisão de negócio
Experiência no setor de serviços financeiros (crédito, risco, inadimplência ou similares)
Diferenciais
Inglês em nível técnico de leitura e documentação
Experiência com modelos de crédito agrícola ou segmentos com sazonalidade e variáveis externas de clima e safra
Familiaridade com incorporação de dados não estruturados em pipelines de modelagem (NLP, embeddings, dados de mídia)
Experiência com monitoramento de modelos em produção (drift detection, retraining automatizado) usando MLflow ou ferramentas equivalentes
Conhecimento em técnicas de explicabilidade de modelos (SHAP, LIME ou equivalentes), relevante para ambientes regulados
Familiaridade com modelos de entrega IA-native e uso de agentes de IA para aceleração de ciclos de desenvolvimento
Certificações em ML/AI ou Databricks (Databricks Certified Machine Learning Associate/Professional, AWS Machine Learning Specialty ou equivalentes)
#LI-JP3
Location & Eligibility
Listing Details
- Posted
- May 28, 2026
- First seen
- May 28, 2026
- Last seen
- May 28, 2026
Posting Health
- Days active
- 0
- Repost count
- 0
- Trust Level
- 68%
- Scored at
- May 28, 2026
Signal breakdown
Please let Ciandt know you found this job on Jobera.
3 other jobs at Ciandt
View all →Explore open roles at Ciandt.
Similar Data Scientist jobs
View all →Stay ahead of the market
Get the latest job openings, salary trends, and hiring insights delivered to your inbox every week.
No spam. Unsubscribe at any time.