Posted 5d ago

CIENTISTA DADOS

@ Louis Dreyfus Company
Bebedouro, Sao Paulo, Brazil
OnsiteFull Time
Responsibilities:develop datasets, build pipelines, validate data
Requirements Summary:Proficient in Python and SQL with Azure Databricks experience; ETL/ELT, data quality, and scalable data pipelines; practical Big Data knowledge.
Technical Tools Mentioned:Python, SQL, PySpark, Azure Databricks, Pandas, Spark, Delta Lake, Scikit-learn, GeoPandas
Save
Mark Applied
Hide Job
Report & Hide
Job Description
Company Description:

Você conhece a LDC? A LDC é uma das principais comercializadoras e processadoras global de produtos agrícolas, com um portfólio diversificado, que abrange toda a cadeia de valor, da originação à distribuição. Com atividades no centro da produção agrícola e de alimentos e guiados pelos nossos fortes valores, por um legado rico e uma visão clara, estamos comprometidos em trabalhar por um futuro seguro e sustentável. Ajudamos a alimentar e vestir cerca de 500 milhões de pessoas todos os anos, originando, processando e transportando aproximadamente 81 milhões de toneladas de produtos. Estruturada como uma organização matricial de 6 regiões geográficas e 10 plataformas, a LDC está ativa em mais de 100 países e emprega cerca de 18.000 pessoas em todo o mundo. Somos guiados por valores que norteiam todos os públicos em nosso trabalho. A ética e integridade fazem parte de todas as relações de negócio, assim como a humildade, comprometimento e diversidade.

Job Description:
  • Atuar no desenvolvimento e evolução de soluções de dados e inteligência analítica voltadas ao negócio agrícola, apoiando produtos digitais atuais e futuros da LDC.
  • Preparar, validar e disponibilizar datasets operacionais e analíticos provenientes de sistemas agrícolas e corporativos (ex.: inspeções, operações de campo, aplicações, estoque, histórico operacional), assegurando qualidade, consistência e rastreabilidade.
  • Desenvolver e manter transformações de dados em Python e SQL, com execução preferencial (mas nao somente) em Azure Databricks (PySpark), estruturando dados para consumo por aplicações analíticas, modelos e soluções de IA.
  • Apoiar a construção e evolução de pipelines de dados (ETL/ELT), com foco em escalabilidade, padronização, reutilização e aderência às boas práticas de engenharia de dados da companhia.
  • Contribuir com a criação e manutenção de bases de conhecimento técnico e de negócio, estruturadas para consumo por soluções analíticas e de inteligência artificial, garantindo alinhamento com fontes oficiais e regras corporativas.
  • Apoiar o desenvolvimento de camadas de lógica determinística e regras de negócio (ex.: dicionários de dados, mapeamento de entidades, regras de filtragem e validação), reforçando confiabilidade e interpretabilidade das soluções.
  • Criar e manter testes, validações e controles de qualidade, assegurando estabilidade das soluções à medida que novos dados, funcionalidades ou produtos forem incorporados.
  • Documentar entregas técnicas, decisões de modelagem e fluxos de dados, apoiando a maturação de iniciativas de dados e IA desde provas de conceito até produtos escaláveis e governados.
  • E outras atividades correlatas.
Qualifications:

Requisitos Obrigatórios:

  • Python para análise e manipulação de dados (pandas; desejável PySpark, skit-learn, sklearn, matplotlib, numpy, scipy, pandas, dash-plotly, datascience tools, geopandas) - boas práticas de código (ambientes/venv, organização de pacotes), testes (pytest, quando aplicável) e notebooks reprodutíveis.
  • SQL avançado, incluindo modelagem e consultas em grandes volumes de dados.
  • Conhecimento prático de ETL/ELT, qualidade e validação de dados.
  • Experiência ou base sólida em Azure + Databricks (notebooks, jobs, pipelines).
  • Conhecimento de Big Data/lakehouse (mercado): conceitos de Spark, Delta Lake, particionamento e boas práticas de performance em ambientes distribuídos.

 

Desejável:

  • Experiência prévia com Spark, dados geoespaciais ou dados agrícolas.
  • Experiência com séries temporais e dados climáticos (ex.: previsão/monitoramento, anomalias), comuns em cenários agrícolas.
  • Conhecimento em sensoriamento remoto (ex.: índices de vegetação como NDVI), GIS (QGIS) e/ou banco geoespacial (ex.: PostGIS).
Additional Information:

Disponibilidade para atuar presencialmente em Bebedouro/SP;

Diversidade, Inclusão e Equidade

A diversidade é parte do nosso DNA. A LDC busca sempre criar um ambiente de trabalho diversificado e inclusivo, onde todas as pessoas possam prosperar. Respeitamos e valorizamos talentos de todos os gêneros, idades, raças, etnias, sexualidades, religiões e deficiências. Diversidade é um de nossos valores! Essa oportunidade destina-se também às pessoas com deficiências (PcD).

Sustentabilidade

O valor sustentável está no centro de nosso propósito como empresa.

Somos apaixonados pela criação de valor justo e sustentável, tanto para nossos negócios quanto para outros stakeholders da cadeia de valor: nosso pessoal, nossos parceiros comerciais, as comunidades e o meio ambiente ao nosso redor.