Skip to content

dadosjusbr/coletor-mppe

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

79 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Docker

Ministério Público do Estado de Pernambuco

Este coletor tem como objetivo a recuperação de informações sobre folhas de pagamentos dos funcionários do Ministério Público do Estado de Pernambuco. O site com as informações pode ser acessado aqui.

O coletor será estruturado como uma CLI. Uma vez passado como argumentos mês e ano, será feito o download de duas planilhas no formato XLSX. Cada planilha é referente a uma dessas categorias:

  • Tipo I - Folha de remuneração: Membros Ativos

  • Tipo II - Verbas Indenizatórias e outras remunerações temporárias referentes há membros ativos.

Coletando usando Docker

Por exemplo, para coletar o mês de novembro de 2020, basta executar os seguintes comandos:

$ sudo docker build -t mppe .
sudo docker run -e MONTH=01 -e YEAR=2020 -e GIT_COMMIT=$(git rev-parse HEAD) -e OUTPUT_FOLDER='/output' mppe

Coleta sem utilização do Docker:

Antes de mais nada, deve-se instalar as dependências do programa, executando o comando:

pip install -r requirements.txt

Como exemplo, serão descritos os passos para realizar a coleta do mês de fevereiro de 2022.

Através da CLI

  • Windows

  1. Definir variáveis de ambiente:
setx YEAR 2022
setx MONTH 02
setx GIT_COMMIT '$(git rev-list -1 HEAD)'
  1. Rodar o programa:
python src/main.py
  • Linux

YEAR=2022 MONTH=02 GIT_COMMIT=$(git rev-list -1 HEAD) python3 src/main.py

2. Criando arquivo .env

  • Criar um arquivo .env na raíz do projeto, com as variáveis de ambiente descritas no arquivo .env.example, dessa forma:

    YEAR=2022
    MONTH=02
    GIT_COMMIT=$(git rev-list -1 HEAD)
    OUTPUT_FOLDER=/output
    

    Com o arquivo .env criado, executar o comando:

    python src/main.py

Dicionário de dados

As planilhas referentes á remunerações possuem as seguintes colunas:

  • Nome (String): Nome completo do funcionário
  • Cargo (String): Cargo do funcionário dentro do MP
  • Lotação (String): Local (cidade, departamento, promotoria) em que o funcionário trabalha
  • Remuneração do cargo efetivo (Number): Vencimento, GAMPU, V.P.I, Adicionais de Qualificação, G.A.E e G.A.S, além de outras desta natureza. Soma de todas essas remunerações
  • Outras Verbas Remuneratórias Legais/Judiciais (Number): V.P.N.I., Adicional por tempo de serviço, quintos, décimos e vantagens decorrentes de sentença judicial ou extensão administrativa
  • Função de Confiança ou Cargo em Comissão (Number): Rubricas que representam a retribuição paga pelo exercício de função (servidor efetivo) ou remuneração de cargo em comissão (servidor sem vínculo ou requisitado)
  • Gratificação Natalina (Number): Parcelas da Gratificação Natalina (13º) pagas no mês corrente, ou no caso de vacância ou exoneração do servidor
  • Adicional de Férias (Number): Adicional correspondente a remuneração paga ao servidor por ocasião das férias
  • Abono de Permanência (Number): Valor equivalente ao da contribuição previdenciária, devido ao funcionário público que esteja em condição de aposentar-se, mas que optou por continuar em atividade (instituído pela Emenda Constitucional nº 41, de 16 de dezembro de 2003)
  • Outras Remunerações Temporárias (Number): Valores pagos a título de Auxílio-alimentação, Auxílio-cursos,Auxílio-Saúde, Auxílio-creche, Auxílio-moradia.
  • Verbas Indenizatórias (Number): Verbas referentes á indenizações recebidas pelo funcionario á titulo de Adicional noturno, Cumulações, Serviços extraordinários e substituição de função.

Dificuldades na libertação de dados:

Dificuldades de coleta:

Dificuldades de Parsing:

  • Planilhas referentes á verbas indenizatórias possuem aproximadamente 50 colunas.
  • Nomeclatura das colunas referentes á verbas indenizatórias é pouco descritiva, Exemplo: 0201-DIF ENTRANC, 0416-PENS AL ATR.
  • Permutação da localização das colunas Indenizações e Outras Remunerações Retroativas/Temporárias, entre 2020 e 2019/2018 sendo necessário abordagem especializada.
  • Inexistência de dados referente á verbas indenizatórias anteriores á setembro de 2019.