Avançar para o conteúdo principal

De PDF a Lista HTML - Léxico / Glossário

De PDF a Lista HTML - Léxico / Glossário

Como transformar um PDF numa lista de Léxico ou Glossário.

Como trabalhamos para vários países, os termos técnicos variam bastante, até dentro do mesmo "idioma", seja o Castelhano/Espanhol seja o Português. Assim a minha ideia é ir montando um referencial técnico que também inclua uma lista de termos técnicos.

No exemplo que ilustro, como ponto de partida tenho o glossário dos termos ferroviários do DNIT (Brasil).


Este é um documento acessível pela net em:

https://www.gov.br/dnit/pt-br/ferrovias/glossario-de-termos-ferroviarios/glossario.pdf/view


Com esta informação base, podemos selecionar tudo e copiar para um ficheiro de texto simples:


Neste ficheiro é necessário fazer algumas edições, por exemplo apagar os números de página e cabeçalhos...


Este é um ficheiro com um conteúdo complexo demais, para por exemplo no Excel separar o texto de modo a que em cada linha (ou em duas linhas) tenha numa coluna a palavra chave e na outra o seu significado. Pode-se fazer um pouco à mão... mas como gostamos de automatizar processos e colocar a programação em tudo... é possível criar um programa para que faça esse serviço, usando entre outras funções, as expressões regulares:


Este mesmo programa grava num ficheiro de texto simples a informação tratada:


Agora já temos a informação num formato que o Excel entende onde quebrar a palavra(s) chave do significado. Qual o interesse do meter o Excel nisto? É que no Excel posso usar a fórmula de concatenação e "envolver" cada uma das colunas em código que posso transportar para uma tabela da linguagem de programação.

Como resultado final, temos uma folha com uma formatação limpa, de fácil consulta:


Obrigado.



Comentários

Mensagens populares deste blogue

C# - Viadutos Excel - ISPOL

C# - Viadutos Excel - ISPOL Ler dados do Excel e passar a informação para o ISPOL é um ganho de produtividade e organização. Desta vez, apresento uma utilidade que lê um ficheiro Excel, e transforma os dados para o menu de estruturas do ISPOL. Partindo de um Excel organizado, por pks eixos e espessuras da estrutura etc... como o seguinte: Elaborei um programita em CSharp: Este programa funciona em modo "DOS" não tem uma interface gráfica de janelas: O programa cria os ficheiros necessários, o Excel pode estar organizado por eixos, e o programa guarda um ficheiro para cada eixo: O resultado depois de abrir o ficheiro em ISPOL é o seguinte: Com as alterações ao projecto pode-se manter um ficheiro de apresentação e controlo em Excel.

ISPOL - Representação de Gabaris

ISPOL - Representação de Gabaris No ISPOL podemos representar ao longo do traçado um contorno e até realizar variações. A representação de um contorno ou gabari pode ser realizada no ISPOL de um modo simples, usando por exemplo um Símbolo (bloco) da biblioteca, ou um ou vários criados à medida para atender aos casos necessários. Na imagem abaixo um exemplo da biblioteca do ISPOL, representado no perfil transversal. Estas secções são constituídas por símbolos/blocos: Podem-se desenhar ao longo do eixo proporcionando a vista típica destas situações, uma espécie de sólido que enche o traçado. Além desta representação "simples" o ISPOL permite realizar transições entre símbolos diferentes, por exemplo para representar os diferentes gabaris em recta e curva. Ou outras situações que se achem necessárias. Permite ainda condicionar a representação destes símbolos por valores de raio. Isto é para um determinado raio. Pode ser usado para indicar de forma automática ao programa que em r...

Python - Automatização em ISPOL

Python - Automatização em ISPOL Com o uso de PyAutoGui podemos automatizar tarefas repetitivas no ISPOL ISTRAM. No trabalho actual, é necessário converter mais de 300 ficheiros. Já houve um trabalho prévio de ler e transformar dados de directrizes em Excel para ficheiros compatíveis com a conversão presente. Este trabalho prévio foi também feito com programação. Tendo os muitos ficheiros com formato TXT que o ISPOL pode ler e converter para CEJ, é necessário ir ao menu de Conversores do ISTRAM e digitar os dados para ler a localização dos ficheiros, número de eixo etc... um trabalho repetitivo. Sendo repetitivo uma hipótese que deve surgir é se existe forma de automatizar / programar. O ISTRAM ISPOL não permite o uso de plugins (como o CAD), por tanto a via seria pela automatização dos movimentos. O pacote PyAutoGUI para Python permite esta simulação de movimentos. https://pyautogui.readthedocs.io/en/latest/ Basicamente "guiamos" o cursor para onde deve clicar e o que introdu...