Avançar para o conteúdo principal

De PDF a Lista HTML - Léxico / Glossário

De PDF a Lista HTML - Léxico / Glossário

Como transformar um PDF numa lista de Léxico ou Glossário.

Como trabalhamos para vários países, os termos técnicos variam bastante, até dentro do mesmo "idioma", seja o Castelhano/Espanhol seja o Português. Assim a minha ideia é ir montando um referencial técnico que também inclua uma lista de termos técnicos.

No exemplo que ilustro, como ponto de partida tenho o glossário dos termos ferroviários do DNIT (Brasil).


Este é um documento acessível pela net em:

https://www.gov.br/dnit/pt-br/ferrovias/glossario-de-termos-ferroviarios/glossario.pdf/view


Com esta informação base, podemos selecionar tudo e copiar para um ficheiro de texto simples:


Neste ficheiro é necessário fazer algumas edições, por exemplo apagar os números de página e cabeçalhos...


Este é um ficheiro com um conteúdo complexo demais, para por exemplo no Excel separar o texto de modo a que em cada linha (ou em duas linhas) tenha numa coluna a palavra chave e na outra o seu significado. Pode-se fazer um pouco à mão... mas como gostamos de automatizar processos e colocar a programação em tudo... é possível criar um programa para que faça esse serviço, usando entre outras funções, as expressões regulares:


Este mesmo programa grava num ficheiro de texto simples a informação tratada:


Agora já temos a informação num formato que o Excel entende onde quebrar a palavra(s) chave do significado. Qual o interesse do meter o Excel nisto? É que no Excel posso usar a fórmula de concatenação e "envolver" cada uma das colunas em código que posso transportar para uma tabela da linguagem de programação.

Como resultado final, temos uma folha com uma formatação limpa, de fácil consulta:


Obrigado.



Comentários

Mensagens populares deste blogue

C# - Viadutos Excel - ISPOL

C# - Viadutos Excel - ISPOL Ler dados do Excel e passar a informação para o ISPOL é um ganho de produtividade e organização. Desta vez, apresento uma utilidade que lê um ficheiro Excel, e transforma os dados para o menu de estruturas do ISPOL. Partindo de um Excel organizado, por pks eixos e espessuras da estrutura etc... como o seguinte: Elaborei um programita em CSharp: Este programa funciona em modo "DOS" não tem uma interface gráfica de janelas: O programa cria os ficheiros necessários, o Excel pode estar organizado por eixos, e o programa guarda um ficheiro para cada eixo: O resultado depois de abrir o ficheiro em ISPOL é o seguinte: Com as alterações ao projecto pode-se manter um ficheiro de apresentação e controlo em Excel.

Politica de privacidade das aplicações colocadas na Play Store do Google

Politica de privacidade das aplicações colocadas na Play Store do Google. As aplicações não recolhem qualquer dado do utilizador nem a armazenam ou partilham com terceiros. Não recolhem a localização nem a armazenam ou partilham com terceiros. Alguma informação sobre os utilizadores que possa chegar ao programador por via da Play Store, será tratada de acordo com toda a confidencialidade, e não fornecida a terceiros. Obrigado.

ISPOL CAD CSharp - Fila de estratigrafia nos perfis longitudinais

ISPOL CAD CSharp - Fila de estratigrafia nos perfis longitudinais No corrente exercício, foi necessário agilizar o desenho do texto das camadas nos perfis. fonte : https://www.youtube.com/watch?v=PBEX1SFv8hk O modo de apresentação dos perfis quilométricos para a SCiT assim o requere. O trabalho de copiar a informação da tabela de geotécnia de Curva Masa para o desenho, se feito de forma manual consome bastante tempo. E como estas tabelas costumam sofrer alterações ao longo do projecto é um ponto a favor de alguma programação. Esta poderia ser apenas a transformação de dados do Excel para o ISPOL. O objectivo final é transformar a tabela acima, numa informação gráfica como o exemplo genérico seguinte: No menu de Tablas de Textos do ISPOL, encontrei uma limitação de número de caracteres, o que impede a copia directa de informação do Excel para o ISPOL. Assim pensei em adicionar algo mais ao planeado na programação. No ISPOL coloca-se um marcador para cada intervalo, que depois em CAD se