Avançar para o conteúdo principal

De PDF a Lista HTML - Léxico / Glossário

De PDF a Lista HTML - Léxico / Glossário

Como transformar um PDF numa lista de Léxico ou Glossário.

Como trabalhamos para vários países, os termos técnicos variam bastante, até dentro do mesmo "idioma", seja o Castelhano/Espanhol seja o Português. Assim a minha ideia é ir montando um referencial técnico que também inclua uma lista de termos técnicos.

No exemplo que ilustro, como ponto de partida tenho o glossário dos termos ferroviários do DNIT (Brasil).


Este é um documento acessível pela net em:

https://www.gov.br/dnit/pt-br/ferrovias/glossario-de-termos-ferroviarios/glossario.pdf/view


Com esta informação base, podemos selecionar tudo e copiar para um ficheiro de texto simples:


Neste ficheiro é necessário fazer algumas edições, por exemplo apagar os números de página e cabeçalhos...


Este é um ficheiro com um conteúdo complexo demais, para por exemplo no Excel separar o texto de modo a que em cada linha (ou em duas linhas) tenha numa coluna a palavra chave e na outra o seu significado. Pode-se fazer um pouco à mão... mas como gostamos de automatizar processos e colocar a programação em tudo... é possível criar um programa para que faça esse serviço, usando entre outras funções, as expressões regulares:


Este mesmo programa grava num ficheiro de texto simples a informação tratada:


Agora já temos a informação num formato que o Excel entende onde quebrar a palavra(s) chave do significado. Qual o interesse do meter o Excel nisto? É que no Excel posso usar a fórmula de concatenação e "envolver" cada uma das colunas em código que posso transportar para uma tabela da linguagem de programação.

Como resultado final, temos uma folha com uma formatação limpa, de fácil consulta:


Obrigado.



Comentários

Mensagens populares deste blogue

C# - Viadutos Excel - ISPOL

C# - Viadutos Excel - ISPOL Ler dados do Excel e passar a informação para o ISPOL é um ganho de produtividade e organização. Desta vez, apresento uma utilidade que lê um ficheiro Excel, e transforma os dados para o menu de estruturas do ISPOL. Partindo de um Excel organizado, por pks eixos e espessuras da estrutura etc... como o seguinte: Elaborei um programita em CSharp: Este programa funciona em modo "DOS" não tem uma interface gráfica de janelas: O programa cria os ficheiros necessários, o Excel pode estar organizado por eixos, e o programa guarda um ficheiro para cada eixo: O resultado depois de abrir o ficheiro em ISPOL é o seguinte: Com as alterações ao projecto pode-se manter um ficheiro de apresentação e controlo em Excel.

Politica de privacidade das aplicações colocadas na Play Store do Google

Politica de privacidade das aplicações colocadas na Play Store do Google. As aplicações não recolhem qualquer dado do utilizador nem a armazenam ou partilham com terceiros. Não recolhem a localização nem a armazenam ou partilham com terceiros. Alguma informação sobre os utilizadores que possa chegar ao programador por via da Play Store, será tratada de acordo com toda a confidencialidade, e não fornecida a terceiros. Obrigado.

ISPOL - Areas de linhas fechadas CAD + ISTRAM

ISPOL - Areas de linhas fechadas CAD + ISTRAM Por vezes em CAD deparamos com alguns problemas em determinar as áreas de linhas que aparentemente estão fechadas ou contíguas, mas na verdade não estão. Mostro a introdução do ISTRAM num fluxo de trabalho de medição de áreas em CAD. Vista 3D do exemplo Como se mostra na primeira imagem, gerei uma rotunda de forma rápida em ISPOL. Em CAD, suponhamos que queremos medir as áreas em planta de pavimentos, passeios... Depois de uma limpeza e algum tratamento ao picar na área que aparentemente está fechada, que poderia representar a berma ou um passeio, temos um aviso comum no CAD, as linhas não têm continuidade. Neste caso em mais de uma situação, e na figura, apenas para a "área inferior". Linhas em CAD Podemos introduzir no fluxo de trabalho o ISTRAM, se a ele tivermos acesso. Podemos fazer um copy paste directo (linhas) do CAD para o ISTRAM. As mesmas linhas em ISTRAM Um primeiro passo pode ser filtrar e tratar o desenho, unindo de