Tirei um monte de fotos e depois preparei diversas páginas HTML usando apenas algumas fotos.
Para economizar disco eu quiz remover todas as fotos que não foram usadas nas páginas HTML.
Como eu resolvi o problema?
Todas os arquivos de fotos eram do tipo D*.JPG. Se você usar algum comando como:
grep JPG *.html >lixo
Já vai coletar todas as linhas dos arquivos html que incluem a string "JPG". Exemplo real de algumas linhas de lixo:
DCP00634.JPG
Depois é necessário trabalhar com o arquivo "lixo" para extrair os "D*.JPG" e gerar os comandos.
Como fazer isso?
Eu coloquei todas as fotos em um diretório reservado e resolvi copiar para um outro diretório somente as fotos que eram referenciadas pelas páginas HTML.
Eu fiz o seguinte: criei um script Perl que gerou um outro script para o bash contendo comandos copy.
O script Perl "tirafoto.pl" :
Uso do script Perl:
Veja o começo do arquivo movefoto.
Agora é só executar este arquivo com um comando como:
Se você tiver uma outra resposta para o desafio (infelizmente não recebi nenhuma) mande para mim. Conforme for, estarei publicando também a sua resposta.
^JC