Provided by: pdf2djvu_0.9.18.2-2build6_amd64
NOME
pdf2djvu - cria ficheiros DjVu a partir de ficheiros PDF
SINOPSE
pdf2djvu [{-o | --output} ficheiro-djvu-resultante] [opção...] ficheiro-pdf... pdf2djvu {-i | --indirect} ficheiro-djvu-índice [opção...] ficheiro-pdf... pdf2djvu {--version | --help | -h}
DESCRIÇÃO
Este programa cria um ficheiro DjVu a partir de um ou mais ficheiros Portable Document Format.
OPÇÕES
pdf2djvu aceita as seguintes opções: Tipo de documento, nome de ficheiros -o, --output=ficheiro-djvu-resultante Gera um documento agrupado de várias páginas. Escreve o ficheiro em ficheiro-djvu-resultante em vez de o fazer na saída standard. -i, --indirect=ficheiro-djvu-índice Gera um documento de várias páginas indirecto. Use ficheiro-djvu-índice como o nome do ficheiro do índice; ponha os ficheiros dos componentes no mesmo directório. O directório tem de existir e ser passível de escrita. --page-id-template=modelo Especifica o esquema de nomeação para os identificadores das páginas. Consulte a secção “SINTAXE DE LINGUAGEM” para a descrição da linguagem do modelo. O modelo predefinido é “p{page:04*}.djvu”. Por razões de portabilidade, os identificadores de páginas: • devem consistir apenas de letras ASCII minúsculas, dígitos, _, +, - e ponto, • não podem começar com um +, - ou um ponto, • não podem conter dois pontos consecutivos. • têm de terminar com a extensão .djvu ou .djv. --page-id-prefix=prefixo Equivalente a “--page-id-template=prefixo{page:04*}.djvu”. --page-title-template=modelo Especifica o modelo para os títulos das páginas. Consulte a secção “SINTAXE DE LINGUAGEM” para a descrição da linguagem do modelo. O modelo predefinido é “{label}”. --no-page-titles Não define títulos das páginas. Resolução, tamanho da página -d, --dpi=resolução Especifica a resolução desejada para resolução em pontos por polegada. A predefinição é 300 dpi. Os limites permitidos são 72 ≤ resolução ≤ 6000. --media-box Use MediaBox para determinar o tamanho da página. Por predefinição é usado CropBox. --page-size=larguraxaltura Especifica o tamanho de página preferido para largura pixeis × altura pixeis. O tamanho de pagina real pode ser alterado de modo a respeitar o rácio de aspecto e as limitações do DjVu em resolução. (Esta opção toma precedência sobre -d/--dpi.) --guess-dpi Tenta adivinhar a resolução nativa ao inspeccionar as imagens embebidas. Use com cuidado. Qualidade de imagem --bg-slices=n+...+n, --bg-slices=n,...,n Especifica a qualidade de codificação da camada de fundo IW44. Esta opção é semelhante à opção -slice do c44. Consulte o manual do c44(1) para detalhes. A predefinição é 72+11+10+10. --bg-subsample=n Especifica o rácio de sub-amostragem do fundo. A predefinição é 3. Os valores válidos são números inteiros entre 1 e 12, inclusive. --fg-colors=default Tenta preservar todas as cores da camada de fundo. Isto é a predefinição. --fg-colors=web Reduz as cores da camada de fundo para a palete web (256 cores). Esta opção não é recomendada. --fg-colors=n Usa o GraphicsMagick para reduzir o número de cores distintas na camada do primeiro plano para n. Os valores válidos são números inteiros entre 1 e 4080. Esta opção não é recomendada. --fg-colors=black Descarta qualquer informação de cores da camada do primeiro plano. --monochrome Renderiza as páginas como mapas de bits monocromáticos. Com esta opção, as opções --bg-... e --fg-... não são respeitadas. --loss-level=n Especifica a agressividade da compressão com perdas. A predefinição é 0 (sem perdas) Os valores válidos são números inteiros entre 0 e 200, inclusive. Esta opção é semelhante à opção -losslevel do cjb2; consulte o manual do cjb2(1) para detalhes. Esta opção pode ser usada apenas se a opção --monochrome estiver também activa. --lossy Sinónimo para --loss-level=100. --anti-alias Activa o anti-aliasing das font e vectores. Esta opção não é recomendada. Extracção --no-metadata Não extrai os meta-dados. Por predefinição: • As seguintes entradas do dicionário de informação do documento são extraídas: Título, Autor, Assunto, Criador, Produtor, Data de Criação, Data de Modificação. As amostras de tempo são formatadas em conformidade com RFC 3999[1], com os componentes de data e a hora separados por um único espaço. • Os meta-dados XMP são extraídos (ou criados) e actualizados em conformidade. Nota Se forem especificados múltiplos documentos, apenas os meta-dados do primeiro é tomado em conta. --verbatim-metadata Mantêm os meta-dados originais intactos. --no-outline Não extrai os contornos do documento. --hyperlinks=border-avis Torna os limites das hiperligações sempre visíveis Por predefinição, os limites das hiperligações são visíveis apenas quando o rato está sobre a hiperligação. --hyperlinks=#RRGGBB Força a cor especificada para os limites das hiperligações. --no-hyperlinks, --hyperlinks=none Não extrai as hiperligações --no-text Não extrai o texto. --words Extrai o texto. Recorda a localização de cada palavra. Isto é a predefinição. --lines Extrai o texto. Recorda a localização de cada linha, em vez de cada palavra. --crop-text Não extrai nenhum texto fora dos limites da página. --no-nfkc Não aplica a normalização NFKC[2] no texto, excepto para caracteres de Alphabetic Presentation Forms block[3] (U+FB00–U+FB4F), os quais são normalizados incondicionalmente. A predefinição é aplicar a normalização NFKC a todos os caracteres. --filter-text=linha-de-comandos Filtra o texto através da linha de comandos. O filtro fornecido tem de preservar os espaços em branco, caracteres de controle e dígitos decimais. Esta opção implica --no-nfkc. -p, --pages=alcance-de-páginas Especifica as páginas a converter. alcance-de-páginas é uma lista de sub-alcances separados por vírgulas. Cada sub-alcance é ou uma página única (ex. 17) ou uma sequência continua de páginas (ex. 37-42). Não é permitido números de página duplicados. As páginas são numeradas a partir de número 1. A predefinição é converter todas as páginas. Performance -j, --jobs=n Usa n linhas de execução (threads) para fazer a conversão. A predefinição é usar uma linha de execução. -j0, --jobs=0 Determina automaticamente quantas linhas de execução usar para fazer a conversão. Informação detalhada, ajuda -v, --verbose Mostra mais mensagens informativas enquanto converte o ficheiro. -q, --quiet Não mostra mensagens informativas enquanto converte o ficheiro. --version Mostra informação de versão e termina. -h, --help Mostra a ajuda e termina.
AMBIENTE
As seguintes variáveis de ambiente afectam o pdf2djvu em sistemas UNIX: OMP_* Detalhes no comportamento em tempo de execução com respeito a paralelismo podem ser controlados por várias variáveis de ambiente. Por favor use a especificação OpenMP API[4] como referência para detalhes. TMPDIR O pdf2djvu faz uso pesado de ficheiros temporários. Irá guardá-los num directório especificado por esta variável. A predefinição é /tmp.
SINTAXE DE LINGUAGEM
Sintaxe de modelo A linguagem de modelo é mais ou menos modelada na Sintaxe de formatação de strings de Python[5]. Um modelo é um pedaço de texto que contém campos, limitados por chavetas {}. Os campos são substituídos por valores formatados apropriadamente quando o modelo é avaliado. Além disso, {{ é substituído por uma única { e }} é substituído por uma única }. Sintaxe de campo Cada campo consiste num nome de variável, seguido opcionalmente de um shift, seguido opcionalmente de uma especificação de formato. A shift é um número inteiro assinalado (isto é, começa com um caractere + ou -. A especificação consiste de dois pontos (:), seguido de uma especificação de largura. A especificação de largura é um número inteiro decimal que define a largura mínima do campo. Se não especificada, então a largura do campo será determinada pelo conteúdo. Preceder a especificação de largura com um caractere zero (0) activa enchimento-zero. A especificação de largura é opcionalmente seguida de um caractere asterisco (*), o qual aumenta a largura de campo mínimo para a largura do conteúdo mais longo possível da variável. Variáveis disponíveis dpage Número de página no documento DjVu. page, spage Número de página no documento PDF. label Etiqueta de página (número de página lógico) no documento PDF. Esta variável está disponível apenas para títulos de páginas.
DETALHES DE IMPLEMENTAÇÃO
Algoritmo de separação de camadas A menos que a opção --monochrome seja usada, o pdf2djvu usa o seguinte algoritmo de separação de camadas nativas: 1. Para cada página, faz o seguinte: 1. "Rasteriza" a página num mapa de pixeis, na maneira usual. 2. "Rasteriza" a página em outro mapa de pixeis, omitindo os seguintes elementos da página: • texto, • imagens raster de 1 bit-por-pixel, • elementos vectoriais (excepto preenchimentos e áreas grandes). 3. Compara ambos mapas de pixeis, pixel por pixel: 1. Se as suas cores coincidirem, classifica o pixel como parte da camada de fundo. 2. Caso contrário, classifica o pixel como parte da cama de primeiro plano.
RELATÓRIOS DE BUGS
Se você encontrar um bug em pdf2djvu, por favor reporte-o no Acompanhamento de problemas[6] ou para a lista de mail[7].
VEJA TAMBÉM
djvu(1), djvudigital(1), csepdjvu(1)
NOTAS
1. RFC 3999 https://www.ietf.org/rfc/rfc3339 2. NFKC https://unicode.org/reports/tr15/ 3. Alphabetic Presentation Forms block https://unicode.org/charts/PDF/UFB00.pdf 4. especificação OpenMP API https://www.openmp.org/specifications/ 5. Sintaxe de formatação de strings de Python https://docs.python.org/2/library/string.html#format-string-syntax 6. Acompanhamento de problemas https://github.com/jwilk/pdf2djvu/issues 7. a lista de mail https://groups.io/g/pdf2djvu