segunda-feira, 23 de maio de 2011

Conversão automatizada para eBook - Problemas e limitações

Texto original por: Vincent B. Donadio e Devorah Bloom
Traduzido por: Marcia Marmore

Neste artigo, vamos discutir sobre alguns problemas encontrados com a conversão automatizada para EPUB (formato digital padrão para eBooks) e MOBI (formato digital utilizado no Kindle, de propriedade da Amazon) em diversas fontes; as limitações da conversão automatizada BEM COMO UMA ABORDAGEM SUGERID; e dicas importantes ao se trabalhar com imagens, tabelas e fórmulas matemáticas.

Limitações
Tamanho da tela do Leitor de eBook

Quando o conteúdo está em linguagem HTML e é aberto na tela de um computador, muitas vezes, você o visualizará em tela cheia e terá a possibilidade de utilizar uma barra de rolagens para ler todo o conteúdo. Isso não ocorre com o eBook. A maioria dos leitores de eBooks posuem telas menores, com as dimensões similares a um livro convencional, enquanto outros possuem telas um pouco maiores. Em ambos os casos, o conteúdo do eBook se limita àquele tamanho de tela. Quando um livro é convertido para eBook, é necessário determinar como produzir a melhor experiência de leitura possível, sem prejudicar o conteúdo. 

Problemas com tabelas
Seu livro possui tabela? É necessário que o texto contido na tabela seja localizado pela ferramenta de busca do leior de eBooks? Se a resposta for positiva, é possível que a tabela não seja visualizada da maneira como foi diagramada, podendo gerar problemas de distorção, redimensionamento e perda de parte do texto. Nesse caso, o ideal seria converter a tabela em imagem; A função de busca seria perdida, mas preservaria a estrutura da tabela exatamente como foi diagramada. Utilizando uma conversão automatizada, a posição, o layout e o tamanho da tabela não serão visualizados corretamente. A imagem abaixo demonstra um eBook sendo visualizado por meio do iPad, a esquerda, a tabela como formato de texto; a direita, a tabela como formato de imagem. 



Imagens e suas restrições
Seu livro possui imagem? Lembre-se que qualquer leitor de eBook, que utiliza a tecnologia e-Ink, mostra todo o conteúdo do livro em tons de cinza, e quando se ajusta o tamanho da fonte no leitor, a imagem se preserva nas mesmas dimensões. Além disso, o Kindle da Amazon não oferece suporte em diversas propriedades CSS, por exemplo, a propriedade float, de posicionamento da imagem em relação ao texto; e, border, propriedade que aplica um contorno ao redor do objeto, podendo até omitir o conteúdo que utiliza esse tipo de propriedade CSS. Isso é algo que você deve sempre se atentar durante a criação ou conversão de um livro para eBook. Os softwares de conversão automatizada mantém a imagem na posição em que está, e caso essa imagem esteja ancorada no texto, pode acontecer dela aparecer no meio do parágrafo. A imagem abaixo demonstra um eBook sendo visualizado por meio do iPad (a esquerda) e por meio do Kindle (a direita). Observe como o Kindle mostra a tabela quando não reconhece as propriedades CSS discutidas anteriormente.



Fórmulas matemáticas
Vamos supor que o conteúdo do seu eBook possui fórmulas matemáticas que foram criadas por meio do MathML (aplicação XML para representar símbolos e formulas matemáticas para documentos World Wide Web).
EBooks não suportam MathML e pode simplesmente não mostrar as fórmulas matemáticas criadas por ele. O ideal, nesses casos, seria utilizar somente caracteres Unicode. Mas e se a fórmula for muito complexa para caracteres Unicode? A única maneira de incluí-las seria transformando-as em imagem. Qualquer software de conversão automatizada, converteria a fórmula da maneira que está, ou seja, como texto, e a fórmula não seria visualizada corretamente. A imagem abaixo demonstra uma fórmula matemática capturada como imagem. Observe que a fórmula não é redimensionada quando o se ajusta o tamanho da fonte do texto. 



O Segredo está na origem
Problemas com formatos de impressão

O formato original do conteúdo é um fator decisivo para avaliar a dificuldade na conversão para eBook. 
O conteúdo já está em HTML para publicação Web? Ótimo, então a conversão será menos dolorosa pois os eBooks são escritos em XHTML. Mas e se a origem do conteúdo está em PDF? PDF é um formato estático e definido por páginas, assim como deve ser em livros impressos, mas totalmente descartado nos eBooks. O conteúdo do eBook pode ser redimensionado em tempo real pelo leitor, tornando totalmente fexível e dinâmico. PDFs que possuem textos em duas colunas, são ótimos para impressão, mas essa formatação não funciona nos eBooks. 

Compatibilidade de caracteres
Os sistemas operacionais suportam um vasto grupo de caracteres, permitindo a exibição do conteúdo em qualquer idioma. Se a língua não é suportada pelo navegador, pode ser instalado um patch que habilita essa função. Por exemplo, o sistema de leitura da Adobe, que é usado pelo leitor da Sony, Barnes & Noble Nook diz que suporta o hebraico. Os caracteres em hebraico são visualizados na tela, perfeitamente, mas a ordem de leitura da língua é da direita para a esquerda e o formato não suporta esse "pequeno" detalhe, tornando a função inútil. 

Problemas comuns na conversão automatizada

A autora deste artigo, Devorah Bloom, utilizou um PDF padrão (com textos e fontes embutidas no arquivo), como teste de conversão em três sfoftwares automatizados. Os problemas mais comuns foram: estrutura não foi mantida: repetição de links para o mesmo capítulo, quebra de parágrafos inadequados, caracteres aleatórios que desaparaceram, links de nota de rodapé que foram convertidos como texto simples, junção de duas palavras e espaço extra em pontuações como apóstrofos e aspas. 



Link original: http://www.dclab.com/blog/2011/04/automated-conversion-to-ebook-problems-and-limitations/

0 Opiniões: