|
|
Registros recuperados : 1 | |
1. | | VAZ, G. J.; VEIGA, P. H. R. da C. da; CALDAS, R. G.; VIDAL, W. C. L.; ASSIS, C. P. de; CORREA, J. L.; MOURA, M. F. Tratamento de texto extraído de livros digitais para a indexação em mecanismo de busca. Revista Ibero-americana de Ciência da Informação, v. 16, n. 2, p. 311-328, maio/ago. 2023. Biblioteca(s): Embrapa Agricultura Digital; Embrapa Agroenergia; Embrapa Unidades Centrais. |
| |
Registros recuperados : 1 | |
|
|
Registro Completo
Biblioteca(s): |
Embrapa Agricultura Digital; Embrapa Agroenergia; Embrapa Unidades Centrais. |
Data corrente: |
15/08/2023 |
Data da última atualização: |
06/02/2024 |
Tipo da produção científica: |
Artigo em Periódico Indexado |
Circulação/Nível: |
B - 3 |
Autoria: |
VAZ, G. J.; VEIGA, P. H. R. da C. da; CALDAS, R. G.; VIDAL, W. C. L.; ASSIS, C. P. de; CORREA, J. L.; MOURA, M. F. |
Afiliação: |
GLAUBER JOSE VAZ, CNPTIA; PEDRO HENRIQUE RODRIGUES DA CUNHA DA VEIGA, IZAGRO; RAFAEL GOMES CALDAS, IZAGRO; WYVIANE CARLOS LIMA VIDAL, CNPAE; CRISTIANE PEREIRA DE ASSIS, SUCOM; JORGE LUIZ CORREA, CNPTIA; MARIA FERNANDA MOURA, CNPTIA. |
Título: |
Tratamento de texto extraído de livros digitais para a indexação em mecanismo de busca. |
Ano de publicação: |
2023 |
Fonte/Imprenta: |
Revista Ibero-americana de Ciência da Informação, v. 16, n. 2, p. 311-328, maio/ago. 2023. |
ISSN: |
1983-5213 |
DOI: |
https://doi.org/10.26512/rici.v16.n2.2023.42740 |
Idioma: |
Português |
Conteúdo: |
Este trabalho apresenta uma metodologia de tratamento dos textos extraídos dos livros digitais da Coleção 500 Perguntas 500 Respostas da Embrapa a fim de que seu conteúdo possa ser indexado e acessado via um mecanismo de busca específico. A metodologia envolve a extração dos elementos essenciais dos livros, como imagens e arquivos HTML, o pré-processamento desses elementos, sua análise e edição, e a construção de componentes adequados para sua indexação. Além de um intenso trabalho de análise humana, são consideradas tecnologias como o formato Epub para livros digitais, o editor Sigil, scriptspara processamento de texto, padrões web de representação e Elasticsearch. Experimentos mostram que a metodologia viabiliza a disponibilização de textos bem formatados para sua indexação e seu uso em mecanismos de busca, propiciando uma rica experiência ao usuário, além de possibilitar a construção de novas soluções digitais. Nesse contexto, a curadoria digital é fundamental para agregar valor aos recursos digitais e atender às necessidades específicas de seus usuários. |
Palavras-Chave: |
Curadoria digital; Digital books; Digital curation; Disseminação da informação; Indexação; Indexing; Livros digitais; Processamento de texto; Recuperação da informação; Text processing. |
Thesaurus NAL: |
Information dissemination; Information retrieval. |
Categoria do assunto: |
-- |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/doc/1155913/1/AP-Tratamento-texto-2023.pdf
|
Marc: |
LEADER 02252naa a2200361 a 4500 001 2155913 005 2024-02-06 008 2023 bl uuuu u00u1 u #d 022 $a1983-5213 024 7 $ahttps://doi.org/10.26512/rici.v16.n2.2023.42740$2DOI 100 1 $aVAZ, G. J. 245 $aTratamento de texto extraído de livros digitais para a indexação em mecanismo de busca.$h[electronic resource] 260 $c2023 520 $aEste trabalho apresenta uma metodologia de tratamento dos textos extraídos dos livros digitais da Coleção 500 Perguntas 500 Respostas da Embrapa a fim de que seu conteúdo possa ser indexado e acessado via um mecanismo de busca específico. A metodologia envolve a extração dos elementos essenciais dos livros, como imagens e arquivos HTML, o pré-processamento desses elementos, sua análise e edição, e a construção de componentes adequados para sua indexação. Além de um intenso trabalho de análise humana, são consideradas tecnologias como o formato Epub para livros digitais, o editor Sigil, scriptspara processamento de texto, padrões web de representação e Elasticsearch. Experimentos mostram que a metodologia viabiliza a disponibilização de textos bem formatados para sua indexação e seu uso em mecanismos de busca, propiciando uma rica experiência ao usuário, além de possibilitar a construção de novas soluções digitais. Nesse contexto, a curadoria digital é fundamental para agregar valor aos recursos digitais e atender às necessidades específicas de seus usuários. 650 $aInformation dissemination 650 $aInformation retrieval 653 $aCuradoria digital 653 $aDigital books 653 $aDigital curation 653 $aDisseminação da informação 653 $aIndexação 653 $aIndexing 653 $aLivros digitais 653 $aProcessamento de texto 653 $aRecuperação da informação 653 $aText processing 700 1 $aVEIGA, P. H. R. da C. da 700 1 $aCALDAS, R. G. 700 1 $aVIDAL, W. C. L. 700 1 $aASSIS, C. P. de 700 1 $aCORREA, J. L. 700 1 $aMOURA, M. F. 773 $tRevista Ibero-americana de Ciência da Informação$gv. 16, n. 2, p. 311-328, maio/ago. 2023.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|