Log in to see this item in other languages
Documentos duplicados y casi duplicados en el Web: detección con técnicas de hashing borroso
Duplicate and near duplicate documents in the web: detection by means of fuzzy hash techniques
[ES]La detección de los duplicados en la web es importante porque permite aligerar las bases de datos documentales y mejorar la eficiencia de los motores de búsqueda y la precisión de los análisis cibermétricos y los estudios de minería web, etc. Sin embargo, las técnicas estándar de hashing aplicadas habitualmente sólo detectan duplicados exactos, a nivel de bits, mientras que muchos de los dupli…
Creator
- Figuerola, Carlos G.
- Gómez-Díaz, Raquel
- Alonso Berrocal, José Luis
- Zazo Rodríguez, Ángel Francisco
Subject
- World Wide Web
- Detección de duplicados
- Fuzzy hashing
Type of item
- info:eu-repo/semantics/article
- Artículo
Date
- 2016-05-03T10:08:46Z
- 2016-05-03T10:08:46Z
- 2011
- 2011
- 2016-05-03
- 2016-05-03
Creator
- Figuerola, Carlos G.
- Gómez-Díaz, Raquel
- Alonso Berrocal, José Luis
- Zazo Rodríguez, Ángel Francisco
Subject
- World Wide Web
- Detección de duplicados
- Fuzzy hashing
Type of item
- info:eu-repo/semantics/article
- Artículo
Date
- 2016-05-03T10:08:46Z
- 2016-05-03T10:08:46Z
- 2011
- 2011
- 2016-05-03
- 2016-05-03
Providing institution
Aggregator
Rights statement for the media in this item (unless otherwise specified)
- http://creativecommons.org/licenses/by-nc-nd/4.0/
Rights
- info:eu-repo/semantics/openAccess
- CC Reconocimiento - No comercial - Sin obras derivadas 3.0 España
Creation date
- 2016-05-03T10:08:46Z
- 2016-05-03
Identifier
- oai:gredos.usal.es:10366/128123
- Figuerola, C. G., Gómez Díaz, R., Alonso Berrocal, J. L., Zazo Rodríguez, Á. F. (2011). Documentos duplicados y casi duplicados en el Web: detección con técnicas de hashing borroso. Scire. 17(1):49-54.
- 1135-3716
- http://hdl.handle.net/10366/128123
Format
- application/pdf
Language
- spa
Year
- 2011
Providing country
- Spain
Collection name
First time published on Europeana
- 2017-07-07T14:04:20.640Z
Last time updated from providing institution
- 2017-07-07T14:04:20.640Z