HTRC Extracted Features Dataset: corpus y datos de investigación de 13,7 millones de libros digitales abiertos | infotra
lterrat's bookmarks 2016-12-13
Summary:
"Extracted HTRC Dataset Features: corpus research data and 13.7 million digital books open"
"Este conjunto de datos proporciona a los investigadores acceso abierto a los datos extraídos de los volúmenes a texto completo de la Biblioteca HathiTrust Digital Library a una escala sin precedentes. Esta versión proporciona una manera novedosa y eficaz de extraer, generar y reutilizar los datos relevantes de un corpus de 13,5 millones de libros."
From Google Translate: "This data set provides researchers with open data volumes extracted from the full text of the Library access HathiTrust D igital Library on an unprecedented scale. This version provides a novel and effective way to extract, create and reuse relevant data from a corpus of 13.5 million books."