Búsqueda y recuperación de información
MEMORIAS DE CLASE. El objetivo de este blog es aprender sobre posicionamiento web, búsqueda y recuperación de información, mediante la configuración de metadatos, aprovechando este espacio para registrar lo aprendido en la clase RECUPERACIÓN DE INFORMACIÓN, mediante la siguiente ecuación de búsqueda “Recuperación de información” AND “Universidad de la Salle” AND "Sistemas de Información y Documentación" AND “Grupo 20” AND "demanda documental"
Protocolo OAI-PMH
Open Archives Initiative - Protocol of Metadata
Harvesting
Al hablar de la iniciativa
de archivos abiertos se hace referencia al desarrollo de estándares de
interoperabilidad, con el fin de facilitar la difusión de contenidos.
Para que sea factible la interoperabilidad es
necesario tener en cuenta ciertos elementos, en primer lugar el harvester (service provider) es la aplicación
que hace peticiones en OAI-PMH, la estructura de estas peticiones es URL-base:
host y Puerto del servidor y el repositorio (data provider) que
es el acervo accesible en
la red que puede procesar peticiones en OAI-PMH.
El proceso es el siguiente
Los repositorios conservan documentos y sus
metadatos, este puede ser interrogado por el usuario. El administrador del harvester
escoge los repositorios que va a utilizar, el service provider se comunica con
dichos repositorios para importar sus registros, cuando el usuario hace sus
consultas en el service provider, pulsa el enlace del documento de su interés y
lo recupera desde el data provider.
Open Archives Initiative. Standards for Web Content Interoperability. Disponible en linea. http://www.openarchives.org/
Búsqueda de Información
Dificultad de los usuarios a la hora de buscar información
Si bien es cierto que nosotros
contamos con varias herramientas en la web para saciar nuestra necesidad de
información, también vemos que la cultura y las costumbres que surgen en las
nuevas comunidades o sociedades de información están tendiendo al facilismo y a
no profundizar en los criterios mínimos de un resultado para la satisfacción
final del usuario.
La localización de los documentos
impresos
Unas de las cosas que se miden al
momento de interpretar la información que encuentran dentro de cualquier
soporte habitualmente se espera que encuentre un título relevante a la
consulta, omite la utilización de instrumentos y herramientas de ayuda que
tiene los catálogos, no se diferencia por un momento los esquemas y las
estructuras en la cual se muestra la información, no se tiene un adicto o de
consulta dentro de lo normal que es como principio agrupa los términos más
relevantes que y dentro de la colección analizar su contexto y evaluar por
medio palabras claves la relevancia de de esa información.
Obtención de la información
Después de hacer la búsqueda a de
la información por medio de las diversas herramientas que y tantos la vuelta
como las unidades de formación o centros de documentación. La implementación de
estas herramientas para la obtención de información radica en la acumulación de
documentos en donde no se le aplica un sentido de orden lógico es información u
organización del contenido. De la misma forma el impedimento también de obtener
una buena calidad información en la no consultar otras fuentes de las cuales
hablen del tema o traten algo que tenga que ver sobre el documento investigar y
por último no se valoran los distintos niveles de información y calidad que
tiene cada documento en cuanto a su relevancia nivel de importancia y
pertinencia sobre los contenidos del mismo
Inclusion de perfiles en Google
Al aparecer la nueva red social de Google, todos los servicios que trabajan bajo esta herramienta pasan a ser complemento de las demás cuentas, para la publicación e interés de información sobre las comunidades y personajes, ahora Google permite complementar información ya sea anteriormente utilizando una cuenta como en este caso Blogger utilizarla para unificarla con la nueva red social.
ver complemento de la noticia en Genbeta
GOOGLE DESKTOP SEARCH
Google Destop Search salio al mercado en el año 2004, al igual que Orange Desktop Search y muchas otras herramientas de tipo Desktop Search- GOOGLE ESTA EN TODO, y no podía faltar en su escritorio.
Permite recuperar todo tipo de información almacenada en el pc, correos, imágenes, música. Debido a su éxito la compañía, no volverá a realizar complementos ni acompañamiento al usuario. Por esto ya no es posible descargarlo desde el sitio web. Este era el portal desde donde se podía descargar el programa, era también muy sencillo para instalar, aunque la indización es demorada y requiere que el pc no este ejecutando ningún otro proceso, si se retoma la actividad este se detiene.
HERRAMIENTAS DEL TIPO DESKTOP SEARCH
Las herramientas de tipo Desktop Search, permiten indizar los archivos del pc y realizar búsquedas de información utilizando términos relevantes que en conjunto con los operadores boleanos, resultan ecuaciones de búsqueda simples o complejas.
Permite ver el contexto de los términos, e identificar la relevancia y pertinencia de los documentos con respecto a las necesidades de información del usuario, como se muestra en la imagen.
QUÉ ES INDIZAR?
La indización es generar representaciones alternas de contenido, es una operación que consta de la organización de los datos y
archivos en donde se registra de manera ordena la información para posteriormente
crear un índice.
El indizar tiene dos variables
- La indización libre: es una lista de términos abiertos identificados por medio de un conjunto
- La indización controlada es la lista de términos cerrados ya identificados por medio de un conjunto.
La manera en que yo puedo organizar e indizar un listado de
términos cerrados controlados es por medio de vocabularios controlados, una
taxonomía o estructura de los términos y clasificación de palabras en su orden
del mas general al especifico, un tesauro, los mapas temáticos y ontologías.
DEFINICIONES BÁSICAS DE CLASE
Dato: es un valor numérico.
Información: conjunto de datos sobre un materia especifica
Conocimiento: conjunto de información que ha sido interpretada y almacenada por un proceso de introspección
Documento: "Información u objeto registrado que se puede considerar como una unidad."1
Documento electrónico: es aquel documento que necesita ser reproducida mediante una maquina, tiene una codificación digital y es almacenado en algún soporte electrónico.
Documento Digital: es la representación de información, mediante bits, es fácilmente reproducible y modificable
Documento Virtual: es un tipo de documento digital, pero este en particular se genera de acuerdo a las necesidades del cliente y se va creando por lapsos de tiempo
2. Definición.de. 2008-2011. Consultado el día 17 de octubre de 2009. Disponible en línea en: http://definicion.de/conocimiento/
La Gestión del Conocimiento
Encuentro de incubadoras de investigación y doctorados de tiempo compartido
Carlos Correa Loyola y Germania Rodriguez UTPL Ecuador
SÍNTESIS VÍDEO VISTO EN CLASE
La GC es una tecnología que permite potenciar y compartir los conocimientos en las organizaciones o universidades para este caso. Estas están obligación de difundir la información que se genera tanto al interior como al exterior de estas, aprovechando las herramientas que apoyan la GC. La gestión es organización, control, creación y difusión de un recurso, el conocimiento se generan tambien en las organizaciones. La GC, es importante porque su aplicación apoya los procesos administrativos, aprendizaje y de docencia
La responsabilidad de las universidad, desde sus origenes su objeto las incluye en la gestiòn del conocimiento. La sociedad del conocimiento: se denomina al conocimiento como un recurso, idea que surgió en las empresas. Las tics: espacio para crear y difundir conocimiento, las tics se convierten en un medio de producción.
El conocimiento tácito esta en la mente de las personas, no es sistemático y el conocimiento explicito se encuentra en los periódicos, vídeos y se puede gestionar, es sistemático.
Segùn Gibbons del Conocimiento Tacito se pasa al Conocimiento tácito colectivo después de contextualizo o al socializarlo, cuando se externaliza pasa al Conocimiento Explicito, despues al combinar varios de estos, se crea el Conocimiento Explicito Colectivo.
Las tres generaciones de la GC; la primera generación buscaba un espacio para almacenar el conocimiento; la segunda generación pretendía crear espacios para compartir; la tercera generación se preocupa por generar espacios para crear nuevo conocimiento.
Las tres generaciones de la GC; la primera generación buscaba un espacio para almacenar el conocimiento; la segunda generación pretendía crear espacios para compartir; la tercera generación se preocupa por generar espacios para crear nuevo conocimiento.
BUSCADOR DE IMAGENES
Para
encontrar el buscador de imágenes el criterio de búsqueda fue “image Search” y nos arrojo Tineye,
luego para complementar la búsqueda, el término se refino “Reverse Image Search”, los resultados de búsqueda arrojaron 3
programas como los más relevantes. El numero uno es Tineye.
Antes
de buscar las imágenes en la web es necesario guárdalas en el PC desde donde se
está trabajado.
1.
Ingresar al portal tineye.com
2.
Abrir las imágenes para ser identificadas por el buscador
3.
Encontrar la imagen
La
catedral de Salamanca encontrada en http://www.flickr.com/photos/garthof/3620901908/
SEO
Recuento de el tema expuesto por Ivan Triana
SEO: Search Engine Optimization.
Son las técnicas que permiten optimizar el diseño y desempeño de las páginas web, para facilitar la recuperación en el ambiente web.
Es un forma de dar a conocer los productos y servicios, o difundir la información para los usuarios, beneficiándolos, desde el punto de vista de la clasificación y descripción de la información digital.
Es importante tener en cuenta lo siguiente:
SEO: Search Engine Optimization.
Son las técnicas que permiten optimizar el diseño y desempeño de las páginas web, para facilitar la recuperación en el ambiente web.
Es un forma de dar a conocer los productos y servicios, o difundir la información para los usuarios, beneficiándolos, desde el punto de vista de la clasificación y descripción de la información digital.
Es importante tener en cuenta lo siguiente:
- Factores internos: dominio, html, contenido y diseño.
- Factores externos: enlaces entrantes y PageRank.
TIPS: antes de comenzar a diseñar es necesario definir el objetivo del sitio y las palabras claves, seleccionar una URL sencilla, definir los perfiles o roles de los administradores del sitio.
Procurar que el contenido sea en su mayoría textual y de contenido propio, además de definir el periodicidad. Aprovechar la capacidad de difusión de las redes sociales para enlazar los contenidos. Entre otras cosas.
Para mayor información ingresa aqui
UNA APROXIMACIÓN AL CONCEPTO DE RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE DOCUMENTACIÓN.
Resumen basado en:
UNA APROXIMACIÓN AL CONCEPTO DE RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE DOCUMENTACIÓN.
José Antonio Salvador Olivan y Rosario Arquero Avilés
Calvin N. Moores fue el primero en introducir el término information retrieval, en el año 1950, se encargó de ampliar dicho concepto, y de allí surgieron 3 interrogantes básicos: organización, búsqueda y sistematización y generación de técnicas. Jean Tague Sutcliffe identificó las variables que definen a la recuperación de información como campo de estudio; colección de documentos o bases de datos; representación de la información; usuarios; consultas y frases u oraciones de búsqueda o estrategia de búsqueda; intermediarios de búsqueda; proceso de búsqueda y evaluación de la búsqueda.
El campo de la recuperación de información es interdisciplinar, lo que hace que la diversidad de criterios e intereses sea mucho más amplia y más aún incoherencias por su carácter incipiente. Se mencionan algunos autores importantes, entre ellos, Charles Meadow, quien destaca que el proceso de recuperación se da por dos partes distintas, una es quien necesita recuperar la información y la otra es la que se preocupa por recolectarla, sistematizarla y almacenarla. Frederick W. Lancaster, inicialmente entrega una definición que refleja la recuperación de material físico, posteriormente refleja un ámbito más estrechamente ligado con la tecnología, donde interviene usuarios online y documentos electrónicos.
PREGUNTAS
1. ¿Para qué sirve la recuperación de información digital en el entorno actual de la sociedad?
Teniendo en cuenta que la sociedad actual está pasando a depender mucho más de la información digital, desde la perspectiva del acceso rápido y la automatización de la información, la recuperación de la información es un campo necesario, tanto para los usuarios como para quienes administran la información.
Lo anterior se justifica en que el universo de información digital que se produce a diario, debe tener una manera apropiada de organización, y no solo eso, sino también estar disponible para ser recuperable y aprovechable por los usuarios que la requieren, de lo contrario el producir tanta información no tendría un sentido de utlidad sino más bien de acumulación.
2. ¿Qué alcances tiene la recuperación de información para su entorno profesional, personal y laboral?
En mi lugar de trabajo la sistematización que hay para recuperar la información institucional, es muy débil. En estos momentos se está interviniendo desde cero la unidad de información y el plan a mediano plazo es que esta situación mejore, con el objetivo de ofrecerles a los usuarios internos y externos información veraz y rápida. La RI, se ha visto afectada, porque existen datos erróneos para expedientes o en el peor de los casos, algunos no están registrados.
En mi vida personal y profesional, la RI es un campo nuevo, que me ha permitido entender muchos procesos de búsqueda y evaluación de los resultados, análisis que antes no me preocupaba en lo absoluto.
3. ¿Por qué la recuperación de información no debe ser un asunto netamente técnico (tecnológico) y de ingenieros?
Porque es una campo interdisciplinar que no solo es utilizado de esta manera, sino también enriquecida, la información es universal en su naturaleza, opera en todos los campos del conocimiento, por esta razón, aquella disciplina que no necesite recuperar información, seguramente está muriendo.
Sistemas de Informacion y Documentacion
Sistemas de Recuperación de Información (SRD)
En el ámbito de la documentación se han
utilizado diferentes sistemas que permiten la recuperación de datos y de
información, tanto manual como automatizada utilizando procesadores de datos.
Es importante señalar que “los sistemas de recuperación de información
están diseñados para encontrar documentos que sean relevantes, de acuerdo con
las necesidades de información de los usuarios expresadas a través de las
condiciones de las búsquedas.”[1]
Los sistemas de recuperación de información trabajan
basados en estructuras lógicas. Félix de Moya Anegón hace una explicación en
breve sobre este tipo de sistemas y sus puntos de vista más relevantes para
entender con más claridad el concepto de un SRD, lo que compone sus términos y
las definiciones más relevantes a la hora de hacer una recuperación de
información.
“Los sistemas de recuperación de información son
estructuras de datos que están basados en una descripción de aspectos
funcionales complementarios. Partiendo de algunas definiciones básicas se
tendrá en cuenta los siguientes términos a entender.” [2]
FTRS: Free Text RetrievalSystem parte del
principio de que la información procesable por un sistema informático que se
organiza en base a documentos. La idea es que los sistemas de recuperación de
información SRI se desarrollan con el múltiple objetivo de almacenar, recuperar
y mostrar grandes cantidades de documentos, entendidos estos como secuencias
más o menos extensas de caracteres que se agrupan formando palabras, que se
agrupan en frases, que a su vez conforman párrafos, y que por fin, en número
variable componen los documentos.
Estos sistemas tienen comportamientos
funcionales y especialmente eficaces cuando tiene que generar estructuras de
acceso a los documentos que faciliten la localización de los mismos con
rapidez. La mayoría de los sistemas comerciales existentes construyen estas
estructuras de acceso a partir de las palabras que forman los documentos, proceso
que se denomina indización automática mediante palabras
claves.
La información procesada por un sistema de
recuperación de información compuesta por documentos completos o referencias
complejas, es obligado admitir que estos documentos contiene textos en lenguaje
natural, lo que abre una serie de posibilidades interesantes de las
demandas de información de los usuarios que superan las expectativas de
las operaciones booleanas.
Un sistema de información debe tener la
capacidad de medir la relación de relevancia entre la necesidad del usuario y
el contenido del documento. Establece relaciones de
equiparación.
[1] DE MOYA ANEGÓN, Felix. Técnicas Avanzadas de Recuperación
Documental. En: Manual de Ciencias de la Documentación. Madrid: Ediciones
Pirámide, 2002, p. 567.
[2] MOYA ANEGÓN, Félix de. Los Sistemas integrados de Gestión
Bibliotecaria. Madrid. Ediciones ANABAD 1995, págs. 113 y 114.
Google Fabrica de Ideas
El buscador mas famosos a nivel mundial abre sus puertas para mostrar el corazón de esta gran empresa. En el documental se ve como es Google desde las personas y las dependencias que tiene, el crecimiento exponencial que a tenido a partir de su creación, y todo el desarrollo que a logrado a través de los tiempos. Sus productos y todo los servicios que ofrece esta compañía quedan expuestos para las nuevas generaciones, sus avances y sus metas a futuro.
La cultura de Google es:
La cultura de Google es:
- Trata a los demás con respeto
- Intenta esforzarte para integrar a los nuevos miembros
- Participa y colabora con los demás, intenta ayudar a todos
- Celebrar y compartir, significara éxito y alegría
- La empatia es importante, saluda y habla con todos
- Se abierto de mente y accesible
- Comparte tu cultura y los valores con los demás
- Muestra iniciativa y esfuérzate se justo, sincero y honesto
- Relacionate con los demás trabajando en equipo
- Aporta información y participa activamente
- Se responsable, acepta la presión, intenta que la competencia sea sana
Etapas de la Recuperación de Información
"Las etapas de la recuperación documental están divididas en: pregunta, búsqueda y respuestas documentales.”[1]
Pregunta: puede ser mediante un lenguaje natural o controlado (vocabulario controlado o descriptores simples o compuestos).
Búsqueda: después de plantear la pregunta y generar la orden al sistema, el tiempo que lleve esta etapa dependerá de la complejidad de la búsqueda y las características del sistema.
Respuesta: es negativa cuando no se recupera la información que se deseaba. Estos resultados se evalúan mediante dos criterios:
[1] GIL LEIVA, Isidoro. La automatización de la Indización de Documentos. Gijón: Ediciones Trea, 1999, p 38.
La exhaustividad resulta de observar el cociente entre los documentos que se recuperaron y el total de documentos Relevantes de la colección.
La precisión es el resultado de dividir el número de documentos recuperados entre el total de documentos recuperados.
DOCUMENTO
|
RELEVANTE
|
NO RELEVANTE
|
TOTAL
|
RECUPERADO
|
a
|
b
|
a+b
|
NO RECUPERADO
|
c
|
d
|
c+d
|
TOTAL
|
a+c
|
b+d
|
a+b+c+d
|
GIL LEIVA, Isidoro. Exhaustividad y precisión. En: La automatización de la Indización de Documentos. Gijón: Ediciones Trea, 1999, p 40.
Suscribirse a:
Entradas (Atom)