Comparación multidisciplinaria de cobertura a través de citas

Taller OAI-PMH


Protocolo OAI-PMH


Open Archives Initiative - Protocol of Metadata Harvesting

Al hablar de la iniciativa de archivos abiertos se hace referencia al desarrollo de estándares de interoperabilidad, con el fin de facilitar la difusión de contenidos.


Para que sea factible la interoperabilidad es necesario tener en cuenta ciertos elementos, en primer lugar el harvester (service provider) es la aplicación que hace peticiones en OAI-PMH, la estructura de estas peticiones es URL-base: host y Puerto del servidor y el repositorio (data provider) que es el acervo accesible en la red que puede procesar peticiones en OAI-PMH.

El proceso es el siguiente

Los repositorios conservan documentos y sus metadatos, este puede ser interrogado por el usuario. El administrador del harvester escoge los repositorios que va a utilizar, el service provider se comunica con dichos repositorios para importar sus registros, cuando el usuario hace sus consultas en el service provider, pulsa el enlace del documento de su interés y lo recupera desde el data provider.


Open Archives Initiative. Standards for Web Content Interoperability. Disponible en linea. http://www.openarchives.org/ 

Búsqueda de Información


Dificultad de los usuarios a la hora de buscar información

Si bien es cierto que nosotros contamos con varias herramientas en la web para saciar nuestra necesidad de información, también vemos que la cultura y las costumbres que surgen en las nuevas comunidades o sociedades de información están tendiendo al facilismo y a no profundizar en los criterios mínimos de un resultado para la satisfacción final del usuario.
La localización de los documentos impresos
Unas de las cosas que se miden al momento de interpretar la información que encuentran dentro de cualquier soporte habitualmente se espera que encuentre un título relevante a la consulta, omite la utilización de instrumentos y herramientas de ayuda que tiene los catálogos, no se diferencia por un momento los esquemas y las estructuras en la cual se muestra la información, no se tiene un adicto o de consulta dentro de lo normal que es como principio agrupa los términos más relevantes que y dentro de la colección analizar su contexto y evaluar por medio palabras claves la relevancia de de esa información.

Obtención de la información

Después de hacer la búsqueda a de la información por medio de las diversas herramientas que y tantos la vuelta como las unidades de formación o centros de documentación. La implementación de estas herramientas para la obtención de información radica en la acumulación de documentos en donde no se le aplica un sentido de orden lógico es información u organización del contenido. De la misma forma el impedimento también de obtener una buena calidad información en la no consultar otras fuentes de las cuales hablen del tema o traten algo que tenga que ver sobre el documento investigar y por último no se valoran los distintos niveles de información y calidad que tiene cada documento en cuanto a su relevancia nivel de importancia y pertinencia sobre los contenidos del mismo

Inclusion de perfiles en Google

Al aparecer la nueva red social de Google, todos los servicios que trabajan bajo esta herramienta  pasan a ser complemento de las demás cuentas, para la publicación e interés de información sobre las comunidades y personajes, ahora Google permite complementar información ya sea anteriormente utilizando una cuenta como en este caso Blogger utilizarla para unificarla con la nueva red social.

ver complemento de la noticia en Genbeta

GOOGLE DESKTOP SEARCH

Google Destop Search salio al mercado en el año 2004, al igual que Orange Desktop Search y muchas otras herramientas de tipo Desktop Search- GOOGLE ESTA EN TODO, y no podía faltar en su escritorio.



Permite recuperar todo tipo de información almacenada en el pc, correos, imágenes, música. Debido a su éxito la compañía, no volverá a realizar complementos ni acompañamiento al usuario. Por esto ya no es posible descargarlo desde el sitio web. Este era el portal desde donde se podía descargar el programa, era también muy sencillo para instalar, aunque la indización es demorada y requiere que el pc no este ejecutando ningún otro proceso, si se retoma la actividad este se detiene.


HERRAMIENTAS DEL TIPO DESKTOP SEARCH


Las herramientas de tipo Desktop Search, permiten indizar los archivos del pc y realizar búsquedas de información utilizando términos relevantes que en conjunto con los operadores boleanos, resultan ecuaciones de búsqueda simples o complejas. 


Orange Desktop Search, es muy sencillo de instalar, configurar y usar, es muy rápido en la indización de los archivos y solamente se necesita seguir el paso a paso de instalaciónEs gratuito y se consigue directamente en la pagina wehttp://desktop.orange.es/. Su interfaz es muy amigable para el usuario. 

Permite ver el contexto de los términos, e identificar la relevancia y pertinencia de los documentos con respecto a las necesidades de información del usuario, como se muestra en la imagen.




QUÉ ES INDIZAR?

La indización es generar representaciones alternas de contenido, es una operación que consta de la organización de los datos y archivos en donde se registra de manera ordena la información para posteriormente crear un índice.


El indizar tiene dos variables


  • La indización libre es una lista de términos abiertos identificados por medio de un conjunto
  • La indización controlada es la lista de términos cerrados ya identificados por medio de un conjunto.
La manera en que yo puedo organizar e indizar un listado de términos cerrados controlados es por medio de vocabularios controlados, una taxonomía o estructura de los términos y clasificación de palabras en su orden del mas general al especifico, un tesauro, los mapas temáticos y ontologías.

DEFINICIONES BÁSICAS DE CLASE


Carácter: se define como un signo, dígito o letra que es una de las pequeñas partes de una palabra 

Dato: es un valor numérico.

Información: conjunto de datos sobre un materia especifica

Conocimiento: conjunto de información que ha sido interpretada y almacenada por un proceso de introspección

Documento: "Información u objeto registrado que se puede considerar como una unidad."1

Documento electrónico: es aquel documento que necesita ser reproducida mediante una maquina, tiene una codificación digital  y es almacenado en algún soporte electrónico.

Documento Digital: es la representación de información, mediante bits, es fácilmente reproducible y modificable

Documento Virtual: es un tipo de documento digital, pero este en particular se genera de acuerdo a las necesidades del cliente y se va creando por lapsos de tiempo





1. Norma Iso 15489
2. Definición.de. 2008-2011. Consultado el día 17 de octubre de 2009. Disponible en línea en: http://definicion.de/conocimiento/

La Gestión del Conocimiento

Encuentro de incubadoras de investigación y doctorados de tiempo compartido
Carlos Correa Loyola y Germania Rodriguez UTPL Ecuador

SÍNTESIS VÍDEO VISTO EN CLASE

La GC es una tecnología que permite potenciar y compartir los conocimientos en las organizaciones o universidades para este caso. Estas están obligación de difundir la información que se genera tanto al interior como al exterior de estas, aprovechando las herramientas que apoyan la GC. La gestión es organización, control, creación y difusión  de un recurso, el conocimiento se generan tambien en las organizaciones. La GC, es importante porque su aplicación apoya los procesos administrativos, aprendizaje y de docencia

La responsabilidad de las universidad, desde sus origenes su objeto las incluye en la gestiòn del conocimiento. La sociedad del conocimiento: se denomina al conocimiento como un recurso, idea que surgió en las empresas. Las tics: espacio para crear y difundir conocimiento, las tics se convierten en un medio de producción.



El conocimiento tácito esta en la mente de las personas, no es sistemático y el conocimiento explicito se encuentra en los periódicos, vídeos y se puede gestionar, es sistemático.

Segùn Gibbons del Conocimiento Tacito se pasa al Conocimiento tácito colectivo después de contextualizo o al socializarlo, cuando se externaliza pasa al Conocimiento Explicito, despues al combinar varios de estos, se crea el Conocimiento Explicito Colectivo.


Las tres generaciones de la GC; la primera generación buscaba un espacio para almacenar el conocimiento; la segunda generación pretendía crear espacios para compartir; la tercera generación se preocupa por generar espacios para crear nuevo conocimiento.






BUSCADOR DE IMAGENES


Para encontrar el buscador de imágenes el criterio de búsqueda fue “image Search” y nos arrojo Tineye, luego para complementar la búsqueda, el término se refino “Reverse Image Search”, los resultados de búsqueda arrojaron 3 programas como los más relevantes. El numero uno es Tineye.

Antes de buscar las imágenes en la web es necesario guárdalas en el PC desde donde se está trabajado.

1. Ingresar al portal tineye.com



2. Abrir las imágenes para ser identificadas por el buscador



3. Encontrar la imagen


La catedral de Salamanca encontrada en http://www.flickr.com/photos/garthof/3620901908/



SEO



Recuento de el tema expuesto por Ivan Triana


SEO: Search Engine Optimization.


Son las técnicas que permiten optimizar el diseño y desempeño de las páginas web, para facilitar la recuperación en el ambiente web. 


Es un forma de dar a conocer los productos y servicios, o difundir la información para los usuarios, beneficiándolos, desde el punto de vista de la clasificación y descripción de la información digital.


Es importante tener en cuenta lo siguiente:
  • Factores internos: dominio, html, contenido y diseño.
  • Factores externos: enlaces entrantes y PageRank.
TIPS: antes de comenzar a diseñar es necesario definir el objetivo del sitio y las palabras claves, seleccionar una URL sencilla, definir los perfiles o roles de los administradores del sitio. 


Procurar que el contenido sea en su mayoría textual y de contenido propio, además de definir el periodicidad. Aprovechar la capacidad de difusión de las redes sociales para enlazar los contenidos. Entre otras cosas.

Para mayor información ingresa aqui


UNA APROXIMACIÓN AL CONCEPTO DE RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE DOCUMENTACIÓN.


Resumen basado en:
UNA APROXIMACIÓN AL CONCEPTO DE RECUPERACIÓN DE INFORMACIÓN EN EL MARCO DE LA CIENCIA DE DOCUMENTACIÓN.
José Antonio Salvador Olivan y Rosario Arquero Avilés

Calvin N. Moores fue el primero en introducir el término information retrieval, en el año 1950, se encargó de ampliar dicho concepto, y de allí surgieron 3 interrogantes básicos: organización, búsqueda y sistematización y generación de técnicas. Jean Tague Sutcliffe identificó las variables que definen a la recuperación de información como campo de estudio; colección de documentos o bases de datos; representación de la información; usuarios; consultas y frases u oraciones de búsqueda o estrategia de búsqueda; intermediarios de búsqueda; proceso de búsqueda y evaluación de la búsqueda.


El campo de la recuperación de información es interdisciplinar, lo que hace que la diversidad de criterios e intereses sea mucho más amplia y más aún incoherencias por su carácter incipiente. Se mencionan algunos autores importantes, entre ellos, Charles Meadow, quien destaca que el proceso de recuperación se da por dos partes distintas, una es quien necesita recuperar la información y la otra es la que se preocupa por recolectarla, sistematizarla y almacenarla. Frederick W. Lancaster, inicialmente entrega una definición que refleja la recuperación de material físico, posteriormente refleja un ámbito más estrechamente ligado con la tecnología, donde interviene usuarios online y documentos electrónicos.

PREGUNTAS
1. ¿Para qué sirve la recuperación de información digital en el entorno actual de la sociedad?
Teniendo en cuenta que la sociedad actual está pasando a depender mucho más de la información digital, desde la perspectiva del acceso rápido y la automatización de la información, la recuperación de la información es un campo necesario, tanto para los usuarios como para quienes administran la información.
Lo anterior se justifica en que el universo de información digital que se produce a diario, debe tener una manera apropiada de organización, y no solo eso, sino también estar disponible para ser recuperable y aprovechable por los usuarios que la requieren, de lo contrario el producir tanta información no tendría un sentido de utlidad sino más bien de acumulación.
2. ¿Qué alcances tiene la recuperación de información para su entorno profesional, personal y laboral?
En mi lugar de trabajo la sistematización que hay para recuperar la información institucional, es muy débil. En estos momentos se está interviniendo desde cero la unidad de información y el plan a mediano plazo es que esta situación mejore, con el objetivo de ofrecerles a los usuarios internos y externos información veraz y rápida. La RI, se ha visto afectada, porque existen datos erróneos para expedientes o en el peor de los casos, algunos no están registrados.
En mi vida personal y profesional, la RI es un campo nuevo, que me ha permitido entender muchos procesos de búsqueda y evaluación de los resultados, análisis que antes no me preocupaba en lo absoluto.
3. ¿Por qué la recuperación de información no debe ser un asunto netamente técnico (tecnológico) y de ingenieros?
Porque es una campo interdisciplinar que no solo es utilizado de esta manera, sino también enriquecida, la información es universal en su naturaleza, opera en todos los campos del conocimiento, por esta razón, aquella disciplina que no necesite recuperar información, seguramente está muriendo.

Sistemas de Informacion y Documentacion


Sistemas de Recuperación de Información (SRD)

En el ámbito de la documentación se han utilizado diferentes sistemas que permiten la recuperación de datos y de información, tanto manual como automatizada utilizando procesadores de datos. Es importante señalar que “los sistemas de recuperación de información están diseñados para encontrar documentos que sean relevantes, de acuerdo con las necesidades de información de los usuarios expresadas a través de las condiciones de las búsquedas.”[1]

Los sistemas de recuperación de información trabajan basados en estructuras lógicas. Félix de Moya Anegón hace una explicación en breve sobre este tipo de sistemas y sus puntos de vista más relevantes para entender con más claridad el concepto de un SRD, lo que compone sus términos y las definiciones más relevantes a la hora de hacer una recuperación de información.

“Los sistemas de recuperación de información son estructuras de datos que están basados en una descripción de aspectos funcionales complementarios. Partiendo de algunas definiciones básicas se tendrá en cuenta los siguientes términos a entender.” [2]

FTRS: Free Text RetrievalSystem parte del principio de que la información procesable por un sistema informático que se organiza en base a documentos. La idea es que los sistemas de recuperación de información SRI se desarrollan con el múltiple objetivo de almacenar, recuperar y mostrar grandes cantidades de documentos, entendidos estos como secuencias más o menos extensas de caracteres que se agrupan formando palabras, que se agrupan en frases, que a su vez conforman párrafos, y que por fin, en número variable componen los documentos.    

Estos sistemas tienen comportamientos funcionales y especialmente eficaces cuando tiene que generar estructuras de acceso a los documentos que faciliten la localización de los mismos con rapidez. La mayoría de los sistemas comerciales existentes construyen estas estructuras de acceso a partir de las palabras que forman los documentos, proceso que se denomina indización automática  mediante palabras claves.

La información procesada por un sistema de recuperación de información compuesta por documentos completos o referencias complejas, es obligado admitir que estos documentos contiene textos en lenguaje natural, lo que abre una serie de posibilidades interesantes de las demandas de información de los usuarios que superan las expectativas de las operaciones booleanas.

Un sistema de información debe tener la capacidad de medir la relación de relevancia entre la necesidad del usuario y el contenido del documento. Establece relaciones de equiparación.



[1] DE MOYA ANEGÓN, Felix. Técnicas Avanzadas de Recuperación Documental. En: Manual de Ciencias de la Documentación. Madrid: Ediciones Pirámide, 2002, p. 567.
[2] MOYA ANEGÓN, Félix de. Los Sistemas integrados de Gestión Bibliotecaria. Madrid. Ediciones ANABAD 1995, págs. 113 y 114. 

Google Fabrica de Ideas

El buscador mas famosos a nivel mundial abre sus puertas para mostrar el corazón de esta gran empresa. En el documental se ve como es Google desde las personas y las dependencias que tiene, el crecimiento exponencial que a tenido a partir de su creación, y todo el desarrollo que a logrado a través de los tiempos. Sus productos y todo los servicios que ofrece esta compañía quedan expuestos para las nuevas generaciones, sus avances y sus metas a futuro.



Google, Fabrica de ideas

La cultura de Google es:
  • Trata a los demás con respeto
  • Intenta esforzarte para integrar a los nuevos miembros
  • Participa y colabora con los demás, intenta ayudar a todos
  • Celebrar y compartir, significara éxito y alegría
  • La empatia es importante, saluda y habla con todos
  • Se abierto de mente y accesible
  • Comparte tu cultura y los valores con los demás 
  • Muestra iniciativa y esfuérzate se justo, sincero y honesto
  • Relacionate con los demás trabajando en equipo
  • Aporta información y participa activamente
  • Se responsable, acepta la presión, intenta que la competencia sea sana

Etapas de la Recuperación de Información


"Las etapas de la recuperación documental están divididas en: pregunta, búsqueda y respuestas documentales.”[1]

Pregunta: puede ser mediante un lenguaje natural o controlado (vocabulario controlado o descriptores simples o compuestos).

Búsqueda: después de plantear la pregunta y generar la orden al sistema, el tiempo que lleve esta etapa dependerá de la complejidad de la búsqueda y las características del sistema.

Respuesta: es negativa cuando no se recupera la información que se deseaba. Estos resultados se evalúan mediante dos criterios:

[1] GIL LEIVA, Isidoro. La automatización de la Indización  de Documentos. Gijón: Ediciones Trea, 1999, p 38.

La exhaustividad resulta de observar el cociente entre los documentos que se recuperaron y el total de documentos Relevantes de la colección.

La precisión es el resultado de dividir el número de documentos recuperados entre el total de documentos recuperados.

DOCUMENTO
RELEVANTE
NO RELEVANTE
TOTAL
RECUPERADO
a
b
a+b
NO RECUPERADO
c
d
c+d
TOTAL
a+c
b+d
a+b+c+d
 GIL LEIVA, Isidoro. Exhaustividad y precisión. En: La automatización de la Indización  de Documentos. Gijón: Ediciones Trea, 1999, p 40.