Los temas del blog

Software para buscar informacion

buscarA veces necesitamos encontrar “información”. Alguien podría decir que la vida es una continua intercambio de información. Y, más allá todavía, somos información. Es un asunto devorador, como cuando se decía que todo es número. Para aliviar en algo este vértigo de extrapolaciones peligrosas, debemos definir “información”, lo cual es un asunto peligroso.

Aquí partimos de un marco educativo, necesitamos definiciones que sean adecuadas a este marco, pero también comprender definiciones que parten de otro marco de comprensión. En este sentido, creo que solo existe información en tanto es un elemento requerido para ejercer alguna actividad, es decir, “información” es la percepción o representación de un componente del entorno que es “relevante” para concluir una acción. Veamos si esta definición ayuda a comprender otras definiciones de información en otros marcos de comprensión. Desde una perspectiva matemática, la definición de “información” es: probabilidad de aparición de una señal (SHANNON).Claro que aquí se parte de un deseo de trasmitir con la mayor fidelidad posible el mensaje emitido, porque esta definición nace de un intento por evitar la pérdida de datos debido a interferencias. Claro que “información” en este sentido no es la información de la que hablamos, al parecer, como aclara Keith Devlin:

“la teoría de Shannon no trata directamente con “información” tal y como es entendida comunmente esta palabra, sino más bien con datos –la materia prima de la cual se obtiene la información. (…) En la teoría de Shannon lo que se mide es el tamaño de la señal binaria. Sin importar lo que denota esta señal. De acuerdo con la medida de Shannon, cualquier par de libros de 100.000 palabras tienen exactamente el mismo contenido de información. Esto es algo de utilidad (aunque tiende a confundir) si tu objetivo es transmitir ambos libros digitalmente por la Internet. Pero si uno es un manual de instrucciones para construir un submarino nuclear y el otro una novela sin mucho valor, nadie diría que ambos libros contienen la misma cantidad de “información”.”

Sin embargo, lo que interesa es que para esta definición la diferencia entre un dato y otro es lo que convierte a una señal en información y a otra en ruido. Y es diferencia no proviene de sus características físicas sino de un acuerdo previo acerca de lo que lo hace diferente: lo informativo es menos probable que lo no informativo porque siempre es un subconjunto de todas los datos posibles y de sus combinaciones. Como lo había destacado Chomsky hace ya mucho tiempo, lo importante son “las reglas para crear mensajes (Chomsky habla de oraciones) bien formados”, es decir, un cierto orden dentro del cual podemos empezar a actuar.

Si seguimos la pista de estas ideas, “buscar información” es equivalente a “descubir un orden”, es decir, a proyectar un orden que subyace a una masa de datos. Ejemplifiquemos esto con su disco duro, que supongo que existe, porque me está leyendo AQUÍ.

En el principio todo es CEROS y UNOS, pero eso no nos importa aquí. Empezemo por lo que tiene ante sus ojos. Usted tiene ante sus ojos una interfaz, probablemente la interfaz de un navegador. Vamos a suponer que le pido que ubique una orden para cambiar la apariencia de esta interfaz, por ejemplo, desaría eliminar o ver (depende de si está presente o ausente) lo que se llama “barra de estado”, ese espacio en la parte inferior de su navegador (y de otros programas) que le muestra información sobre lo que está haciendo. ¿Cómo encuentro la forma de hacerlo? Si usted entiende que su interfaz es una manera de ordenar los comandos y que se basa en diferenciar estos comandos por su efecto, sabría que en Firefox y en Internet Explorer eso se puede hacer entr el conjunto de acciones “VER” del menú.

Vamos más allá, esto fue fácil. Hace dos meses, escribí un texto sobre la ballenas pero lo guardé rápidamente en el primer lugar que vi, y me fui. Como no lo necesité hasta hoy, ya me olvidé donde lo guardé y con qué nombre. ¿Cómo lo encuentro? Suponiendo que no se ha borrado el disco duro, debe estar en algún sitio. En cualquier sistema operativo, existe un lugar por defecto donde se guardan los documentos. Pero no fue allí, porque ya busqué allí. El orden por defecto no me sirve. Debe existir otro orden. Puedo recurrir al programa con que lo hice, a ver si tiene un “recuerdo” de ese texto, pero no. Tengo los siguientes datos: es un archivo de texto, probablemente no tiene extensión por el apuro, no me acuerdo que nombre tiene pero contiene la palabra “ballena”, lo creé hace más de dos meses y no está en los lugares comunes. Evidentemente, no estoy buscando “información”, sino estoy buscando “el contenedor de mi información”. La información es lo que lleva ese contenedor, al que llamo archivo, así como en telecomunicaciones una onda portadora es otro tipo de contenedor. A mí, ser humano, me interesa el contenido, pero el contenido es un asunto de perspectiva (que es lo que, en esencia, postuló Shannon en su artículo genial).

Entonces, la búsqueda de información es búsqueda de contenedores de información (para diferenciar, esta acepción de “información” como algo relevante para la mente del que busca se puede denominar “sentido”, “significado” o “semántica“). Si tenemos esto bien establecido, la búsqueda de información se hace más sencilla, porque no buscamos algo más bien difuso, como una serie de “ideas”, sino que buscamos contenedores etiquetados y almacenados por alguien (o algo) por alguna razón. Para esa búsqueda, debemos pensar dónde pueden estar almacenados contenedores del tipo que buscamos, o dónde los pondría la máquina, según sus reglas pre-definidas. Es lo que se llaman “fuentes de información”. En el caso que nos ocupa, que mi texto sobre las ballenas, debe estar en alguna de las carpetas del disco duro.

Para pescar contenedores, necesito herramientas: cañas de pescar, sensores o radares, redes, etc. Es fácil en el caso de mi texto, utilizo la herramienta de búsqueda de mi sistema operativo. Y le doy toda la información que describe a mi contenedor. Este paso es importante, porque mientras más específica sea mi descripción del contenedor, la lista de los posibles candidatos serán más corta. Es decir, no tendré que mirar uno por uno para ver si es o no es. Este asunto de la descripción de mi contenedor es esencial, porque así puedo también escoger la herramienta más adecuada y obtener los mejores candidatos para mi satisfacción.

Esto nos lleva más allá. Hasta ahora he supuesto que la información que quiero encontrar es una que he perdido o que necesito para hacer algo definido. Póngamoslo más difícil. Supongamos que no sé qué quiero, exactamente. Por ejemplo, estoy buscando información que me ayude a entender las causas de las epidemias en África o de las reacciones de las personas en la primera cita de enamorados. Esto no parece ser asunto de “contenedores”, estoy buscando pensamientos, argumentos, ideas, etc. Ciertamente, para poder tener información sobre eso tengo que encontrar donde se generarían o se almacenarían contenedores sobre esos temas. Sólo que esos temas son específicos dentro de áreas del conocimiento humano. Primero tendría que ubicar a qué áreas del conocimiento humano pertenecen estos temas. Luego, buscar “fuentes de información” sobre esas áreas. Finalmente, reconocer de qué manera se almacena la información en esas fuentes de información, para que busque la herramienta que permita identificar las etiquetas de los contenedores y los encuentre. De alguna manera, siempre estamos hablando de contenedores, sea de datos (”archivos”, por ejemplo), o de información (”fuentes”) o de contenedores de contenedores (”bases de datos”, “sitios web”, “bibliotecas”, etc.).

La cosa puede ser más difícil todavía. He encontrado fuentes de información y las categorías o criterios de búsqueda que me son útiles, pero he descubierto que los contenedores son extraños, o son problemáticos o son innovadores, es decir, tienen las etiquetas por afuera, y no tengo llaves para mirar por dentro y asegurarme que está allí lo relevante o lo que me puede satisfacer. Necesito mostrarme el contenido: pueden ser textos, imágenes, sonidos.

Las herramientas que me permiten hacer todo lo anterior son mejores en cuanto cumplan:
a. Encontrar contenedores según sus características (tiempo, tamaño, formato, etc.)
b. Directorios estructurados que agrupen las “fuentes de información” según áreas del conocimiento humano, si es bajo diferentes perspectivas, mejor.
c. La certeza de que la búsqueda se realiza al interior de los contenedores, y que se provee información sobre el contenido, incluso para contenedores difíciles de analizar (como las imágenes y´los videos, por ejemplo, o los applets de java)

En internet, tenemos a los buscadores (google, yahoo, etc. y una lista aquí) pero existe toda una serie de buscadores que empiezan a ofrecer búsquedas por características específicas, por fuentes de información, etc. (más detalles)

Aunque lo me preocupa en este artículo no es la internet, sino tu disco duro. Hay software para hacer búsquedas en tu disco duro, y no sólo quedarse en la herramienta que te ofrece tu sistema operativo, herramienta que generalmente no busca en los pdf, por ejemplo, o en otros formatos, ni te permite guardar tu búsqueda o generar sumarios. Así, puedo mencionar herramientas que cumplen las características mencionadas (a), (b) y (c), además de dar otras prestaciones:

  1. Copernic Desktop Search (descripción // otra // en inglés, más detallada // una experiencia)
  2. Yahoo Desktop Search (descripción en inglés)
  3. Google Desktop Search (descripción // otra // y otra más)
  4. Regain (descripción en inglés)
  5. Windows Desktop Search (comentario)

La única que es modificable por el usuario, como software libre (¿qué es?), es Regain, pero está en inglés. La más ligera y recomendable parece ser la primera, Copernic Desktop Search.

¿Por qué buscar información en el disco duro? En el Perú, la mayoría de las escuelas no tiene internet, pero hay que aprender a “buscar información”, es esencial. Con un software como el presente, la búsqueda de información es local, además, si el docente prepara una sesión de aprendizaje, puede proporcionar “fuentes de información” y va formando un repositorio de información, de manera ordenada.

Eres bienvenido a compartir...

1 comment to Software para buscar informacion

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>