Calidad de las fuentes de información en la Web

Cuando se habla de fuentes de información en la web habría que distinguir entre verdaderas fuentes documentales oficiales y  los índices o indicios que sirven a los efectos de iniciar una secuencia de búsqueda.
Encontrar información confiable no es muy difícil pero que debemos establecer prioridades relativas al origen de la misma:

Sitios con extensión .edu .org .mil .gov etc. nos advierten que efectivamente estamos ante datos fiables; la cuestión se complica cuando sobre algún tema muy específico no hallar datos en esos sitios confiables.

Hoy existen las redes sociales en las cuales interactúan la mayoría de las personas y a quienes podemos indagar, obviamente que debemos certificar el origen del mismo sea Twitter o Facebook.  Un aspecto muy importante es la aparición de las redes sociales académicas en las cuales (como si fuera un buscador horizontal) podemos realizar búsquedas en revistas, papers, tesis, documentos, etc de unidades académicas de todo el mundo.


Buscar texto dentro de las páginas

Esta primera aproximación nos dará un panorama del estado de situación del tema.

Podremos encontrar desde foros de discusión, blogs, páginas y sitios en los cuales personas opinan sin límites

  • Facultades y organismos académicos
  • ONGs
  • Cámaras de empresas
  • Gremios
  • Cámaras de profesionales
  • Los diarios.

Estas pueden ser fuentes oficiales mientras sean corroboradas sus propias fuentes primarias.

La información encontrada en esto sitios, independientemente de tener un sesgo, no deja de ser la identificación de lo que es cada institución.  Por decir, si el Gobierno publica el índice de precios al consumidor, seguramente es el ínidice oficial, independientemente de las técnicas implementadas para la obtención del mismo, ese es otro motivo de investigación.

Ahora, si el diario Clarín publica índices de inflación, de pobreza, de desocupación, deberemos corroborar la técnica de muestreo o la empresa que lo llevó a cabo, pero seguramente la información deberá ser ratificada o rectificada.


Acotamiento de los buscadores

Inicialmente, buscar sitios que brinden seguridad de información certificable.  Este primerísimo comienzo es lo que en cualquier investigación debemos corroborar previamente para saber si nuestro planteamiento hipotético permite seguir avanzando.  Por ejemplo si estamos abocados en la indagación de la pobreza en determinado lugar, debemos corroborar la existencia de un sitio que contenga información estadística “oficial”.  En éste punto, el término “oficial” hace referencia a la información que describe estadísticamente lo que se dice a través de funcionarios o dirigentes. Esta distinción obedece a la aplicabilidad de los criterios utilizados en el periodismo de investigación, cuya definición formulada por Alfredo Torre “Hacer periodismo de investigación es dar una noticia sobre un hecho de interés público que alguien (Gobierno, instituciones,…) quiere que permanezca oculto porque, de producirse su publicación, se vería a sí mismo perjudicado”(1) distingue ésta práctica a la “investigación periodística” que tiene como fin elaborar un informe cuyo objetivo es simplemente divulgación sin establecer los criterios metodológicos previstos en el periodismo de investigación.

Identificar el buscador apropiado y hacer una búsqueda inicial desde el browser para saber el estado de situación a nivel de ocurrencias del tema (si hay mucha o poca información) Esta instancia puede decirnos mucho al respecto en el cual aparecerán comentarios, opiniones, repercusiones sobre lo que estamos investigando; es importante leer algunos comentarios ya que al momento nada es confiable, simplemente estamos tratando con conversaciones y no olvidemos que estamos navegando sobre la web superficial, que en este sentido, tiene las implicancias de tener algo por el cual no hicimos grandes esfuerzos por encontrar información

  • Identificar la existencia de subdirectorios en los buscadores.
  • Utilización de las búsquedas avanzadas.
  • Utilizar los operadores apropiados.
  • Establecimiento de criterios para la obtención de información…

En la prensa tradicional en áreas como la gráfica y el Periodismo de Investigación en cuanto a la búsqueda de fuentes y su posterior revisión, se toma en cuenta al menos tres
fuentes para poder publicar y cada fuente debe someterse a las pruebas de revisión.  En el cambio de lo analógico a lo digital, hay una serie de modificaciones en este aspecto, aun existe la constante revisión de las fuentes, se debe prestar atención en el rastreo e investigación del origen de la información.
Es decir con el uso de las redes sociales sumado a la viralización y el uso abusivo del copy/paste, hace a veces difícil pero no imposible indagar en su origen. Es de vital importancia cuando se publica en medios digitales, citar la fuente desde el que se obtuvo , para ir siguiendo el recorrido cual si fuera el hilo de Ariadna en el laberinto. Hay que resaltar que muchas veces los enlaces en internet suelen caerse,es por ello que también se sugiere hacer una revisión porque suelen quedar huellas en la red.
Con el surgimiento de Wileaks se puso en debate sobre el rol del periodismo y sobre los filtros que se utilizan sobretodo para la protección de fuentes en temas delicados, puesto que desde la organización liderada por Julian Assange se promueve la publicación de cables sin edición. Ref. “La explosión del periodismo” de Ignacio Ramonet.


Autentique independientemente todo lo encontrado en un sitio de redes sociales

No toda la información en los sitios de redes sociales es creada igual. La naturaleza democrática de la Web significa mucho runrún inexacto, lo que hace el papel de filtro de la organización periodística más importante que nunca. Algunos reporteros han estado demasiado ansiosos de abalanzarse sobre cualquier cosa que ven ‘online’, pero ser un buen ‘guardameta’ significa
autenticar cuidadosamente cualquier información encontrada en Twitter o en Facebook. Al igual que un dato recibido de una fuente por teléfono, es un punto de inicio para más reportería. La vieja regla de usar dos fuentes confiables todavía se aplica. Ref. Las 10 mejores prácticas para medios sociales Guías útiles para las organizaciones periodísticas
Por James Hohmann y el Comité de Ética y Valores de ASNE (American Society of News Editors) 2010-2011.


Las reglas éticas tradicionales todavía están vigentes
Los reporteros deberían actuar ‘online’ de la misma forma en que lo hacen en persona. No deberían decir nada que no desearían ver en la primera página de su periódico, y no deberían publicar nada que los avergonzaría personal o profesionalmente o a su organización. Esto parece de sentido común, pero para muchos periodistas no es obvio.
No hay razón para que las guías éticas tradicionales deban tirarse por la ventana. Ese es el más importante mensaje que debería encontrarse en las guías de medios sociales. John Robinson, el editor de The Greensboro (N.C.) News & Record, respondió un correo electrónico sobre sus guías de medios sociales de esta forma: “Tenemos un código de ética y profesionalismo que cubre nuestro comportamiento, punto. He dicho a mi personal que mi política de medios sociales es esta: no sean estúpidos”. Dijo que eso funciona para ellos…»


Asuma que todo lo que escribe ‘online’ llegará a ser público

Eso es cierto, incluso si está en una cuenta que no está explícitamente conectada con su empleador. Los parámetros de privacidad están constantemente cambiando, y lo que usted escribe un día detrás de las paredes de alguien, al día siguiente podría estar al alcance del público. O, más probablemente, podrían ser filtrados por un antagonista.
Mantener separadas las esferas ya no es posible, como podría haber sido hace unos años. Si algo va a las páginas privadas, los empleados deberían saber que necesitan estar listos para defenderlo públicamente. Algunos editores han alentado a sus empleados a considerar cuentas para sus vidas profesionales y personales. Eso es completamente aceptable, pero usted no puede esperar que una página de Facebook permanezca privada incluso con una página de fans.
En el nuevo orden mundial, más reporteros están construyendo sus propias marcas personales. Es aceptable colocar contenido personal en un foro público, pero el balance es necesario. Demasiada información personal enturbia el agua y degrada la marca.
Los reporteros que crean nuevas cuentas de Twitter deberían considerar agregar el nombre de su publicación en alguna parte del nombre del usuario o manejar eso de forma tal que sean claramente identificados como parte de un equipo…»


Use los medios sociales para relacionarse con los lectores, pero profesionalmente

Un valor importante de estas redes es que ofrecen la oportunidad de relacionarse con los lectores y las fuentes en formas que anteriormente no eran posibles. Los reporteros y editores pueden ver qué está generando alboroto, recolectar información en tiempo real durante desastres y mejorar los esfuerzos del periodismo comunitario.
Muchos ejecutivos en los periódicos ven las plataformas de medios sociales solo como una forma de transmitir lo que están haciendo. Es una forma de comunicación de dos vías. Los reporteros tienen una obligación de interactuar y responder.
Hay límites al valor de la participación. Las políticas deberían alentar a los reporteros a no engancharse en guerras con ‘trolls’* o lectores irracionales. Esto reduce la credibilidad del periódico y eleva la visibilidad del antagonista. Es subjetivo, y con frecuencia un área gris. Se requiere precaución, y los reporteros deberían ser conscientes de los peligros de la confrontación…»


Publique las noticias de última hora (exclusivas) en su sitio web, no en Twitter

Los medios sociales pueden llegar a ser un succionador de tiempo, distrayendo a los reporteros de conducir la reportería tradicional o ejecutar los deberes de su trabajo.
En un clima periodístico que valora la velocidad, hay grandes tentaciones e incentivos agregados para publicar las noticias de última hora en Twitter o Facebook en lugar de esperar para moverlo en el conducto editorial. Esto menoscaba uno de los principales valores de los medios sociales para las organizaciones periodísticas, que es llevar tráfico e incrementar el alcance del periodismo de alta calidad. Competidores han sido conocidos por acelerar primicias dando primero pistas en Twitter o acelerando la publicación de una historia si es claro en Twitter que alguien más en otro medio está avanzando con una historia similar.
La palabra operativa es balance. Hay momentos en los que es aconsejable publicar en Twitter antes de que se publique en su sitio web. Cuando tuitea sobre comunicados de prensa o desde una conferencia de prensa que está siendo televisada, por ejemplo, la precisión en la reportería no está comprometida. En noticias de última hora, hay ocasiones en que producir la información tiene prioridad sobre esperar que una historia siga el conducto editorial.
Es una buena política decirles a los empleados que deberían incluir enlaces siempre que sea posible a una historia en el sitio de su empleador. Así va a través de un editor e incrementa el tráfico. La responsabilidad de permanecer competitivos pone en los desarrolladores y administradores web la responsabilidad de reducir la cantidad de tiempo que toma poner el material ‘online’…»


Cuidado con las percepciones

Evite la aparición de conflictos de intereses en el área que cubre ofreciendo claras limitaciones de responsabilidad.
Los reporteros deberían aclarar que retuitear o enlazar elementos que podrían interesar a sus seguidores no es un respaldo al contenido. Un reportero político, por ejemplo, podría retuitear algo que un político dice para pasar junto con la noticia. Para un periodista, eso no expresa apoyo a lo que ellos tenían que decir. Para los lectores o extraños, puede no ser tan claro. Esto puede ser aclarado modificando el trino o con una simple aclaración, tal como “RT= no avalar (Retuitear no es igual a avalar).
Tenga cuidado de volverse ‘amigo’ de fuentes en Facebook. Hay algún desacuerdo entre los editores sobre si aceptar o hacer solicitudes para hacer amigos está bien. Como Facebook ha llegado a ser más ubicuo y como la connotación de la palabra ‘amigo’ se ha diluido, ser ‘amigo’ de alguien que usted cubre es más aceptable de lo que hubiera lucido hace unos años.
Hay un riesgo de que los reporteros pongan en peligro sus fuentes siendo sus ‘amigos’, pero hay también información importante que solo es visible a gente que acepta o hace tales solicitudes. Algunas redes, como Facebook, permiten que usted oculte sus listas de amigos. Esto es aconsejable, pero no debería darse por sentado y podría, de todos modos, poner fuentes en riesgo incluso si ellas no se dan cuenta. Sea reflexivo y desarrolle una aproximación coherente para tratar con estas solicitudes de amistad.
Otro problema con Facebook son los ‘me gusta’ (‘likes’) y las páginas de fans. Para ver el video de Tim Pawlenty en el que anunciaba que estaba creando un comité exploratorio para aspirar a la presidencia —una importante historia noticiosa— los reporteros tenían que hacer clic en el botón de ‘me gusta’, que entonces generaba una entrada en su propia página de Facebook para aquellos que les gustaba Pawlenty. Pero no había otra opción. Sarah Palin con frecuencia es noticia en Facebook, como otro ejemplo, y la gente necesita firmar en su página de fans para que sus mensajes aparezcan en sus canales de noticias.
Dado que unirse a grupos es cada vez más inevitable, trate de conseguir el balance cuando se una a ellos. No se una solo a grupos o páginas que se inclinen en una dirección ideológica. Trate de manejar la configuración de privacidad hasta donde sea posible para evitar dar la impresión de que usted es miembro de un grupo o tiene intereses en conflicto…»


Autentique independientemente todo lo encontrado en un sitio de redes sociales

No toda la información en los sitios de redes sociales es creada igual. La naturaleza democrática de la Web significa mucho runrún inexacto, lo que hace el papel de filtro de la organización periodística más importante que nunca. Algunos reporteros han estado demasiado ansiosos de abalanzarse sobre cualquier cosa que ven ‘online’, pero ser un buen ‘guardameta’ significa
autenticar cuidadosamente cualquier información encontrada en Twitter o en Facebook. Al igual que un dato recibido de una fuente por teléfono, es un punto de inicio para más reportería. La vieja regla de usar dos fuentes confiables todavía se aplica.
Otro factor al usar información vista en los sitios de redes sociales: es importante conseguir el consentimiento si se usa material de páginas de personas donde ellas tendrían una razonable expectativa de privacidad. En una noticia de última hora, con la pesada presión del tiempo límite para la publicación y el deseo de conseguir tanta información como sea posible, es tentador sacar detalles de la página de Facebook de alguien y tirarlos en la Web. Esto es arriesgado porque la gente miente o desinforma.
Usted tiene que asegurarse de que está buscando en la página de la persona sobre la que está escribiendo, y de que hay una obligación de ser cuidadoso con la información que está siendo seleccionada. Las figuras son víctimas fáciles, pero los editores tienen que tener cuidado extra con menores que no podrían darse cuenta de que reporteros adultos merodearán sus páginas…»


Siempre identifíquese como un periodista

El anonimato no es más aceptable en foros ‘online’ de lo que es en un evento político u otro escenario tradicional de información. Uno puede permanecer en sitios públicos ‘online’, pero no debería hacerse pasar por otra persona para obtener acceso a material que no es público. Cuando piden a alguien información, especialmente si planean publicarla, se espera que los reporteros se identifiquen abiertamente.
Las organizaciones periodísticas deberían pedir a sus empleados ser transparentes cuando usen las redes sociales. No pretenda ser alguien más para obtener información. El Denver Post tajantemente pide a sus reporteros identificarse como empleados del periódico en sus perfiles, por ejemplo. Estar al descubierto es tan importante como siempre.
Nunca asuma que algo que usted intenta para permanecer anónimo se mantendrá en esa forma en un foro ‘online’. Una desagradable reseña en Yelp (Nota del traductor: sitio web), escrita bajo un seudónimo privado, podría terminar siendo enlazada a quien la publicó originalmente y su organización periodística a través de una no necesariamente predecible serie de eventos…»


Las redes sociales son herramientas, no juguetes

De la misma forma en que lo harían el día de los inocentes, algunos periodistas han publicado información falsa en redes sociales. Ya que los periodistas representan a sus organizaciones, no deberían abandonar su papel como narradores de la verdad cuando están en Twitter o Facebook. Eso es porque incluso cuando algo parece estar autenticado, es importante aclarar de dónde venía cuando se distribuye. Parte de la cultura de las redes sociales es dar crédito a la fuente original. Los reporteros deberían dar siempre crédito a los blogueros o reporteros ciudadanos o reporteros de las organizaciones de medios tradicionales cuando esté garantizada su identidad, porque es lo correcto y ofrece seguridad…»


Sea transparente y corrija errores donde los cometa

Admita rápidamente cuando esté equivocado. Los errores ocurren, lo mismo que en el impreso. Pero existen tentaciones en los medios sociales que los pueden complicar. De acuerdo con la idea de que los mismos estándares que se aplican a la información tradicional rigen para la información hecha en Internet, los periodistas deben entender que son responsables de
ser transparentes y abiertos sobre sus errores. También deberían ser rápidos para ofrecer nueva información que desafía o pule lo que han publicado en el sitio. Esto es apropiado para medios en tiempo real, donde los lectores no necesitan esperar a ver las correcciones hasta el día siguiente…»


Herramientas de redes sociales

Como herramientoa de reportería: Las redes sociales son tan ubicuas que los periodistas que insistan en evitarlas probablemente perderán buenas oportunidades y grandes historias. Para ese fin, alentamos el uso responsable de tales redes para hacer conexiones, encontrar ideas de historias y localizar fuentes.
• Hacer conexiones claves es bueno. Y los periodistas deberían asegurarse de que están usando un arreglo completo de herramientas para recolectar información, incluyendo entrevistas cara a cara y reportería de calle. Sitios como Facebook y MySpace no son un substituto para las entrevistas actuales por teléfono o en persona, u otros medios de recolección de información y no deberían ser el único medio de confirmación.
• Es trabajo de los periodistas considerar la variedad y diversidad de fuentes usadas para las historias, y lo mismo aplica a fuentes encontradas en sitios de redes sociales. Considere si encontrar fuentes de esta manera lo lleva a un predominio de gente de cierta raza, grupo étnico, convicción política, sistema de creencias, visión del mundo, edad o ingreso.
• La información recolectada usando redes sociales debería ser independientemente confirmada en el “mundo real”. Verifique que la persona que ha contactado online es de hecho la persona que usted piensa. Entreviste fuentes en persona o por teléfono siempre que sea posible. Como siempre, verifique afirmaciones y declaraciones.
• Asegure un consentimiento informado. Es fácil para las fuentes malinterpretar sus intenciones. Identifíquese a sí mismo como reportero de The Roanoke Times/roanoke.com y notifique a la fuentes que usted está recolectando información de ellas para su publicación.
• Consulte al editor antes de usar redes sociales para contactar niños y otros que pueden no entender completamente las consecuencias de hablar a un periodista.
• Antes de usar fotos copiadas o descargadas de redes sociales, tenga cuidado de verificar que son lo que usted piensa. Todos los otros estándares para fotografías usados en nuestras publicaciones naturalmente aplican.
• Sea transparente con la audiencia así como con las fuentes. Déjelos saber cómo hace usted contacto con la gente, en qué contexto recolecta la información y cómo la verifica (o no la verifica). Si alguna información es obtenida de una página de Facebook, por ejemplo, diga eso…»

 Sea exacto en titulares y sumarios de sus historias cuando los publique. Es fácil exagerar o simplificar en extremo

• Sea claro. Si usted no es un buen titulador, busque entrenamiento.
• Evite la expresión de opiniones, o cualquier otra cosa que pudiera ser interpretada como tal en el contenido que usted está publicando. Naturalmente, la escritura crítica, tal como la de reseñas de música o cine son una excepción.
• No publique material colectado para una historia, pero que no ha sido publicado en el periódico o en el roanoke.com. Esto incluye fotografías, citas, información sobre cómo una historia fue reporteada o cualquier otra forma de material descartado. El periódico es el titular de los derechos de autor de este material y no está en la obligación de defenderlo a usted si surgen dudas o reclamos de difamación.
• Siempre incluya un enlace a lo que está promoviendo y asegúrese de que funciona.
• Los editores y el personal online deberían identificar el trabajo que debería estar marcado y promovido con una base institucional…»


Fuentes de consulta,  referencias y prácticas

 Las 10 mejores prácticas para medios sociales Guías útiles para las organizaciones periodísticas. Por James Hohmann y el Comité de Ética y Valores de ASNE, (American Society of News Editors) 2010-2011

¿Cómo proceder fácticamente con estas estrategias?
Ref: el libro «Herramientas digitales para periodistas» de Sandra Crucianelli

Como acceder a fuentes de información geolocalizadas
«…Otra opción, claro, es acceder mediante el link directo:
http://www.google.com/advanced_search
Cada país tiene su propio enlace para la búsqueda avanzada.
Para Argentina será:
http://www.google.com.ar/advanced_search
Para Brasil:
http://www.google.com.br/advanced_search
Y así respectivamente con la extensión de cada país.
Los resultados serán más geolocalizados dependiendo de la posición geográfica del buscador.
Una vez que se accede a la búsqueda avanzada, se pueden usar varios filtros: por palabras
(primer cuadro de texto), por frase exacta (segundo cuadro de texto) o incluso excluir palabras
(cuarto cuadro de texto), como se ve en esta captura de pantalla…»

«…También es posible seleccionar por tipo de formato, cuando se quieran encontrar documentos
en lugar de sitios web. Frecuentemente, los mejores documentos se encuentran en PDF; y las estadísticas, en Excel. Los informes más actualizados pueden encontrarse en la selección del ‘en el último año’ como se ve en la captura de pantalla inferior ; en realidad los resultados más actualizados en la búsqueda avanzada se encuentran con la opción ‘las últimas 24 horas’, ideal para cuando se quiere monitorear un hecho en tiempo real. También en la búsqueda normal (o primaria), que está más a la mano de todos, hay una opción con los resultados más recientes, que se corresponde con la ‘última hora’…»

«…También se pueden delimitar las búsquedas por dominios, sin olvidar que para ello, no se deben colocar las tres w. Una forma de hacerlo es indicando solo la extensión. Por ejemplo, buscando solo en dominios tipo .gov.ar,con lo cual estaríamos buscando documentos sobre un determinado tema a nuestra elección dentro de sitios gubernamentales argentinos.
Para ello, basta con colocar dentro del cuadro de texto la opción tal como se ve en esta captura de pantalla:
Sin recurrir a la búsqueda avanzada, desde el panel principal de Google, (mucho más ágil de ejecutar en el día a día) los mismos resultados se obtienen mediante el uso de los operadores de Google.
Por ejemplo, el ejemplo anterior es cuestión de buscar así: palabras clave site:gov.ar, o palabras clave site:mintic.gov.co(para buscar dentro del sitio).
O un documento en PDF: palabras clave filetype:pdf
Ahora, si lo que se pretende es buscar específicamente dentro de un sitio del que se conoce su dominio completo, basta con indicarlo.
Por ejemplo, si este fuera el Ministerio de Economía argentino, bastará con indicar : mecon.gov.ar, sin las tres w, tal como visualiza en la captura de pantalla:
Restringir las búsquedas por dominio es una técnica muy efectiva a la hora de recuperar documentos gubernamentales, en especial en PDF y Excel que no aparecen a simple vista desde la home page del sitio. Por supuesto, para ello, hay que valerse de la búsqueda avanzada no, no es necesario como lo expliqué arriba… está a la mano debajo de la casilla de búsqueda de google (captura de pantalla debajo de este párrafo) y dentro de los primeros cuadros de texto colocar las opciones de búsqueda por tema a nuestra elección, usando los filtros adecuados…»

¿DuckDuckGo?
El tema de la privacidad en Internet se ha vuelto una preocupación constante. Por eso, la aparición de DuckDuckGo(https://duckduckgo.com) ha traído un alivio a aquellos que
desean navegar anónimamente. El buscador asegura que no envía sus búsquedas a otros sitios ni guarda ningún tipo de información personal. La calidad de los resultados es, en español, bastante generalista: incluye redes sociales y resultados básicos, pero es una opción por tener en cuenta si lo que se desea es navegar de forma anónima y sin la intromisión de enlaces patrocinados.

Buscadores académicos
Google Scholar Académico(scholar.google.es) sigue siendo el recuperador de documentos científicos por elección. Es fácil de configurar e incluso se pueden crear alertas para recibir vía correo electrónico los enlaces más recientes por tema o localización geográfica.
Otras opciones interesantes son:
Scirus(www.scirus.com): herramienta de investigación científica con más de 575 millones
de artículos indexados en el último recuento, que permite buscar no sólo contenido, sino
también páginas científicas, cursos, material de servidores, patentes y repositorios institucionales universitarios.
Dialnet(dialnet.unirioja.es): Dialnet (Difusión de Alertas en la Red) es uno de los mayores
portales bibliográficos de acceso libre, cuyo principal objetivo es dar mayor visibilidad a la
literatura científica hispana. Recopila y facilita el acceso a contenidos científicos, principalmente
a través de alertas documentales. Además, cuenta con una base de datos exhaustiva,
interdisciplinaria y actualizada, que permite el repositorio de documentos sobre variados temas de interés periodístico.
Refseek(www.refseek.com): es un motor de búsqueda que tiene como objetivo hacer que la información académica sea de fácil acceso para todos. Busca en más de mil millones
de documentos, incluyendo páginas web, libros, enciclopedias, revistas y periódicos. Ofrece una cobertura integral sin la sobrecarga de información de un motor de búsqueda general,
permitiendo el aumento de la visibilidad de la información académica e ideas convincentes que a menudo se pierden en el embrollo de los enlaces patrocinados y resultados comerciales.
Buscadores por formato
Los buscadores por formato siguen siendo una opción interesante a la hora de recuperar documentos importantes, en especial porque, por ejemplo, sabemos que muchos documentos
gubernamentales, jurídicos o académicos se encuentran con frecuencia en el formato PDF. Varios que enumeré en la primera edición de este libro ya no están en línea, por lo que
conviene listar nuevamente los recursos existentes.
Todos tienen un funcionamiento similar. No son demasiado sofisticados y responden al criterio de la frase exacta si se colocan palabras entre comillas, lo cual es bueno si se busca por localización geográfica o por nombre de personas. Entre los más usados al día de hoy se pueden listar :
Scribd(http://es.scribd.com): repositorio de documentos en PDF agrupados que se considera como una de las bibliotecas digitales más grandes del mundo. El usuario puede publicar, descubrir y leer libros y documentos de todo tipo en un navegador web (incluso en el de cualquier dispositivo móvil). Millones de libros y documentos han sido publicados en Scribd por parte de la comunidad, y el contenido llega a una audiencia de 100 millones de personas en todo el mundo cada mes.
PDFGeni (www.pdfgeni.com): busca documentos, libros electrónicos (e-books), catálogos yrevistas en PDF.
PDF Search Engine(ebooks-search-engine.com): solo válido para libros en formato PDF.
DocJax(www.docjax.com): contiene casi 3 millones de e-books gratuitos, en formatos PDF, Excel (XLS), PowerPoint (PPT) y Word (DOC).

Searching
Brupt(brupt.com): similar al anterior, contiene documentos en cuatro formatos: PDF, Excel, PowerPoint y Word. Busca en Word de manera predeterminada. No contiene e-books.
FreeFullPDF(www.freefullpdf.com): contiene 80 millones de publicaciones científicas en PDF, entre artículos, patentes, ‘posters’ y tesis doctorales.
Docstoc(www.docstoc.com): repositorio de documentos en múltiples formatos. Alberga más de 20 millones de recursos, incluyendo vídeos de expertos. Ofrece un énfasis en documentos profesionales y de negocios…»

Extracción de datos:
El ejemplo más sencillo es el de obtener del contenido de una tabla alojada en un documento
PDF, cuando lo que se requiere para procesar los datos es disponerlos en una hoja de cálculo
de Excel. Para lograr ese objetivo, hay recursos sofisticados y software de descarga pagos, pero también hay una larga lista de herramientas en línea y sin costo alguno.
1- A veces copiar y pegar funciona, pero otras veces no, y hay que recurrir a conversores
como Zamzar(www.zamzar.com), que es gratuito y no requiere suscripción. Zamzar
convierte archivos de un formato a otro solamente indicando una dirección de correo
electrónico. Al enviar el pedido, el usuario recibirá por correo el archivo en el formato
deseado.
2- No olvide que tablas y gráficos pueden estar subidas a la Web en formato de imagen, por
lo que siempre conviene buscar en plataformas como Flickr Google Imágenes.
En estos casos se recurre a programas de reconocimiento óptico. Uno sencillo y

La Web Profunda:
Terreno fascinante para la captura de datos sin necesidad de descarga es Free OCR(www.free-ocr.com). Para usarlo, suba su documento en formato fotográfico y siga las indicaciones paso a paso. La extracción es automática e instantánea Otras sugerencias:
1- Explore Google Public Data: www.google.com/publicdata/directory:
Permite consultar, examinar y compartir grupos de datos gráficos animados y mapas que muestran diferentes variables bajo estudio. Las fuentes son organismos internacionales
como el Banco Mundial y oficinas estadísticas de distintas partes del mundo.
2- Del mismo modo, Google Books(books.google.com/books?hl=es) podría contener información de interés, ya que permite filtrar los resultados por fecha.
3- Rescate datos que pudieron haber sido eliminados de la Web pero quedaron en la versión ‘caché’ o como capturas de pantalla. Use Archive(www.archive.org) a través
de su máquina del tiempo (The Way Back Machine).
4- Recorte dominios para llegar al Index o al directorio madre de un sitio, cuando esto
sea posible: Por ejemplo este enlace: msal.gov.ar/htm/site/personal/rcpc_0.html, puede
convertirse en este otro: msal.gov.ar/htm/site/personal/(solo se eliminó desde la derecha
hacia la izquierda, la porción de la URL entre la última barra invertida).
Agrego el excelente sitio http://ebiblioteca.org/ contiene extensa biblioteca en diversos formatos

9- Monitoree las redes sociales(documentos compartidos, comentarios) usando
herramientas como SocialMention(www.socialmention.com)Who’s Talking
(http://www.whostalkin.com/)
 o buscadores en tiempo real de Twitter como
Twitterfall(www.twitterfall.com), en el que se puede seleccionar una búsqueda
georreferenciadao bien buscar por nombre propio(estas dos opciones son más específicas)
o por tema (menos específica). Los mensajes suelen contener enlaces con información
que no siempre es indexada por los motores de búsqueda.
Herramientas de la Internet Profunda para tener en cuenta Infomine(infomine.ucr.edu): En este proyecto participan un grupo de bibliotecas en los Estados Unidos, entre ellas las de California y Detroit. ‘Información en las minas’ recopila documentos en bases de datos, revistas y libros electrónicos, anuncios, listas de correo, catálogos en línea, artículos, directorios de investigadores y muchos otros recursos.
Puede buscar por categorías de temas y es posible ajustar aún más su búsqueda usando las opciones de búsqueda. No solo es un motor de búsqueda de la Web Profunda, sino también un punto de parada para una gran cantidad de información de referencia.
IMDB(www.imdb.com): Internet Movie Database es una base de datos de cine. Posee desde filmes hasta noticias, críticas, avances y perfiles de celebridades.
Complete Planet(www.completeplanet.com): Se define como una de las puertas de
entrada a las miles de bases de datos que aloja la Web Profunda. Es un directorio de bases de datos. El rastreo se hace a través de diferentes áreas temáticas, como energía, agricultura,
alimentos o medicamentos, y de ese modo se pueden encontrar resultados que no son accesibles para los motores de búsqueda convencionales.
CyberCementerio(govinfo.library.unt.edu): Es un repositorio de sitios web
gubernamentales de Estados Unidos que ya han dejado de funcionar, pero que puede ser de
utilidad si se están investigando historias del pasado, del mismo modo que recurriendo a www. archive.org

DeeperWeb(www.deeperweb.com): Para usuarios de Google, esta herramienta está basada en el concepto de nube de etiquetas. Devuelve los resultados en categorías: general, blogs, noticias, académicas, etc.
National Security Archive(www2.gwu.edu/~nsarchiv/search.html): Sigue siendo para los periodistas una fuente inagotable de recursos. El Archivo de Seguridad Nacional, con sede en Estados Unidos, tiene varias metas: opera como un centro de periodismo de investigación, un instituto de investigación sobre asuntos internacionales, una biblioteca y un archivo de losdocumentos desclasificados de Estados Unidos: de hecho posee la colección de documentos no gubernamentales más grande del mundo, según el diario ‘Los Angeles Times’. Lista de más recursos en: http://deep-web.org/how-to-research/deep-web-search-engines/

Lo más fascinante del tema que nos ocupa es que, pese a las estimaciones, nadie conoce con exactitud la dimensión real de la Web Profunda.
Sería imposible cuantificarla porque se trata de un espacio dinámico, en variación permanente. Esto nos abre un terreno inexplorado, como una tierra virgen, al que con paciencia y perseverancia, podemos llegar como conquistadores de nuevos mundos.
A veces me preguntan por qué me gusta tanto buscar información en la Web. Yo respondo que no busco cualquier información, sino la que presumo, y es muy difícil de encontrar. Lo tomo como un reto, un desafío. Es como sumergirse en el fondo del mar para buscar una perla.
Nadar sobre la superficie es gratificante, pero localizar un tesoro de datos, invisible a los ojos de la mayoría, me atrae mucho más.
Luego, exponer ese descubrimiento, contextualizado, bajo la luz de la opinión pública, me parece la mayor gratificación que un periodista puede obtener.
Un ejercicio de Rastreo Digital Sistematizado
Este es un ejercicio de rastreo, que se puede aplicar sistemáticamente cada 12 o 24 horas. Los pasos son:
PRIMERA FASE
1- Ingrese a la búsqueda avanzada de Google coloque su posición geográfica. Si la ciudad es Bogotá, por ejemplo, irá al primer cuadro. Si es Lima, deberá poner Lima Perú en el primer cuadro (porque Lima tiene otro significado si no se añade el país). Una opción que yo utilizo en este caso es poner en el cuadro de la frase exacta ciudad de Lima. Si es ‘La Paz’, irá al segundo cuadro de texto (para frase exacta) y además, deberá colocar Bolivia en el primero. Si la ciudad tiene un nombre compuesto que no tiene correlato para otra posición geográfica en otro país, no es necesario que consigne el país.
2- Sobre la base de su posicionamiento geográfico, marque la opción ‘formato’ en PDF y en la selección de ‘fecha’, marque la opción ‘durante la última semana’. Si los resultados fueran demasiados, analice los primeros 50 enlaces o intente acotando la fecha a ‘durante las últimas 24 horas’.
3- Tras su análisis, vea si encontró algún documento funcional a la construcción de una crónica. ¿Hay algo que le sirva?

Vaya a Google Noticias y escriba su selección entre comillas, ejemplo ‘ciudad de Lima’,
marcando en las herramientas de búsqueda, para las últimas 24 horas.
¿Algo nuevo, algo que no conocía?

La Web Profunda:Terreno fascinante para la captura de datos

Sin salir de su posicionamiento geográfico, vaya a la pestaña superior Web(extremo superior
izquierdo) y despliegue la opción ‘Última hora’. Analice resultados.
¿Hay algo interesante, algo que desconocía?

Sin salir de su posicionamiento geográfico, ingrese a la pestaña superior Blogs y marque la opción desplegada ‘Últimas 12 horas’. Analice resultados.
¿Alguna información relevante?

Hay más fases para seguir, que forman parte de una segunda etapa, pero a esta altura, con estos cuatro pasos, es probable que hayan encontrado al menos algún enlace que contenga un documento o referencia que les sirva de base o, en su defecto, de disparador para construir una noticia.
Este es un ejemplo de una entrada escrita a partir de un documento encontrado en las primeras cuatro fases de rastreo y complementada con nuevos enlaces, obtenidos tras los datos encontrados en el primer documento:
www.sololocal.info/noticias/1-de-bahia/1273-concesion-de-la-terminal-el-intendente-quiere-ateba-en-bahia-blanca.html

No es necesario que escriban crónicas, solamente que reporten su hallazgo a través de un enlace y comenten en no más de cuatro líneas para qué les puede servir su contenido.

Este ejercicio no debería tomar más de una hora.

Herramientas digitales para la búsqueda de personas:

Todos estos buscadores son similares y casi siempre remiten a enlaces de perfiles en redes
sociales, blogs, videos, artículos publicados, etc.
pipl.com/
www.datosde.com/
www.webmii.es/
www.spokeo.com/

Gumersindo Lafuente (2012) sostiene que “hemos pasado en muy poco tiempo del periodista que vigilaba al poder, al periodista que es vigilado por la gente”. Periodistas y
lectores, añade, tienen acceso a las mismas herramientas de comunicación, de manera que “las audiencias han tomado la palabra y el poder, al menos una parte de él, y se
hacen oír con tanto ímpetu que no sólo están poniendo en cuestión la industria de los medios, también la manera de ejercer el periodismo” (ibíd.)Gumersindo Lafuente (Madrid, 30 de agosto de 1957) es un periodista español. Precursor del periodismo digital de habla hispana ha liderado varios de los grandes proyectos de información on-line en castellano.

Autopresentación:

http://www.academia.edu/

http://www.aacademica.com/

Repositorios digitales

http://repositorios.mincyt.gob.ar/recursos.phpFuentes Información