martes, 4 de septiembre de 2007

Trabajo: Pipe nº 3: Multi Search Engine AutoFeed:

Pipe nº 3: Multi Search Engine AutoFeed:



Versión compleja:

Permalink: http://pipes.yahoo.com/pipes/pipe.info?_id=YpIEjZ9R3BGiqS6s8TxBKg

Editar: http://pipes.yahoo.com/pipes/pipe.edit?_id=YpIEjZ9R3BGiqS6s8TxBKg

Versión simple:

Permalink: http://pipes.yahoo.com/pipes/pipe.info?_id=5ioD0bNR3BGdvyMy8ivLAg

Editar: http://pipes.yahoo.com/pipes/pipe.edit?_id=5ioD0bNR3BGdvyMy8ivLAg

De nuevo se han realizado dos versiones aunque la única diferencia es que la más sencilla utiliza menos agregadores y módulos que la más compleja por lo que sedescribirá sólamente la segunda.

Propósito:

Esta pipe pretende ofrecer al usuario un servicio de búsqueda sirviendose de la información de varios buscadores: Google, Yahoo, Msn Search y Lycos.

Forma de uso:

El usuario introduce de 1 a 4 palabras claves sobre las que quiera hacer la búsqueda. La pipe accede a los diferentes buscadores y recoge información de ellos que depurará, eliminando repeticiones y algunos resultados no deseados.



Implementación:

Text Imput:

Este módulo presenta en pantalla al comienzo de la consulta un recuadro en el que el usuario inserta texto. Hemos creado cuatro módulos de este tipo para que se introduzcan las palabras clave de la búsqueda.

Feed:

Excepto Yahoo, el resto de buscadores no tienen ningún módulo en esta aplicación para extraer su información, por lo que se deben buscar métodos alternativos: O bien usar una página web como feedity.com que transforma cualquier web a formato rss de forma automática; o bien encontrar un api que transforme estos servicios de búsqueda a este formato.

Usando feedity: En nuestro caso se ha utilizado para google, lycos y yahoo.

String Builder,Url Builder y Fetch Feed: Se coloca la dirección de feedity.com, seguida del buscador seguida de los parámetros necesarios para componer la url que nos alimentará el feed. Unimos los 4 módulos text imput a los lugares que les corresponde de palabras clave a sus correspondientes lugares.

La dirección generadas se acopla a un url builder que a su vez se acopla al fetch feed.

Usando un api: Se podrían utilizar al menos dos apis para este caso. Una para el buscador de msn y otra para el de google.

Google: http://www.benhammersley.com/tools/googlerss.cgi

Msn: http://beta.search.msn.com/results.aspx

No obstante, en nuestro caso se aha utilizado el api para msn (ya tenemos la búsqueda de google y msn por medio de feedity.com aunque en el caso de msn se añadían resultados interesantes de tener en cuenta por feedity que no aparecian usando la api)

Url Builder y fetch feed: Se coloca la dirección anteriormente indicada y se poner los parámetros de búsqueda y salida en formato rss.

Yahoo: Simplemente se utiliza el módulo proporcionado

Truncate y Union: Se truncan los feed que nos interesan y se unen.

Unique(x2): Se eliminan los resultados sobrantes que poseen el mísmulo título o link.

Filter(x2): Se filtran los resultados aún más:

Se bloquean todos los resultados que no contengan la primera palabra clave (se supone la más importante).

Sólo se permiten pasar los resultados en cuya descripción se encuentre alguna de las 4 palabras clave.

Content Analysis y Filter: Se pasan los resultados por un nuevo filtro antes de salir basándose en un analisis de las entradas. Esta vez no se permitirán pasar aquellos resultados en las que en su content analysis no aparezcan las dos primeras palabras claves. Estos dos módulos no se encuentran en la versión simplificada debido a que en ocasiones pueden dar resultados desfavorables.

No hay comentarios: