LSI: Indexación de Semántica Latente

Cuando hace un tiempo comentaba sobre los avances en “La Red Semántica” y los problemas que enfrentaba este tipo de iniciativas, surgió el tema de las taxonomías y el “como estructurar la infromación” para hacer que tengan sentido las cadenas de datos y datos.

Ahora, vía un blog que no guarde el link, veo un paper de Clara Yu, John Cuadrado, Maciej Ceglowski y J. Scott Payne aborda el tema de la indexación semántica aplicada a los motores de búsqueda en Internet con tres “simples” objetivos:

1. Queremos que nos dé TODA la información relevante disponible sobre nuestro tema.
2. Queremos que nos dé SOLAMENTE la información que es relevante para esa búsqueda.
3. Queremos que la información esté ordenanda de alguna forma, para poder ver los resultados más relevantes primero

Esto no es “simple” sino el objetivo ideal de todo motor de búsqueda, lo que en algun momento prometió Inktomi, luego Pagerank y así sucesivamente.

De hecho, la compra de Applied Semantics en Abril del 2003 demostró que lograr esto es central en la estrategia de los motores de búsqueda.
Continue reading “LSI: Indexación de Semántica Latente”

Tarjetas por voz

Los sistemas de identificación e identidad para productos y personas ya están llegando a niveles “extremos” ahora, BeepCard presenta una tecnología para tarjetas de crédito con una clave por voz!

La tarjeta no autorizará transacciones a no ser que escuche la clave del dueño autorizando la compra; en la misma tarjeta incluirán un micrófono, un parlante, una batería y un chip de reconocimiento de voz, aunque esperan prevenir fraudes creo que sólo servira para evitar “robos de identidad”. Entre esto y los RFiD tags en los productos, la paranoia sobre la privacidad tiene cada vez más facetas.