> Il lavoro di Paolo: http://w4.evectors.it/home
> è molto bello (anche esteticamente) ed e' esteso a molte fonti (non
> solo
> blog): credo che il target sia aziendale
Visto che sono stato evocato spiego rapidamente come funziona il nostro
sistema nel caso in cui a qualcuno potesse interessare.
Ci sono due modi in cui i post possono essere aggregati:
Il primo, attivo, prevede che l'autore alleghi al post delle parole
chiave (topics). Questo avviene mediante un apposito tool (attualmente
disponibile per MovableType e Radio UserLand) in cui l'autore può
scelgliere tra una lista di topic già esistenti e condivise dal suo
gruppo (o cloud), oppure ne può creare di nuove. Al momento queste
topic possono rientrare in 3 categorie: What (cose, progetti,
concetti), Who (persone), Where (luoghi, aziende).
Una volta selezinate vengono inserite nel feed RSS usando un protocollo
chiamato ENT (Easy News Topics - http://www.purl.org/NET/ENT/1.0/).
Il nostro software aggrega il feed RSS, trova le topic e categorizza i
post di conseguenza.
Il secondo metodo, passivo, analizza i contenuti di una serie di feed
alla ricerca di parole chiave. Usa un sistema di word stemming per
individuare le parole chiave nel testo e se trova delle corrispondenze
categorizza di conseguenza.
La particolarità del sistema è data dal fatto che la lista di parole
chiave (l'ontologia di riferimento) viene costruita bottom-up dagli
autori stessi che le creano. Di conseguenza quello che vedete su w4,
che è un sito di test, sono i contenuti di un centinaio di siti
aggregati secondo un'ontologia che è stata sviluppata da una decina di
beta testers che effettivamente creavano le topic. In altre parole quei
contenuti sono categorizzati secondo il punto di vista di questi 10.
Effettivamente K-collector (il nome del prodotto) è sviluppato per un
mercato aziendale, in cui blogger all'interno di un'azienda creano
contenuti e sviluppano un'ontologia che poi viene applicata anche a
fonti provenienti dall'esterno o a dati provenienti da altre sorgenti
(database aziendali, CRM, etc.).
HTH
paolo
PS: se avete qualche potenziale cliente per il prodotto fate un
fischio, sappiamo essere incredibilmente riconoscenti ;-)