Sasuke Semantic Classifier

SasukeClassifier RICERCARE SIGNIFICATI NEL MARE DI DOCUMENTI

Ogni giorno crescono esponenzialmente la quantità di documenti che produciamo e che trattiamo. Il nostro lavoro diventa sempre più dipendente da quello che è stato scritto da altre persone, e quindi abbiamo la necessità di poter velocemente recuperare quei documenti che ci sono necessari. Però quando andiamo a cercarli, facciamo una grande fatica, spesso troviamo cento cose dove solo una è quella veramente interessante per noi.

Classificare e ricercare documenti sulla base del significato è praticamente impossibile con gli attuali motori di ricerca. La ragione di questi limiti è data dalla loro natura sintattica, ovvero operare ricerche basate esclusivamente sui termini e non sui concetti. La naturale soluzione a questi problemi è quindi quella di introdurre nelle tecniche di ricerca proprio le componenti semantiche, che ci apriranno ad una diversa modalità molto più simile al nostro modo umano di cercare.

Ogni termine che noi cerchiamo è infatti al centro di una ricca rete di relazioni che ci permetto di comprendere meglio ciò di cui stiamo parlando e di affinare le ricerche dei documenti. Questa rete ha un nome, rete semantica od anche ontologia, con l’obiettivo proprio di tracciare tutte le relazioni utili a definire un concetto

IL CLASSIFICATORE

Quello di cui abbiamo bisogno è uno strumento che possa sfruttare una rete di concetti, appunto un’ontologia, che sia relativa ai termini di nostro interesse per ricercare appropriatamente i documenti e per classificarli in categorie, ovvero categorizzarli e classificarli.

In base a questo lavoro di estrazione, sarà possibile:

  • classificare documenti;
  • classificare interi siti Internet ed intranet;
  • eseguire ricerche su base semantica;
  • attribuire metadati di classificazione in  modo automatico (ad es. riempiendo il campo “parole chiave” di un sistema documentale);
  • lavorare nativamente su diverse lingue contemporaneamente (multilinguismo) trovare documenti simili;
  • suddividere documenti in base alle competenze professionali.

Ontologie

 

UNO STRUMENTO FLESSIBILE

Il classificatore Sasuke permette di risolvere tutti i punti indicati e in particolare:

  • consente di classificare grandi quantità di documenti;
  • consente la classificazione di singoli documenti;
  • permette di definire un’ontologia in modo del tutto personalizzabile;
  • è nativamente multi-lingua, consentendo quindi la classificazione su più lingue;
  • contemporaneamente a partire dalla stessa ontologia;
  • permette il facile recupero delle informazioni;
  • la classificazione può avvenire su qualsiasi concetto dell’ontologia o soltanto sui concetti più importanti;
  • si integra facilmente con altre applicazioni;
  • incorpora un web spider capace di analizzare interi siti;
  • usa gli standard internazionali di riferimento, in particolare del web semantico: OWL (Ontology Web Language, per la definizione delle ontologie), SKOS (Simple Knowledge Organisation Systems, per la gestione di tesauri multilingue), ADNOM (comitato di standardizzazione delle ontologie per le Pubbliche amministrazioni: CEN/ISSS WS/ADNOM – European Network for Administrative Nomenclature);
  • può usare le ontologie WordNet con decine di migliaia di concetti;
  • ha un motore di ricerca semantica basato su sfaccettature.

Sasuke  si integra facilmente con qualsiasi applicazione del cliente, o può essere usato da remoto, in modalità SaaS – Software as a Service.
Lavora su architettura J2EE – Java 2 Enterprise Edition su tutti i più diffusi sistemi operativi (Windows, Linux, Mac OS X etc.) e application server (Tomcat, Oracle etc.).  E’ interfacciabile tramite API  Java o con web services del tutto generalizzati richiamabili da applicazioni C, C++, PHP etc. Il formato delle ontologie è lo standard W3C OWL Web Ontology Language.
Evodevo lavora in partnership con il Cliente:

  • personalizza Sasuke sulle applicazioni aziendali, interfacciandosi con le applicazioni già esistenti (sistemi documentali, CRM, siti web, Content Manager…);
  • crea ontologie  personalizzate;
  • supporta il Cliente nell’analisi e nella messa in esercizio.

 

Evodevo Sasuke Classifier è stato integrato con due nuovi moduli complementari:

  • Modulo FM: prevede l’integrazione con il modulo di Facility Management (FM) ref2space di IdeaRe;
  • Modulo dati generici: prevede l’accesso a maggiori fonti dati, incluso Facebook.

I moduli sono stati finanziati da un progetto finanziato CoResearch della Regione Lazio.

 

loghi