“Parole parole….” cantava Mina qualche anno fa. Le “parole” sono parte fondamentale della nostra vita: riusciamo ad esprimere i nostri pensieri, i nostri sentimenti, gli stati d’animo e a trasmetterli agli altri.
Perché non provare ad applicare la “matematica” alle “parole” per andare alla ricerca di informazioni utili in un testo o, meglio, in una vasta serie di testi? La risposta a questa domanda prende il nome di “text mining”, disciplina ormai affermatasi da un paio di decenni che ha come obiettivo quello di individuare delle tecniche automatiche, e quindi implementabili al computer, di “lettura intelligente” di testi: si tratta di estrarre informazioni altrimenti nascoste o di difficile individuazione quali legami e relazioni fra i vari contenuti, proponendo classificazioni o consentendo ricerche efficaci di contenuto.
Queste tecniche sono diventate estremamente importanti e utili con l’avvento, ma non solo, di Internet: la biblioteca più grande e in continuo aggiornamento di cui disponiamo.
Con questa semplice applicazione si mostra come sia possibile implementare in Scilab semplici tecniche di “data mining” per esplorare un “corpus”, vale a dire una serie di documenti di testo di varia natura, per scoprire legami e relazioni fra di essi. Nell'articolo che trovate nella newsletter EnginSoft n.4 2010 sono stati raccolti circa 250 contributi scritti in inglese apparsi sulla newsletter di Enginsoft negli ultimi anni nel tentativo di rappresentare la comunità che li ha prodotti.
Il risultato è a dir poco interessante. Ne esce uno spaccato autentico che conferma la bontà dei risultati ottenuti ed è di stimolo per l’approfondimento ulteriore di queste tecniche. “Parole parole…”
Non esitare a contattarci per qualsiasi informazione.