L’evoluzione nell’ambito della ricerca semantica è nata quando sono stati introdotti gli algoritmi di classificazione, allo scopo di potenziare la ricerca dando alla macchina un set di informazioni aggiuntive, necessarie a comprendere la sfera semantica di un contenuto.
La tecnica più accreditata è quella di considerare i singoli elementi testuali in uno spazio vettoriale, per sfruttare a pieno la scienza degli algoritmi di clustering e similarità. L’algoritmo attualmente più utilizzato è il k-NN (K-nearest neighbors) utilizzato per classificare gli oggetti sulla base della loro similarità o associazione a quelli più vicini.
In Opensearch 2.4.0 vediamo quindi l’introduzione di un plugin (Neural Search) che permette di eseguire ricerche semantiche automatiche sui loro documenti, migliorando i risultati della ricerca con significati e contesti aggiuntivi forniti da modelli di apprendimento automatico (ML). Affrontiamo questo aspetto in maggiore dettaglio nel paragrafo seguente.