fbpx

Google, qualche mese fa ha lanciato BERT. Cos’è BERT? è un sistema che sfrutta l’NLP, il Natural Language Processing: il trattamento informatico del linguaggio naturale. Cosa si intende per linguaggio naturale? È la lingua che effettivamente usiamo ogni giorno: non è l’insieme delle norme e del vocabolario, ma si riferisce più a quello che ci diciamo ogni giorno e che scriviamo, per esempio in chat. Rispetto al linguaggio formale, quello naturale è molto più complesso da comprendere ed elaborare per una macchina, perché contiene tanti sottintesi, ambiguità e spesso non può essere interpretato senza contesto. E’ un compromesso tra il web semantico e la semantica della lingua.

Il percorso è stato lungo, è durato circa 20 anni durante i quali gli utilizzatori dei media hanno sostituito il linguaggio scritto, a quello formale, su internet inserendole sotto la forma di keyword per farsi comprendere dall’algoritmo.

Per realizzare questo passaggio Google si è servito delle query; letteralmente significa interrogazione, richiesta, domanda. Generalmente è una definizione che è associata ai database.

Un database è un archivio di dati strutturati in modo da facilitare la consultazione delle informazioni. Per fare un paragone al mondo reale, possiamo paragonare il database ad una biblioteca. In una biblioteca ci sono archiviati tantissimi libri e sono suddivisi, per scaffali e ripiani. Per trovare una informazione, abbiamo un bibliotecario che ha la mappa per accedere a ciascun libro. Sa di ognuno su quale scaffale e ripiano è posizionato. Poi ogni libro ha il suo indice con il quale possiamo raggiungere facilmente la pagina con l’informazione che ci interessa.

In un database le informazioni sono organizzate in una struttura logica che permette di accedere con facilità ad ogni dato.

Il modo per accedere a questi dati è la query. La query viene scritta in un linguaggio di interrogazione. Ne esistono decine ed il più famoso prende il nome di SQL. Come tutti i linguaggi, l’SQL ha una sintassi e delle regole.

Tramite queste regole è possibile ricercare fra i dati, applicando dei filtri ed ordinando i dati a piacimento.

Questa è la vera rivoluzione: Google prima trovava dei risultati possibili parola per parola, oggi invece è in grado di fornire dei risultati di più parole nelle “query”, dei sintagmi.

Google apprende cioè le relazioni contestuali tra parole in un testo fornendo dei risultati più coerenti.

Ad esempio, un utente italiano ha necessità di conoscere se per andare in Inghilterra è necessario parlare perfettamente la lingua Inglese. L’indicazione della query deve essere “to” perché ci evidenzia che è proprio lui ad andare e questo è importante per costruire la query e avere un risultato preciso.

Consigliamo di impostare articoli e blog verso persone reali e non macchine, evitate introduzioni molto lunghe e direttamente date la soluzione che si aspetta il cliente.

Click to rate this post!
[Total: 0 Average: 0]