Il web semantico e RankBrain: tendenze web per il 2017

Il web semantico e RankBrain: tendenze web per il 2017
5 (100%) 1 voto[i]

Come ormai si sa, una delle tendenze del SEO nel 2017 e per i prossimI anni sono la ricerca conversazionale, la elaborazione del linguaggio naturale e l’intelligenza artificiale (chiamato anche machine learning o apprendimento automatico). In sostanza il concetto è che i robot stanno diventando sempre più intelligenti e, nel caso di Google, stanno iniziando ad essere molto bravi a dedurre il contesto di una ricerca.

Il risultato di questi sviluppi è ciò che viene definito web semantico e l’algoritmo ad esso dedicato è Rank Brain.

Il vecchio Internet

vecchia internet

Prima che il markup semantico entrasse in scena, Internet non era altro che un insieme di file separati, collegati tramite link. Questi link che collegavano i file l’uno con l’altro, consentivano di creare vincoli semplici e navigare attraverso questi. I file erano di solito pagine web, ma potevano anche essere documenti PDF, immagini JPEG, video o altri tipi di file. Questa era la struttura di base di Internet.

I motori di ricerca utilizzavano questi link per navigare da un sito all’altro e una pagina all’altra, per monitorarle e per memorizzarle nel loro database, chiamati “indici”. Per eseguire la scansione e indicizzazione delle pagine, i motori di ricerca leggevano il codice per scoprire quali parti erano immagini, testi o video, quello che era il titolo e quello che era il corpo della pagina. Queste informazioni venivano memorizzate nell’indice ed usate per determinare la rilevanza dell’informazione in base alle ricerche degli utenti.

Naturalmente, la rilevanza non era l’unico fattore determinante per stabilire quale risultato mostrare in ogni ricerca. I motori di ricerca analizzavano anche i link che collegavano al sito web e utilizzavano i suoi vari elementi (contenuti e dominio nel quale era collocato il link, etc…) per calcolare l’autorità e la popolarità di ogni sito.

E così si giunse all’idea delle parole chiave. I motori di ricerca determinavano la rilevanza di una determinata pagina web per una chiave di ricerca in base alla frequenza di occorrenza di tali parole chiave nella pagina. Poi, usando i link che puntano alla pagina ne valutava autorità e popolaritá. Tutto questo definiva l’importanza di una pagina web per una determinata ricerca e ne stabiliva il ranking nella serp.

Si tratta di una spiegazione molto semplicistica di come funzionava, ma attualmente stiamo assistendo ad un cambiamento di paradigma. Quindi tutto questo non varrà pù… o quanto mento avrà parecchia meno rilevanza.

Diffusione del Web Semantico

web semantico

Il vecchio sistema ha funzionato molto bene, ma non è riuscito a dare risposte precice specie alle persone che erano alla ricerca di informazioni più precise, in particolare di risposte a domande.

È qui che interviene il web semantico. Ma che cos’e è il Web semantico?

Dal momento che stiamo parlando di semantica, meglio cominciare ricordando alcune definizioni del termine. In primo luogo, che cosa significa “semantico”?

La semantica è quella parte della linguistica che studia il significato delle parole, degli insiemi delle singole lettere e delle frasi e dei testi.

Pertanto, quando lo studio dei significati si applica al contenuto web, si ottiene il web semantico:

Il Web Semantico fornisce un quadro comune per la condivisione e il riutilizzo dei dati tramite applicativi, aziende e frontiere di comunicazione

Che cosa vuol dire?

In parole povere, il Semantic Web fornisce un modo per collegare le idee, chiamate anche entità e parti di dati, non solo file e pagine web. Queste connessioni permettono a programmi come i motori di ricerca, esplorare al di là delle parole scritte su una pagina ed avere accesso alle idee ed ai concetti espressi oltre le parole.

Prendiamo como esempio questa semplice frase:

   Riccardo Galli è nato a Milano ed è residente a Barcellona 

Prima del web semantico non c’era modo di aiutare i motori di ricerca a collegare le parole di quella frase con il senso della stessa: erano semplicemente una concanetazione di parole.

Ora, grazie al web semantico, c’è un modo migliore per fare questo: dati strutturati (noti anche come markup semantico), che aiuta i robot ad elaborare questa frase con vari pezzi di codice HTML e a capirne il significato:

<div vocab=”[http://schema.org/](http://schema.org/)” typof=”Person”> <span property=”name”>Riccardo Galli</span> è nato a <span property=”birthPlace” typeof=”Place” href=”https://www.wikidata.org/wiki/Q490”> <span property=”name”>Milano</span> ed è residente a <span property=”homeLocation” typeof=”Place” href=”https://www.wikidata.org/wiki/Q1492”> <span property=”name”>Barcelona</span></span> </div>

Attualmente questa frase semplice, che sia gli esseri umani che le macchine erano in grado di leggere, ma solo gli esseri umani potevano davvero capire, ha significato per entrambi.

In altre parole, il cambiamento più rilevante del web semantico e che permette passare da una rete di pagine collegate da link a una rete di dati collegati tramite significati, idee e concetti che stanno alla base di questi dati.

Ricapitolando, questo è come la vecchia rete che collega idee attraverso siti collegati:

Come ha cambiato le ricerche il web semantico

Noi non vediamo tutti i markup semantici che danno senso alle parole sulla pagina, ma questi hanno avuto e continuano ad avere un forte impatto sui motori di ricerca, creando quello che si definisce come ricerca semantica.

Hummingbird: Google motore di risposte

Nel settembre del 2013, Google annunció l’applicazione di un nuovo aggiornamento per il suo algoritmo. Questo aggiornamento, chiamato Hummingbird (colibrì in inglese, perché progettato per essere “veloce e preciso”) ha dato a Google la possibilità di applicare il web semantico alle chiavi di ricerca ed i loro risultati.

Hummingbird analizza la semantica delle chiavi di ricerca per determinare l’intenzionalità delle stesse.  Inoltre Hummingbird, grazie alla sua precisione e capacità semantica, è in grado di trovare parti di contenuti che rispondono alla richiesta formulata tramite la chiave di ricerca (interpretandone la sua intenzionalità) e li mostra all’utente direttamente nelle serp.

L’uso della parola “contenuto” in questo caso è un davvero significativo. Infatti, rispetto al vecchio sistema che mostava solo una lista di pagine che erano considerate più rilevanti per le parole chiave ricercate, Hummingbird introduce un cambio significativo: mostra direttamente nelle serp una parte di contenuti (ritenuti maggiomente rilevanti) per dare risposta alla richerca dell’utente.

serp hummingbird

Google è riuscito ad interpretare il significato della domanda (trovare la definizione di “link”) e ha trovato un paragrafo in una pagina web che risponde alla domanda mostrandolo nella serp.

RankBrain: l’essenza del motore di risposte

Il nostro obiettivo è quello di creare un Google personalizzato per ogni utente

Cit: Sundar Pichai, CEO di Google

RankBrain

Come può esattamente Google dedurre l’intenzione che sta dietro una chiave di ricerca ed individuare la parte di un contenuto che risponde a questa domanda? Grazie a RankBrain, il suo sistema apprendimento automatico e intelligenza artificiale. E con il termine sistema di apprendimento Google vuole dire sistema di machine learning.

L’apprendimento automatico non è una novità per Google: già dal 2011 con il lancio di Panda Google comición ad usare l’apprendimento automatico per milgiorare il suo algoritmo.

Panda, infatti, si basa su un algoritmo di apprendimento automatico che può imparare tramite iterazione  e stabilire la “qualità” di un sito web.

Per allenarsi ed apprendere ha bisogno di un insieme di dati e fattori del tipo sì / no. Il risultato è un algoritmo che alla fine raggiunge, possibilmente,  l’obiettivo.

Le iterazioni sono destinate a fornire costanti processi di apprendimento automatico per perfezionare e ottimizzare l’algoritmo.

Attualmente appunto per perfezionare l’algoritmo è necessario “allenare las macchina” fornendole dei dati perchè processi le iterazioni di perfezionamento. Quindi l’algoritmo rimane in un certo senso, sotto controllo umano. In un futuro, secondo quanto afferma Greg Corrado in questa intervista, l’intervento umano per l’introduzione di dati non sará più necessario e la macchina sará in grado di auto-perfezionarsi. Un algoritmo in grado di auto-perfezionarsi si definisce algoritmo di apprendimento profondo.

RankBrain non è ancora un processo di apprendimento profondo. Ha ancora bisogno di un apportazione umana per poter lavorare. Quindi come funziona?

Interpretazione del linguaggio e delle chiavi di ricerca

Citando ancora Greg Torrado ecco come funziona RankBrain (o per lo meno quel che ci è dato sapere):

Rank Brain funziona quando le persone fanno ricerche ambigue o usano espressioni colloquiali, cercando di risolvere un difetto tipico dei computer, perché non capiscono queste richieste se non le hanno mai viste prima.

RankBrain si può considerare come il primo algoritmo post-Hummingbird  100% sviluppato da Google. Anche se ci sono stati nuovi algoritmi dopo Hummingbird, come il Quality Update, questi sono stati basati su algoritmi pre-Hummingbird e/o si sono concentrati fasi diverse della ricerca.

RankBrain è quindi la risposta ad una mancanza de Hummingbird. In realtà Hummingbird è stato creato per aiutare Google a comprendere “le chiavi di ricerca con molte parole.”  Si deduce che RankBrain non è la versione 2 del colibrì, ma un nuovo algoritmo che ottimizza il lavoro di Hummingbird, aiutandolo appunto a determinare il significato di ricerche colloquiali o poco chiare.

RankBrain, come Hummingbird, cerca di generalizzare e riscrivere tali query, cercando di scoprire l’intenzionalità dell’utente dietro le stesse per formire la miglior risposta.

Per capire una query mai vista prima o non chiara, RankBrain utilizza vettori (che come detto Greg Corrado nell’intervista sono grandi gruppi di linguaggio scritta associati ad entità matematiche) e cerca di identificare relazioni semantiche tra il significato della query di ricercha ed i vettori.

Dopo aver trovato i siti web che potrebbero risolvere tale consultazione, RankBrain le recupera e le da il “permesso di procedere” fino a quando le pagine vengono visualizzate sulla SERP.

In questo senso RankBrain è certamente un “fattore di posizionamento”, perché più RankBrain considera un sito web potenzialmente adatto a rispondere a una query di ricerca sconosciuta o poco chiara, più in alto apparirà nei risultati ricerca  una determinata pagina web (pur considerando anche gli altri fattori di posizionamento applicabili).

Come possiamo ottimizzare per RankBrain?

Questa è la domanda chiave.

Beh credo sia inutile ottimizzare per RankBrain, dal momento che l’obiettivo di questo algortimo è quello di capire chiavi di ricerca che non sono comprensibili o che utilizzando espressioni colloquiali. Ovviamente non ha molto senso creare una landing page per i tipi di query che RankBrain gestisce. E sarebbe anche impossibile vista la grande varietá e la bassa ripetitività delle stesse.

Ciò che dobbiamo fare è insistere nell’ottimizzazione dei nostri contenuti utilizzando tecniche SEO semantiche per aiutare Google a comprendere il contesto dei nostri contenuti e il significato dietro i concetti stiamo scrivendo per fare in modo di essere “inclusi” in quanto più vettori di Rank Brain possibile.

2 commenti su “Il web semantico e RankBrain: tendenze web per il 2017

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *