"Yandex" ha imparato a rispondere in modo più accurato per query complesse
Notizie Servizi Web / / December 19, 2019
Il nuovo algoritmo "Yandex" converte la richiesta di ricerca, e diversi siti sulle unità semantiche o cosiddetti vettori semantici. Una volta che un utente inserisce una query, il motore di ricerca confronta i vettori con il titolo e il contenuto dei siti potenzialmente idonei. Algoritmo Precedente "Palekh" potrebbe confrontare solo i vettori semantici della richiesta e le intestazioni, e le scansioni di pagine web "Korolev" del tutto.
"Yandex", spiega l'algoritmo "Korolev" come esempio di "Guerra e Pace". Versione precedente solo cercare di trovare un libro per titolo o una parola chiave associata con il contenuto: i nomi dei personaggi, titoli dei capitoli, e così via. Un nuovo algoritmo si legge come un romanzo e completamente capisce il significato della narrazione.
Secondo gli sviluppatori, il vantaggio principale di comprendere il significato di query che il linguaggio di ricerca diventa più umano. L'utente non può cercare un film in base al nome, ma solo brevemente descrivere la trama. Ad esempio: "un film sullo spazio in cui l'eroe stava parlando con la figlia attraverso l'orologio." Le rende conto algoritmo che c'è un film "Interstellar", dove l'eroe è Matthew McConaughey è stato nello spazio e utilizzate il tempo per comunicare con la figlia. E questo film sarà proiettato nei risultati di ricerca.
Per verificare la comprensione del significato della query si riferisce al contenuto di una pagina web, è necessario utilizzare una rete neurale su larga scala. Per la sua formazione avrà bisogno di miliardi di esempi, per cui gli utenti "Yandex" per usare i loro algoritmi di addestramento.
Se una persona viene spostata dai risultati della ricerca al sito e rimase su di essa, molto probabilmente, l'algoritmo ha funzionato correttamente. La rete neurale è addestrata su un cattivo esempio: se il sito viene immediatamente arrestato o appena perso, il sistema ricorderà. In modo che in futuro la ricerca dovrebbe funzionare meglio.