Waarom is Google BERT interessant voor mijn bedrijf?
De taal van mensen écht leren begrijpen. Bijna twee jaar geleden kondigde Google een grote update aan in het algoritme. Deze update heet de Bidirectional Encoder Representations from Transformers, kortweg BERT. Het is een techniek om de menselijke taal beter te begrijpen. Door middel van Artificial Intelligence (AI) kan er beter worden ingeschat wat de betekenis van een woord is. Dit doet BERT door naar de woorden voor én na het woord te kijken. Vandaar de term Bidirectional, twee richtingen.
Om Google te citeren: “Als er één ding is dat we in de laatste 15 jaar hebben geleerd, is dat de nieuwsgierigheid van mensen oneindig is. We zien elke dag biljoenen zoekopdrachten, en 1% van die vragen zijn woordcombinaties die we nog nooit eerder hebben gezien. Om deze reden hebben we een manier proberen te vinden om de resultaten te verwerken van juist die vragen die we niet kunnen verwachten.”
Hoe worden de BERT-modules omgezet naar zoekopdrachten?
Het onderzoek naar de manieren waarop gebruikers zoekopdrachten uitvoeren gaat al jaren terug. Het is voor Google nog steeds lastig om alle zoekopdrachten juist te voorspellen en de meest relevante informatie te tonen. Het verbeteren van de zoekresultaten blijft dan ook altijd een doel. Maar ook het gedrag van mensen blijft daarin interessant. Vooral omdat mensen de neiging hebben om meerdere termen in één zoekopdracht te gebruiken, maar niet op zo’n manier zoals ze dit in een normale vraagstelling zouden doen.
Stel dat je normaal de vraag ‘Hoe lang moeten sperziebonen koken?’ zou stellen, dan typen mensen in de meeste gevallen ‘sperziebonen koken’ of ‘kooktijd sperziebonen’ in. Deze combinaties moet Google leren herkennen. Met behulp van BERT gaat dit weer een stukje beter. Het zijn echter niet enkel deze grotere kernwoorden die onderzocht worden. Ook de kleine opvulwoordjes als ‘voor’ en ‘naar’ hebben vaak meer waarde in een vraagstelling dan eerder werd gedacht.
Een grote doorbraak kwam na een onderzoek naar zogenaamde ‘transformers’. Dit zijn modellen die de woorden verwerken op basis van hun relatie ten opzichte van andere woorden, niet enkel als opeenvolgende woorden. BERT is daarmee in staat om de volledige context van een woord te begrijpen door de woorden te analyseren die er zowel voor als achter staan.
Hoe kan Google jouw vragen ontleden?
Kijken we naar de ranking van resultaten, dan helpt BERT het zoeken bij 1 op de 10 zoekopdrachten beter te begrijpen. Op het moment van publicatie was dit van toepassing op de Engelstalige zoekopdrachten in de Verenigde Staten. Inmiddels gaan de ontwikkeling verder binnen vele verschillende talen en landen.
Vooral vragen waarin de Engelse woorden ‘for’ en ‘to’ een grote meerwaarde hebben zijn verder ontwikkeld. Wat is de context van deze specifieke woorden in een vraagstuk? Op deze manier kunnen mensen op een natuurlijke manier zoeken naar antwoorden. Je stelt de vraag op een manier waarop je hem normaal ook zou stellen.
In de volgende voorbeelden geven we de waarde van het woord ‘to’. De zoekopdracht was bijvoorbeeld ‘2019 brazil traveler to usa need a visa’. Iemand wilde dus weten of het als Braziliaan nodig is om een visa te hebben als hij/zij naar de VS wil reizen. Voordat BERT werd geïntroduceerd, werd de waarde van het woordje ‘to’ niet herkent. Het algoritme van Google begreep de connectie tussen de woorden en het veelgebruikte (en veel verschillende betekenissen hebbende) ‘to’ niet. Hierdoor werden er ook resultaten weergegeven voor een reis de andere kant op. Dit wil zeggen, een Amerikaan die naar Brazilië wil reizen. Hierdoor kreeg degene die de zoekopdracht uitvoerde dus veel niet relevante resultaten. BERT begreep in deze zoekopdracht de grote waarde van het veelgebruikte woordje ‘to’.
Een ander voorbeeld. Iemand zoekt op ‘Can you get medicine for someone pharmacy’. Degene wil weten of het mogelijk is om medicijnen op te halen voor iemand anders, bijvoorbeeld een vriend of familielid. Eerder kreeg je resultaten over de manieren waarop je medicijnen op kunt halen bij een apotheek. Na de invoering van BERT wordt het grote belang van het stukje ‘for someone’ herkent. Er worden nu dus antwoorden / websites getoond waarop degene een antwoord krijgt op de juiste vraag. Hij weet nu of en ook hoe hij medicijnen voor iemand anders op kan halen. Met BERT leert Google in de zoekopdrachten van gebruikers de subtiele nuances van taal (her)kennen. Een manier die eerst alleen door mensen werd begrepen, maar met AI ook steeds beter door computers.
Werkt Google Search voor alle talen?
BERT wordt in de eerste instantie toegepast op Engelstalige zoekopdrachten. Simpelweg omdat dit een van de meest gebruikte talen binnen alle zoekopdrachten is. Dit wil echter niet zeggen dat er met de overige talen in de wereld niet wordt gedaan. De verbeteringen binnen de Engelse zoekopdrachten worden namelijk ook meegenomen in de overige talen. En op kleine manieren is hier al mee begonnen. Zo is er een focus geweest op de best mogelijke weergave van de kleine snippets die je ziet als feature in de zoekresultaten. Daarbij is onder andere in het Koreaans, Hindi en Portugees al erg veel vooruitgang geboekt.
Zijn de zoekresultaten betrouwbaar?
Met de invoering van BERT hoopt Google dat je eindelijk op een natuurlijke manier kunt zoeken. Veel mensen zijn gewend om in een bijna robotachtige taal op zoek te gaan naar antwoorden. Dit hoeft nu niet meer. Je typt de vraag zoals je deze in je hoofd hebt. Op een natuurlijke manier. Dit wil echter niet zeggen dat alle zoekresultaten nu direct perfect zijn. Google blijft leren, zelfs na de introductie van BERT. Zo gaf hij op de vraag ‘What state is south of Nebraska’ nog een hele tijd als beste gok een community genaamd ‘South Nebraska’. Recent kun je het juiste antwoord, Kansas, zien in de zoekresultaten.
Het begrijpen van taal is en blijft een uitdaging. Daarmee blijft het ook voor Google een motivatie om Google Search altijd te blijven verbeteren en te leren van alle zoekopdrachten die dagelijks worden uitgevoerd. En op de manier krijg jij steeds vaker en sneller het beste antwoord op jouw vragen.
eZense en zoekmachine optimalisatie
Dat AI er nu voor zorgt dat de zoekresultaten steeds beter zijn, betekent ook dat een bedrijf of organisatie de zoekmachine optimalisatie nooit op een laag pitje moet zetten. Met zoekresultaten die steeds specifieker worden, moet ook de informatie op jouw website goed afgestemd zijn op de vragen die jouw websitebezoekers hebben. Wil je hier graag hulp bij, kom dan gerust langs om een kop koffie te drinken. Onze contactgegevens via onderstaande knop te vinden.