Hoe werkt een juridische zoekmachine?
Als juridische professional wil je in korte tijd de juiste informatie vinden om je casus te onderbouwen. Een juridische zoekmachine kan je helpen om snel te vinden wat je zoekt. Maar hoe werkt zo’n juridische zoekmachine? En kan Google de rol van juridische zoekmachine goed vervullen?
Hoe werkt een zoekmachine: ranking mechanismen en factoren
Elke zoekmachine maakt gebruik van een index; een gestructureerde manier om informatie op te slaan, zodat de zoekmachine voor elke zoekopdracht snel kan bepalen welke documenten relevant zijn. Om vervolgens de volgorde te bepalen waarin de resultaten weer worden gegeven kijkt de zoekmachine onder andere welke zoektermen terugkomen in de titel of tekst van een bron. In sommige gevallen is de publicatiedatum ook een belangrijke factor.
In de praktijk is het echter lastig om alleen op basis van deze criteria het juiste resultaat aan te bieden, zeker als er sprake is van een grote dataset. Er zijn immers vaak meerdere bronnen die dezelfde zoekwoorden bevatten. Een intelligent algoritme is dus onontbeerlijk.
Google als juridische zoekmachine?
Een zoekmachine als Google gebruikt honderden variabelen om te bepalen welk resultaat het meest relevant is voor de gebruiker en maakt daarbij ook gebruik van machine learning technieken. Je zou dus denken dat Google de juiste plek is om in korte tijd de juiste juridische bronnen te vinden.
Miljarden bronnen
In de praktijk pakt dat vaak anders uit. Google slaat elke website die het vindt op in de index en heeft dus toegang tot miljarden bronnen. Voor het juridische domein betekent dit dat er niet alleen primaire bronnen getoond worden, maar ook secundaire of helemaal irrelevante bronnen. Zoek in Google naar het Haviltex-arrest en de zoekmachine komt met ruim 21.000 bronnen terug waaronder de website rechtspraak.nl, maar ook websites van advocatenkantoren of websites voor rechtenstudenten. Soms vind je ook websites die gericht zijn op de consument en geen waarde toevoegen voor de juridische professional.
Wanneer je “HR” intypt in Google zul je vooral bronnen vinden over Human Resources of een HR ketel in plaats van bronnen van de Hoge Raad. Ook is er het probleem van niet gevalideerde bronnen: in principe kan iedereen een website opzetten en deze vindbaar maken in Google. Als je net niet de juiste zoekopdracht invoert, wordt het dus zoeken naar een speld in een hooiberg.
Actualiteit
Ook kijkt Google vaak op een andere manier naar actualiteit. In het algemeen geldt dat hoe langer een bron in Google zit, hoe meer deze waard wordt en hoe beter deze bron getoond wordt. Pas als Google erin slaagt te begrijpen dat er een bepaalde actualiteit in de zoekopdracht schuilgaat, gaat het recente bronnen tonen. Hierdoor kan het gebeuren dat je vaak verouderde bronnen vindt.
Commercie
Tot slot kijkt Google in grote mate naar verwijzingen van andere websites; hyperlinks. Hoe meer relevante websites naar een bepaalde website verwijzen, hoe relevanter deze geacht wordt te zijn. Omdat bij zo’n grote zoekmachine commerciële belangen meewegen, zijn er veel websites die betalen om verwijzingen te verkrijgen met als doel hoger te ranken. Hierdoor kan het in theorie voorkomen dat juridische websites ondergesneeuwd raken ten gunste van juridische websites die commercieel actief zijn.
Deze factoren tezamen kunnen ertoe leiden dat je in Google heel veel informatie vindt, maar vaak net niet waar je als juridisch professional naar op zoek bent.
Legal Intelligence als juridische zoekmachine
Een juridische zoekmachine heeft als voordeel dat het enkel gevalideerde en gecontroleerde bronnen bevat. Dat scheelt in de praktijk al enkele tienduizenden resultaten. Maar dan speelt nog steeds de vraag wat de juiste ranking is van bronnen. Hoe krijg je het juiste resultaat bovenaan de lijst met suggesties? Dit is een van de vragen waar Legal Intelligence constant onderzoek naar doet met als doel verbeteringen door te voeren.
Impactrelevantie
In het verleden kende het algoritme van Legal Intelligence bijvoorbeeld veel punten toe aan actualiteit. Hierdoor werden recente bronnen goed getoond, maar kwamen klassieke leerstukken vaak niet goed in beeld. Daarom heeft Legal Intelligence de rankingfactor impactrelevantie ontwikkeld en toegevoegd aan het algoritme.
Deze rankingfactor houdt rekening met de wisdom of the crowd: hoe vaak wordt een bron geciteerd en hoe vaak wordt er in Legal Intelligence op een bepaalde bron geklikt. In de juridische wereld publiceert de doelgroep vaak niet zelf, daarom kijkt Impactrelevantie ook naar klikken van juridische professionals: welke artikelen worden het meest aangeklikt. Voor het algoritme is dat een teken dat het artikel relevant is. Elk artikel krijgt binnen Legal Intelligence dus twee scores: een voor het aantal citaties en een voor het aantal klikken. De hoogste score wordt opgeteld bij andere rankingfactoren, zoals de tekstrelevantie, actualiteit en instantie.
Samen bepalen deze rankingfactoren de volgorde van de resultaten die de zoekmachine toont aan jou als juridische professional. Om het zo transparant mogelijk te maken, geeft Legal Intelligence bij elke zoekopdracht inzicht in de totstandkoming van de ranking; bij elk resultaat wordt uitgelegd welke factoren de grootste impact hebben gehad. Op die manier willen we jou als gebruiker een nog beter beeld geven van de meest interessante resultaten
_______________
Benieuwd in hoeverre het zoeksysteem van Legal Intelligence verschilt van Google of een andere (juridische) zoekmachine? Vraag een gratis proefabonnement aan en ontdek het zelf.