De kracht van externe big data met Nexis® Data as a Service Bulk API

Zo gebruikt The Hebrew University data voor machine learning

Use case The Hebrew University of Jerusalem

The Hebrew University of Jerusalem is de academische instelling die de Nexis® Data as a Service Bulk API gebruikt om een geavanceerd machine-learning-algoritme te trainen.

Logo Hebrew University

Een team van politicologen onder leiding van Tamir Sheafer, decaan van de faculteit Sociale Wetenschappen aan de universiteit gebruikt de Nexis® Data as a Service Bulk API om zijn systeem voor nieuwsmonitoring te voorzien van grote hoeveelheden content.

Het systeem is ontworpen om trends in de media te signaleren. De content die wordt aangeleverd via de Bulk API wordt gebruikt om een geavanceerd machine-learning-algoritme zo te trainen dat het onderliggende patronen herkent die vaak niet door gewone lezers worden opgemerkt.

Geavanceerd machine-learning met de kracht van de Bulk Content API.

Het onderzoeksteam gebruikt gigantische hoeveelheden ongestructureerde gegevens uit de contentcollectie van LexisNexis®.

Met de Bulk Content API krijgen ze snel toegang tot de datasets van externe partijen. Zo kunnen gebruikers alle door LexisNexis® gelicentieerde nieuwscontent downloaden en hosten, of het nu gaat om alle content van de afgelopen vijf jaar of specifieke content van de laatste 35 jaar.

Het team van de Hebrew University of Jerusalem stelt hun bulklevering samen op basis van de uitgebreide contentcollectie van LexisNexis®, inclusief niche- en branchepublicaties, en internationaal erkende nieuwsbronnen.

Dankzij de Bulk Content API heeft het team toegang tot meer dan genoeg gegevens om een geavanceerd machine-learning-algoritme in staat te stellen om gespreksanalyses uit te voeren. Het algoritme kan trends en variaties in de mediaberichtgeving herkennen, zodat het nieuwsbewakingssysteem onderliggende patronen kan identificeren die menselijke lezers vaak niet opmerken.

Het optimaliseren van onderzoek

Met het enorme bereik van de Bulk API kan het team veranderingen in mediadiscussies bijhouden, op verschillende locaties en in verschillende periodes.

De steeds groter wordende LexisNexis®-bibliotheek met ongeëvenaarde en gecontroleerde nieuwscontent biedt dit team van machine-learning-specialisten de mogelijkheid om een gigantisch corpus met relevant nieuws te analyseren. Net als bij het nieuws uit de LexisNexis®-bibliotheek omvatten de gegevens die op de Hebrew University bestudeerd worden de openbare gegevens van politieke instanties (wetgeving, debatten, toespraken en commissieprotocollen).

En omdat ze de content van verschillende persbureaus, landen en periodes kunnen analyseren, kunnen de onderzoekers communicatietrends in verschillende contexten bestuderen. Zo krijgen ze inzicht in de verschillende manieren waarop evenementen, waarden en spelers worden weergegeven.

Big data. Big thinking.

Met toegang tot meer dan 35 jaar aan publicaties kan het team trends ontdekken en theoretische onderzoeksmodellen verifiëren in verschillende contexten.

En omdat de Bulk API zo gebruiksvriendelijk is, kan het team de zoekopdracht indien nodig ook repliceren. Theoretische modellen worden gevalideerd en verfijnd op basis van een nagenoeg eindeloze hoeveelheid content. Hierdoor kunnen ze blijven testen en controleren, zonder dat ze het risico lopen om zonder content te zitten.

Professor Tamir Sheafer ziet in de Bulk API ook veel mogelijkheden en toepassingen voor disciplines buiten zijn eigen vakgebied. Zo kunnen bedrijfsopleidingen externe gegevens gebruiken voor de analyse van commerciële campagnes. En computer-wetenschappers hebben baat bij toegang tot een enorme hoeveelheid tekstuele informatie.

Neem contact met ons op

E-mail: support@lexisnexis.eu
Telefoonnummer: +31 (0) 20 485 3456