Expert Q&A: Hoe kunstmatige intelligentie goed onderzoek mogelijk maakt

20 February 2020 09:11

Vanuit het kantoor uitkijkend over de Amsterdamse sluishavens, spreken wij met Georgios Tsatsaronis, Vice President van Data Science bij Elsevier, om de potentie van kunstmatige intelligentie (AI), machine learning, Natural Language Processing (NLP) en data science uit te leggen. Nadat hij Elsevier’s data science operations heeft geleid en het business model heeft uitgebreid, ziet Tsatsaronis het potentieel in AI en big data analyses om meetbare waarde te stimuleren voor onderzoekers die werken in de academische werkveld en in de gezondheidszorg. Het volgende kwam uit het gesprek:

Hoe gebruikt u big data analyses, AI & machine learning bij Elsevier?

Elsevier heeft het geluk dat zij veel zeer belangrijke wetenschappelijke content van de hoogste kwaliteit ter wereld heeft. Wij gebruiken big data analyses, machine learning en geavanceerd NLP om de content in deze publicaties te proberen te begrijpen. Uiteindelijk bieden wij dit via onze platforms aan, om zo onze klanten te helpen hun werk sneller, gemakkelijker, beter en efficiënter te doen.

Hoe belangrijk is het in uw werkzaamheden?

Het is onwijs belangrijk aangezien het waarschijnlijk ons beste aanbod in deze tijd is om gebruikers alles te bieden om beter te presteren, hun werkveld en onderzoeken beter te begrijpen, maar ook om hun eigen praktijken en industrie beter te begrijpen. Het kan helpen om zicht te krijgen waar precies hun professionele expertise ligt. Door middel van AI, machine learning en geavanceerd NLP, kunnen wij de beste service bieden aan onze gebruikers zodat zij hun carrières en onderzoeken kunnen verbeteren.

Kunt u ons een paar voorbeelden geven van hoe u AI en big data gebruikt?

Een belangrijk voorbeeld is op het gebied van financiering. Heel veel onderzoekers doen onderzoek naar talloze onderwerpen. De primaire basis van succesvol onderzoek is het krijgen van financiering. Op het gebied van onderzoek zijn er veel financieringsmogelijkheden, toch hebben onderzoekers moeite kansen te creëren. Wat wij doen, is dat we al die financieringsdata uit publicaties en van financiers zelf bijeenbrengen en aan elkaar linken om deze vervolgens in een grafiek weer te geven. Op deze manier hebben onze gebruikers al deze informatie tot hun beschikking en kunnen zij zien waar precies de grootste financieringskansen liggen.

In de gezondheidszorg werken wij met een gezondheidsgrafiek waarin wij gestructureerde en ongestructureerde content winnen en samenbrengen om zo antwoorden op grote vraagstukken van onderzoekers te geven. Bijvoorbeeld: wat zijn de meest voorkomende symptomen voor bepaalde ziektes? We kunnen ook nog een stap verder gaan en voorspellende analyses geven die voorstellen kunnen geven als, ‘dit is een nieuwe hypothese waar je mee kunt werken in de aankomende jaren, misschien zal dit medicijn daadwerkelijk deze ziekte aanpakken’.

Hoe hebben deze ontwikkelingen bijgedragen aan verandering in hoe het eerst ging?

Onderzoekers moesten in het verleden grote content aanbieders bezoeken om vragen te beantwoorden over de nieuwste publicaties over een medicijn. Dat was erg vervelend en langdradig werk wat veel leeswerk en systematisch handelen van vele publicaties vereiste. Tegenwoordig zijn dat een paar duizend publicaties per dag waardoor het bijna onmogelijk is voor een onderzoeker om met deze aantallen om te gaan. Met de platformen die Elsevier heeft, kunnen onderzoekers snel toegang krijgen tot de belangrijke kerninformatie uit al deze publicaties en filteren op voor hun relevante stukken.

Hoe gebruikt u data verrijking?

Er zijn een paar verrijkingen die wij aanbieden boven op onze primaire content. Belangrijke verrijkingen hebben betrekking tot het begrijpen wie onderzoek financiert. Ook doen wij aan topic modelling waarmee wij belangrijke wetenschappelijke concepten uit onze stukken halen. Bijvoorbeeld: wij hebben een initiatief genaamd Elsevier ScienceDirect Topic Pages. Het is een soort Wikipedia voor wetenschappelijke concepten, maar dan alleen door experts. Alle kennis die wij winnen is afkomstig uit boeken van hoge kwaliteit die door Elsevier zijn gepubliceerd. Hierdoor is het materiaal van zeer hoge kwaliteit voor onze onderzoekers.

Hoe hebben deze ontwikkelingen het business model van Elsevier verandert?

In de afgelopen jaren is de manier van werken binnen Elsevier verbreed. Naast onze uitgeverij business zijn onze business modellen uitgebreid om zo veel verschillende informatie analyse oplossingen te kunnen geven. Dit is inclusief onze platformen die voor gebruikers content winnen en kleiner maken, om deze vervolgens via onze eindpunten aan te bieden waardoor de informatie van hoge kwaliteit is. Daarnaast hebben we de extractie die gemaakt wordt met NLP en machine learning. Kortom we hebben onwijs veel waarde toegevoegd aan onze originele uitgeverij werkzaamheden.

Wat is de rol van een data wetenschapper in een organisatie?

In de laatste 10 tot 15 jaar zijn er veel meer datawetenschappers gekomen. De moderne datawetenschapper heeft een mix van skills nodig die gaan van software ontwikkeling tot het begrijpen van geavanceerd analyseren en machine learning technieken. De data-wetenschapper van vandaag de dag moet in staat zijn om data volledig te processen, bedrijfseisen te begrijpen en deze te kunnen vertalen naar een oplossing. Ze moeten in staat zijn de beste AI of machine learning oplossingen te vinden voor een probleem. Het grootste probleem, in computerwetenschap, is: hoe breng ik mijn bedrijfsvragen in kaart in één van de welbekende algoritmes of oplossingen, want als dat gelukt is kan het probleem makkelijk aangepakt worden. Al deze skills zijn van belang voor een datawetenschapper om zo om te kunnen gaan met de complexiteit van data in complexe vraagstukken.

Hoe belangrijk is variëteit in de bronnen van data, inclusief bronnen van derden?

Dat is onwijs belangrijk. Als we bijvoorbeeld wetenschappelijke publicaties nemen, dan is Elsevier de grootste wetenschappelijke uitgever ter wereld. Echter kunnen onderzoekers andere type content ook niet over het hoofd zien, zoals patenten, klinische proeven, onbewerkte data, whitepapers, technische rapporten en zelfs preprints van publicaties. Door al deze samen te voegen verbreed je de kennis en geef je onderzoekers veel beter zicht in verschillende gebieden, wat de topmethodes zijn, wat de beste algoritmes zijn en wat de meest belangrijke protocollen van nu zijn. Dus deze cirkel moet zichtbaar zijn voor jouw klanten. Veel andere uitgevers vertrouwen de content van Elsevier om zo wetenschappelijke informatie samen met metadata van de publicaties samen te voegen en te publiceren op hun platformen. Op die manier zou je kunnen zeggen dat Elsevier de Wereld Bank is van metadata en wetenschappelijke informatie!

Elsevier en LexisNexis zijn beide onderdeel van RELX Group.

Meer weten over machine learning? Lees hier dan verder

Neem contact met ons op
Telefoonnummer: +31 (0) 20 485 3456
Meer weten over LexisNexis?
  • Wilt u persoonlijk advies? Vul dan het contactformulier in!
  • Schrijf u in voor onze nieuwsbrief
  • Volg ons op Facebook, LinkedIn of Twitter
  • Ga naar Kennisbank voor interessante artikelen, whitepapers en blogs