Waarde van ongestructureerde data

10 October 2022 08:26

Ontdek de waarde van ongestructureerde data

Bedrijven over de hele wereld gebruiken big data om een revolutie teweeg te brengen in de manier waarop ze zaken doen. Maar ondanks voortdurende innovaties op het gebied van kunstmatige intelligentie, machine learning en andere technologie, blijft een krachtig hulpmiddel door veel organisaties over het hoofd gezien: ongestructureerde data.

De overgrote meerderheid van de gegevens die tegenwoordig beschikbaar zijn ongestructureerd en dit groeit razendsnel. De omslachtige aard van ongestructureerde data heeft het een beetje een slechte reputatie bezorgd, maar met een beetje werk kan het een ongelooflijk waardevol hulpmiddel zijn.

Wat is ongestructureerde data?

In tegenstelling tot gestructureerde gegevens zijn ongestructureerde gegevens informatie die over het algemeen geen georganiseerd formaat of voorspelbare volgorde volgt. Het kan door mensen worden gegenereerd, zoals sms-berichten, e-mails, sociale berichten, enzovoort.

Hoewel het in veel verschillende vormen voorkomt, zijn er vier bepalende kenmerken van de meeste ongestructureerde gegevens:

  1. Het is tekstueel: de meeste ongestructureerde gegevens bestaan uit tekstuele informatie, zoals nieuwsberichten, bedrijfscommunicatie, juridische communicatie en meer.
  2. Het is log: ongestructureerde gegevens zijn in wezen grote hoeveelheden informatie die zijn samengevoegd of in een systeem zijn geplaatst zonder enige vorm van voor de hand liggende opmaak of organisatie, waardoor het voor analisten moeilijk is om ze te gebruiken.
  3. Het is kwalitatief: in tegenstelling tot de harde cijfers en financiële informatie waarmee data-analisten gewend zijn te werken, zijn de meeste ongestructureerde data kwalitatief van aard. Dit kan de interpretatie bemoeilijken, maar biedt ook waardevolle kansen voor nieuwe vormen van analyse.
  4. Het is contextueel: ongestructureerde gegevens zoals berichtgeving en biografische informatie zijn uiterst nuttig om analisten de context te bieden die verder gaat dan basisfeiten en cijfers.

De waarde van ongestructureerde data ontsluiten

Er zijn drie belangrijke stappen nodig om de waarde van ongestructureerde data te ontsluiten:

  1. Wanneer je gegevens verzameld, gebruik dan alleen data van betrouwbare bronnen. In een wereld die overspoeld wordt met nepnieuws en waar slechts 53% van de mensen de media vertrouwt, is deze stap belangrijker dan ooit.
  2. Voeg context toe die de gegevens waardevoller maakt door specifieke, gedetailleerde verrijkingen toe te passen die ongestructureerde gegevens omzetten in semi-gestructureerde, doorzoekbare gegevens. Voorbeelden van verrijkingen zijn geografische coördinaten, artikelonderwerp/onderwerp, artikelsentiment, talen, enzovoort.
  3. Voer hoogwaardige, diepgaande analyses uit die krachtige, bruikbare inzichten opleveren.

Wil je meer weten over (on)gestructureerde data of ben je op zoek naar datasets?  Neem dan contact met ons op, we vertellen je er graag meer over.

Neem contact met ons op
Telefoonnummer: +31 (0) 20 485 3456
Meer weten over LexisNexis?
  • Wilt u persoonlijk advies? Vul dan het contactformulier in!
  • Schrijf u in voor onze nieuwsbrief
  • Volg ons op Facebook, LinkedIn of Twitter
  • Ga naar Kennisbank voor interessante artikelen, whitepapers en blogs