Grote gegevens is de nieuwe wetenschap van het begrijpen en voorspellen van menselijk gedrag door grote hoeveelheden ongestructureerde gegevens te bestuderen. Big data wordt ook wel ‘predictive analytics’ genoemd. Het analyseren van Twitter-berichten, Facebook-feeds, eBay-zoekopdrachten, GPS-trackers en geldautomaten zijn enkele voorbeelden van big data. Het bestuderen van beveiligingsvideo’s, verkeersgegevens, weerpatronen, aankomsten van vluchten, logs van mobiele telefoons en hartslagmeters zijn andere vormen. Big data is een rommelige nieuwe wetenschap die wekelijks verandert, en slechts een paar experts begrijpen het allemaal.
Voorbeelden van big data in het gewone leven
Virusuitbraken voorspellen: door sociaal-politieke gegevens, weers- en klimaatgegevens en ziekenhuis-/klinische gegevens te bestuderen, voorspellen deze wetenschappers nu uitbraken van knokkelkoorts met een voorafgaande kennisgeving van 4 weken.
Moordzaken: dit big data-project profileert slachtoffers, verdachten en criminelen van moorden in Washington, DC. Zowel als een manier om de overledene te eren als als een bron van bewustwording voor mensen, is dit big data-project fascinerend.
Transit-reisplanning, NYC: WNYC-radioprogrammeur Steve Melendez combineerde het online metroschema met reisroutesoftware. Met zijn creatie kunnen New Yorkers hun locatie op de kaart aanklikken en verschijnt een voorspelling van de reistijd voor treinen en metro.
Xerox verminderde hun personeelsverlies: callcenterwerk is emotioneel vermoeiend. Xerox heeft met de hulp van professionele analisten enorme hoeveelheden gegevens bestudeerd en nu kunnen ze voorspellen welke callcentermedewerkers waarschijnlijk het langst bij het bedrijf zullen blijven.
Ondersteuning van terrorismebestrijding: door sociale media, financiële gegevens, vluchtreserveringen en beveiligingsgegevens te bestuderen, kan wetshandhavers terroristische verdachten voorspellen en lokaliseren voordat ze hun slechte daden verrichten.
Merkmarketing aanpassen op basis van social media reviews: mensen delen snel en botweg hun online gedachten over een café, restaurant of fitnessclub. Het is mogelijk om deze miljoenen posts op sociale media te bestuderen en feedback te geven aan het bedrijf over wat mensen van hun diensten vinden.
Wie gebruikt big data? Wat doen ze ermee?
- Macy’s warenhuis: gebruikt big data om zijn prijzen direct aan te passen voor meer dan 70 miljoen producten. Ze sturen zelfs aangepaste e-mails naar hun klanten op basis van datgene waarin Macy’s denkt dat ze geïnteresseerd zijn.
- Reactie van de politie op de bomaanslag op de marathon van Boston: door gebruik te maken van big data om video- en bewakingsbeelden te bestuderen, kon de politie de zoektocht naar de verdachten snel verfijnen.
- Morton’s Steakhouse: gebruikt Twitter om marketingstunts uit te voeren, waaronder de beroemde bezorging op de luchthaven van New Jersey van een porterhouse steak en garnalendiner.
- Visa gebruikt big data om fraudeurs te identificeren en te pakken: Enkele transacties hier en daar kunnen een oneerlijke creditcardgebruiker gemakkelijk verbergen, maar door miljoenen transacties zorgvuldig te bekijken, kunnen fraudepatronen worden gedetecteerd.
- Facebook gebruikt big data om advertenties op maat te maken: Door je FB-likes en surfgedrag zorgvuldig te bestuderen, heeft de socialemediagigant een griezelig inzicht in je smaak. Die zijbalkadvertenties die u op uw Facebook-feed ziet, zijn gekozen door zeer opzettelijke en complexe algoritmen die uw Facebook-gewoonten in de gaten hebben gehouden.
Waarom is big data zo’n big deal?
1. De gegevens zijn enorm — Het past niet op een enkele harde schijf, laat staan op een USB-stick. De hoeveelheid gegevens is veel groter dan wat de menselijke geest kan waarnemen (denk aan een miljard miljard megabytes, en vermenigvuldig dat dan met nog eens miljarden).
2. De gegevens zijn rommelig en ongestructureerd — 50% tot 80% van het big data-werk bestaat uit het converteren en opschonen van de informatie, zodat deze doorzoekbaar en sorteerbaar is. Slechts een paar duizend experts op onze planeet weten volledig hoe ze deze gegevens moeten opruimen. Deze experts hebben ook zeer gespecialiseerde tools nodig, zoals HPE en Hadoop, om hun vak uit te voeren. Misschien zullen big data-experts over tien jaar een dozijn worden, maar voor nu zijn ze een zeer zeldzame soort analist en hun werk is nog steeds erg obscuur en vervelend.
3. Gegevens zijn een handelsartikel geworden dat kan worden verkocht en gekocht — Er bestaan marktplaatsen voor gegevens waar bedrijven en individuen terabytes aan sociale media en andere gegevens kunnen kopen. De meeste gegevens zijn cloudgebaseerd, omdat ze te groot zijn om op een enkele harde schijf te passen. Het kopen van gegevens brengt gewoonlijk abonnementskosten met zich mee wanneer u aansluit op een cloudserverfarm.
De leiders van big data-tools en -ideeën zijn Amazon, Google, Facebook en Yahoo. Omdat deze bedrijven zoveel miljoenen mensen bedienen met hun online diensten, is het logisch dat zij het verzamelpunt en de visionairs zijn achter big data-analyse.
4. De mogelijkheden van big data zijn eindeloos — Misschien zullen artsen op een dag hartaanvallen en beroertes voorspellen voor individuen, weken voordat ze gebeuren. Vliegtuig- en auto-ongelukken kunnen worden verminderd door voorspellende analyses van hun mechanische gegevens en verkeers- en weerspatronen. Online daten kan worden verbeterd door big data-voorspellers te hebben van welke compatibele persoonlijkheden voor u zijn. Muzikanten kunnen inzicht krijgen in welke muziekcompositie het meest aangenaam is voor de veranderende smaak van doelgroepen. Voedingsdeskundigen kunnen misschien voorspellen welke combinatie van in de winkel gekocht voedsel de medische toestand van een persoon zal verergeren of helpen. Het oppervlak is alleen bekrast en elke week vinden er ontdekkingen in big data plaats.
Big data is rommelig
Big data is voorspellende analyse — het omzetten van enorme, ongestructureerde gegevens in iets dat doorzoekbaar en sorteerbaar is. Dit is een rommelige en chaotische ruimte die een speciaal soort kennis en geduld vereist. Neem bijvoorbeeld de monolithische UPS-bezorgservice. De programmeurs van UPS bestuderen gegevens van de gps en smartphones van hun chauffeurs om de meest efficiënte manieren te analyseren om zich aan te passen aan verkeersopstoppingen. Deze GPS- en smartphonegegevens zijn gigantisch en niet automatisch klaar voor analyse. Deze gegevens komen binnen vanuit verschillende GPS- en kaartdatabases, via verschillende hardwareapparaten voor smartphones. UPS-analisten hebben maanden besteed aan het omzetten van al die gegevens in een formaat dat gemakkelijk kan worden doorzocht en gesorteerd. De moeite is het echter waard geweest. Vandaag de dag heeft UPS meer dan 8 miljoen gallons brandstof bespaard sinds ze deze big data-analyse begonnen te gebruiken. Omdat big data rommelig is en zoveel moeite kost om op te ruimen en voor te bereiden voor gebruik, hebben datawetenschappers de bijnaam ‘dataconciërges’ gekregen vanwege al het vervelende werk dat ze doen. De wetenschap van big data en voorspellende analyses verbetert echter elke week. Verwacht dat big data tegen het jaar 2025 voor iedereen gemakkelijk toegankelijk zullen zijn.
Is big data een intrusieve bedreiging voor de privacy?
Ja, als onze wetten en individuele privacybeschermingen niet zorgvuldig worden beheerd, dringt big data de persoonlijke privacy binnen. Zoals het er nu uitziet, houden Google en YouTube en Facebook al uw dagelijkse online gewoonten bij. Uw smartphone- en computerleven laten elke dag digitale voetafdrukken achter, en geavanceerde bedrijven bestuderen die voetafdrukken. De wetten rondom big data evolueren. Privacy is een staat van zijn waar je nu persoonlijke verantwoordelijkheid voor moet nemen, omdat je het niet langer als standaardrecht kunt verwachten.
Wat u kunt doen om uw privacy te beschermen
De grootste stap die u kunt nemen, is uw dagelijkse gewoonten te verhullen met behulp van een VPN. Een VPN-service vervormt uw signaal zodat uw identiteit en locatie op zijn minst gedeeltelijk worden gemaskeerd door trackers. Dit maakt je niet 100% anoniem, maar een VPN zal aanzienlijk verminderen hoeveel de wereld je online gewoonten kan observeren.