Arend Zwaneveld blogt serie artikelen over praktijkvoorbeelden Big Data

Onze Online Dialogue collega en analist Arend Zwaneveld is voor Webanalisten.nl aan een serie artikelen begonnen. Hij bekijkt verschillende cases van Big Data-voorbeelden uit de praktijk en wat wij daar uit kunnen leren. Vandaag zijn eerste artikel: Big Data voorbeeld: Misdaadpreventie Memphis Police Dept.

Big Data voorbeeld:
Misdaadpreventie Memphis Police Dept.

Wat als je misdaden zou kunnen voorspellen vóórdat deze plaatsvinden? Dit líjkt voorbehouden aan de ‘pre-cogs’ uit de film Minority report, maar de Big Data-oplossing Blue C.R.U.S.H. van de Memphis Police Force komt een eind in de richting: door historische data te combineren met real-time data adviseert het systeem de politiemacht op welke plaatsen in de stad haar (preventieve) aanwezigheid het meest effectief is. De resultaten zijn indrukwekkend: zware criminaliteit daalde met 30%, het aantal geweldsmisdrijven nam met 15% af.

Situatie

Memphis  was een slechte stad om in te wonen. De criminaliteit was er hoger dan op basis van demografie viel te verwachten.

Taak

Wetenschappers van de Universiteit van Memphis benaderden de politie van Memphis met het idee dat ze misschien patronen zouden kunnen ontdekken in de lokale misdaad als ze toegang zouden kunnen krijgen tot de data van afdeling misdaad, zoals geografische ‘hot spots’ op de kaart en tijdstippen waarop de kans het grootste is dat misdaad oplaait.

Aan de wetenschappers de uitdaging om in silo’s opgesloten data te ‘bevrijden’ en te vertalen naar concrete acties, volgens het DIKW-model:

  • Data
  • Informatie
  • Inzichten
  • Wijsheid
  • Real-time actie/advies

“De meeste agenten zien processen-verbaal als een zwart gat”, zegt hij. “Ze schrijven een rapport, voeren het in het systeem in, om het nooit meer te zien of te gebruiken. Ons doel is om die informatie nuttig te gaan gebruiken om misdrijven op te lossen.”

Actie

De wetenschappers gingen aan de slag met het statistische programa SPSS, dat enkele jaren daarna werd aangekocht door IBM, die het programma vervolgens omdoopte tot Operation Blue C.R.U.S.H. (Criminal Reduction Utilizing Statistical History).

“Natuurlijk kenden we de gebieden met veel vuurwapen-gerelateerde criminaliteit, maar [Blue CRUSH’s] analyses hebben ons geholpen de patronen te zien waar en wanneer de incidenten zich precies voordeden.”

-John Williams, Crime Analyst Unit Manager bij MPS

Doel: een effectievere efficiëntere inzet van de politiemacht.

De volgende Big Data werd hiervoor in het systeem met elkaar gecombineerd:

Historische inputReal-time informatieOutput
  • politierapporten
  • soorten criminaliteit
  • locatie misdaad
  • tijdstip misdaad (processen verbaal)
  • weers-omstandigheden
  • verkeers-informatie
  • overige bijzonderheden
  • soorten criminelen (strafbladen)
  • arrestatiebevelen
  • crime-scene
  • terugkerende patronen (zoals loon-uitbetaaldag)
  • historische 7- en 28-daagse analyse tbv bepalen hot-spots
  • verkeerspatronen
  • jaargetijde
  • temperatuur
  • regen
  • evenementen (?)
  • integratie met 911 call-informatie
    (in ontwikkeling)
  • GSM-locatie van verdachten [AZw?]
  • Real-time voorspelling: grootste kans op misdaad
  • Real-time advies: optimale inzet politiekrachten (aantallen en locatie)

 

Resultaat

Minder criminaliteit – Meer boeven opgesloten

De behaalde resultaten van dit ‘Big Data Crime Fighting’ programma mogen er zijn:

  • 30% daling zware criminaliteit
  • 15% daling geweldsdelicten
  • Hogere veroordelingsgraad (van 16% naar 70%) als gevolg van betere bewijslast (meer heterdaadjes)

Ook andere politie-departementen hebben inmiddels interesse getoond in het project, onder anderen die van Cincinnati, Baltimore, Boston, Las Vegas

Herbruikbare (!) voorspellende modellen voor IBM: “Industry Assets”

Een Big Data systeem als Blue CRUSH is een zelflerend systeem dat steeds beter wordt naarmate er meer data is én meer informatie over de effectiviteit van de, op basis van de data, aanbevolen acties (feedback).

Voor IBM is Blue CRUSH daarom ook een commercieel succes: de in Memphis, op basis van statistische analyse vervolmaakte voorspellende modellen zijn zonder al te veel aanpassingen toe te passen in andere steden. Ontwikkelaar IBM kan haar Blue CRUSH oplossing dus opnieuw verkopen aan andere politiemachten… over de hele wereld!

Met deze almaar beter wordende ‘predictive analytics modellen’ kan IBM geld verdienen. Om deze reden worden deze bij IBM op de boekhoudkundige balans bijgeschreven: IBM noemt deze in-house opgedane kennis “Industry Assets“!

Conclusie 1: met data kun je boeven vangen!

Conclusie 2: goede Big Data-modellen zijn hun gewicht 🙂 in goud waard!

Ethische vraagstukken bij Big Data

Privacy afpakken van veroordeelde criminelen

Er is geen grens aan de data die je aan elkaar kunt knopen. Hoe fijn zou het zijn als de locatie van een verdachte direct zichtbaar is op basis van de gegevens van zijn mobiele aanbieder? Hoe makkelijk zou het zijn wanneer de politie op basis van mobiele telefoon-data een waarschuwing krijgt zodra de leden van een groep ‘hangjongeren’ bij elkaar in de buurt komen? Zullen rechters, naast vingerafdrukken en DNA-samples, ook privacy-rechten van veroordeelden gaan afnemen?

Systeem-input is mensenwerk: wat is de prijs van een mensenleven?

Alle systemen die bedoeld zijn om ons leven te redden maken hun beslissingen uiteindelijk op basis van data die door mensen is aangeleverd. Technici zien zich geconfronteerd met allerlei ethische dilemma’s, vaak in de vorm van een ‘business case’ waarin een mensenleven wordt uitgedrukt in een geldbedrag.

Meer achtergrond over dergelijke ethische vraagstukken in mijn artikel ‘Big Data en Ethiek’.

Origineel geplaatst op 4 juli 2012 op webanalisten.nl

Bronnen

[1] Frans Bentlage, “Smarter Analytics Leader Benelux” bij IBM
http://new.livestream.com/eventproducent/onlinetuesday

[2] Memphis Cuts Crime With Predictive Analytics
http://www.informationweek.com/news/software/bi/226100087

[3] How To Catch a Criminal With Data
http://www.theatlanticcities.com/technology/2012/03/how-catch-criminal-data/1477/

[4] Wikipedia – Data, Information, Knowledge, Wisdom hierarchy
http://en.wikipedia.org/wiki/DIKW

[5] IBM i2 COPLINK – Accelerating Law Enforcement
http://www.i2group.com/us/products/coplink-product-line

[6] Memphis Police Department’s Award Winning Real Time Crime Center (RTCC)
https://kiosk.memphispolice.org/realtime/