#E95E0D
#002642

IBCS-standaarden in Data Science.

Nu steeds meer bedrijven tijd (en geld) gaan investeren in Data Science, is het de perfecte tijd om te kijken wat standaarden in visualisaties kunnen doen voor Data Science. Je moet de kijker bij de hand nemen, en hem of haar de aspecten laten zien van wat je hebt ontdekt, zonder dat je hem of haar hoeft uit te leggen hoe je het rapport moet lezen.

Driving your business with passion

Hebben we echt normen nodig, zelfs in de Data Science? Dat is de eerste vraag die zich voordoet bij de behandeling van het onderwerp Data Science. Waarom zouden we standaarden als IBCS toepassen? Waarom is het nodig, als de ontwikkelaar en uzelf het rapport begrijpen? Dat is alles wat het zou moeten doen, toch? Wellicht, wanneer u de enige bent die het rapport gebruikt, maar zelfs dan: wanneer u het bedrijf/positie verlaat dan kost het veel tijd om de rapporten te begrijpen die op uw horloge zijn gemaakt.

Dus hoe kunnen we ervoor zorgen dat rapporten, analyses en zelfs datamining makkelijker te begrijpen zijn zonder uw uitleg (en geïnvesteerde tijd) wanneer u op uw nieuwe positie bent? Nou ja, dit is waar een vorm van normen in het spel komen. Een wereldwijd bekende open standaard is de standaard van IBCS (International Business Communication Standard). Deze standaard werkt met regels om uw gegevens in rapporten weer te geven, zodat u geen verkeerde conclusies trekt bij het bekijken van het rapport. Maar deze standaarden zijn niet alleen van toepassing op rapportages. In hun cursus op Data Science in R past Harvard ook een deel van de IBCS-standaard toe. Hoewel ze de term IBCS (nog) niet gebruiken en enkel spreken over “visualisatieprincipes”, hebben we het allebei zeker over hetzelfde…

Nu steeds meer bedrijven tijd (en geld) gaan investeren in Data Science en de groeiende kennis in R en/of Phyton, is het de perfecte tijd om te zien wat standaarden in visualisaties kunnen doen voor Data Science. Want “gewoon” de data ontginnen en de kijker overtuigen dat je resultaat/conclusie juist is, is niet de manier om te gaan. Dat is tenminste niet waar ik in geloof. Als analist, datawetenschapper of business intelligence consultant moet je de kijker bij de hand nemen, en hem of haar de aspecten laten zien van wat je hebt ontdekt, zonder dat je hem of haar hoeft uit te leggen hoe je het rapport moet lezen.

Het toepassen van IBCS op Data Science voorbeeld 1: beginnend bij 0

En dit is waar een van de IBCS-standaarden, “same axes view”, in het spel komt. Het gebruik en het begrijpen van grafieken, met behulp van IBCS-standaarden, zal ervoor zorgen dat de informatie zelfverklarend is, soms vergezeld van een korte boodschap die de essentie vastlegt. Laten we gewoon in 2 voorbeelden duiken (er zijn nog veel meer… Als u geïnteresseerd bent, neem dan contact op), waar de IBCS-standaarden kunnen worden toegepast in de Data Science en wat het doet voor u als kijker. Een van de standaarden die in IBCS gebruikt worden is het gebruik van standaarden op de assen. Naar mijn mening is deze nogal belangrijk, omdat het je als een gek in verwarring kan brengen. Laten we eerst eens kijken naar het verschil bij het in- en uitsluiten van 0 in de rapportage:

Linksboven is een schermafbeelding van Fox News opgenomen, die de zuidwestelijke grensaanhoudingen laat zien. Als je kijkt naar de getoonde gegevens van 2011 versus 2013, zie je visueel dat er een enorme toename was (3x zoveel). Als je bij 0 begint, ziet het plot er uit zoals hiernaast (het verschil is de werkelijke ~16%). Deze laat je meteen zien dat het verschil eigenlijk niet zo groot is. Verbazingwekkende manier om iets te verkopen, maar niet zo groot als je inzicht nodig hebt in je werkelijke gegevens en de in- of afname, dat is zeker.

* Hoewel dit ten behoeve van snelle analyses in datamining en Data Science een beetje veel zou zijn, wil ik dit toch even snel vermelden: als je alleen de bedragen en het verschil over het jaar wilt zien, is een grafiek zoals hierboven weergegeven voldoende. Hoewel er meer is om uit zo’n eenvoudige grafiek te halen door gebruik te maken van de Graphomate add on in bijvoorbeeld rapportagetools als SAP Web Intelligence, Design Studio of Lumira Designer. Door gebruik te maken van variaties kunnen de verschillen nog duidelijker worden gemaakt, zoals in de illustratie hiernaast. Het verschil per jaar ten opzichte van het voorgaande jaar wordt dan getoond in groen (voor positieve verandering) of in rood (voor negatieve verandering). Door dit toe te voegen aan de rapportages wordt de leesbaarheid vergroot en ziet de kijker de veranderingen in de loop van het jaar direct visueel.

 

Het toepassen van IBCS op Data Science voorbeeld 2: gebruik gemeenschappelijke assen

Een ander aspect van de IBCS-standaarden (hier opgenomen) zijn de “gemeenschappelijke assen“. Naar mijn mening is dit het andere belangrijkste aspect waarmee rekening moet worden gehouden, met name in de Data Science. Als je alleen al naar grafiek 1 hieronder kijkt, is het niet direct duidelijk of vrouwen of mannen gemiddeld groter zijn. Maar als je de assen van dichterbij bekijkt, zie je dat ze niet hetzelfde zijn (de MECE-regel van IBCS wordt hier gebruikt, omdat het niet nodig is om alle lege kolommen voor 50 jaar weer te geven, maar als je beide grafieken vergelijkt zouden ze hetzelfde gebruik van assen moeten hebben en beide lopen van 50 tot ~90). ). Stel je voor dat je niet de hoogte maar de kosten van een bedrijfseenheid vergelijkt, dan zou je bij een grafiek als hieronder aannemen dat de verdeling gelijk is, hoewel je bij gebruik van dezelfde assen kunt zien dat de verdeling aan de rechterkant (grafiek 2) hoger is.

Nieuwe interpretatie van het tonen van gegevens in Data Science volgens IBCS-standaarden

Als we kijken naar de vergelijking in grafiek 1, is het zelfs niet erg duidelijk wat het verschil in verdeling is. Dit komt door de manier waarop de grafieken horizontaal zijn gezet, maar als we naar de grafieken in nummer 2 kijken, kan de conclusie veel makkelijker getrokken worden. Je ziet meteen dat de verdeling bij mannen hoger is dan bij vrouwen. Een andere standaard die we volgens mij moeten hanteren bij het vergelijken van grafieken. In zekere zin kan dit gezien worden als een open interpretatie van de manier waarop de IBCS-standaarden de assen en de positie van de grafieken toepassen. In de IBCS-standaard staat dat horizontale grafieken “een verschil in de tijd moeten laten zien” en verticale grafieken worden gebruikt bij het vergelijken van artikelen, bedrijfsonderdelen, landen etc. Je zou “mannelijk” en “vrouwelijk” (niet de grafiek met de dubbele assen en de informatie erin, maar de gender-categorie als geheel) in dit geval kunnen zien als een categorie, dus dat zou betekenen dat je ze verticaal en dus onder elkaar uitlijnt. Op deze manier denk ik dat we deze regel van het weergeven van gegevens kunnen toepassen als het gaat om Data Science en het vergelijken van meerdere grafieken met alle verschillende categorieën, maar aan de andere kant: IBCS is gemaakt voor rapporten met 1 asmaat en meerdere categorieën of tijdsperiodes, dus het toepassen ervan op Data Science (en daarmee 2 assen of meer) is een nieuw gezichtspunt. Hoewel ik denk dat we deze manier van weergeven en vergelijken kunnen toepassen, grafieken of ze nu horizontaal (tijd) of verticaal (categorie) worden weergegeven, ook op boxplots, staafdiagrammen, kolomdiagrammen enz. Voor andere aspecten van Data Science (zoals bijvoorbeeld k-mean of beslisbomen) is er nog ruimte voor discussie als het gaat om de standaarden. Wanneer u een idee heeft over verbeteringen, aspecten om in of uit te sluiten, neem dan contact op en laten we de discussie beginnen. P.S. Wanneer ik uw interesse in IBCS heb gewekt, aarzel dan niet en neem contact op met JUGO: info@JUGO.nl
Stay up to date
De reis van Philips naar IBCS
In 2011 zijn we begonnen met een meerjarig initiatief voor bedrijfstransformatie, genaamdAccelerate! om ons nieuwe bedrijfsmodel te implementeren, waarbij we ernaar streefden om door middel van standaardisatie veel efficiënter te werken. We merkten dat iedereen in het bedrijf een eigen versie van de waarheid had, door middel van eigen grafieken en tabellen, in hun "eigen" Excel-bestanden.
Pas uw SAP BW en SAP BO aan
Wanneer medewerkers in uw organisatie autorisatie nodig hebben voor SAP BW en SAP BO, dienen de autorisatieopdrachten in beide tools te worden uitgevoerd. Wanneer u dit voor sommige gebruikers moet doen, is het werk beperkt. Als u echter voor veel gebruikers een verzoek ontvangt, zou het prettig zijn als dit proces vereenvoudigd kan worden.
De “inzichten” van SAC Smart
Zou het niet geweldig zijn om een tool te hebben die klaar staat om onze harde zoekopdrachten naar correlaties uit te voeren en met de helderste inzichten te komen die er zijn? Nou, SAP stelt dat de Smart Discovery add on van SAP Analytics Cloud (SAC) zo'n innovatie is. Maar is het echt zo? Zijn die analyses wel van hoge kwaliteit? Ik stelde dat graag op de proef.
NL

Driving your business with passion

Inschrijven training

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed semper fringilla urna vitae tincidunt. Mauris at turpis sed lacus sollicitudin iaculis ac et libero. Morbi at condimentum purus. Donec in ante nunc. Duis sapien dolor, semper tincidunt ullamcorper pharetra, fermentum non magna. Nulla a erat iaculis, venenatis augue in, ultricies enim. In molestie gravida enim non convallis. Ut nibh mi,

aliquet sodales tempor eu, eleifend a augue. Mauris id tortor nibh. Sed iaculis erat porta viverra lacinia. Mauris ut tempor lorem. Donec iaculis sem mauris, at hendrerit velit mattis quis. Donec pretium lacus non turpis rutrum, et rhoncus est lobortis. Maecenas euismod sagittis convallis. In lobortis risus tincidunt, cursus ante eget, mollis m

Inschrijven training: IBCS-standaarden in Data Science.