Een dataset is een krachtige manier om jou data te bewerken. De dataset biedt verschillende knoppen om verschillende soorten bewerkingen te doen:
Toevoegen bron
In een dataset kan je op een sleutelveld verschillende Bronnen met elkaar verbinden. Je doet dit door in een dataset op het plus icoontje te klikken. Je krijgt dan een lijst van al jouw bronnen. Kiers hier de bron die je wilt toevoegen. Voeg vervolgens via het plus icoon ter hoogte van de nieuw toegevoegde bron de koppeling toe. Hier zorg je dat je een of meerdere velden uit de bovenliggende bronnen selecteert en deze koppelt aan een of meer velden uit jou zojuist toegevoegde bron.
Door de verschillende velden aan elkaar te koppelen het mogelijk om zelf een nieuwe dataset te creëren op basis van verschillende bronnen.
Berekende kolommen
Door op de knop voor berekende kolommen te klikken opent een nieuw venster waarin de data van de toegevoegde bronnen weergegeven wordt. Hier kan je in de kolom ‘Berekend’ op het plus icoontje klikken om een nieuwe berekende kolom toe te voegen.
Een berekende kolom kan van alles bevatten. Zo kan je de kolom een waarde geven op basis van data uit de andere kolommen. Deze checks en andere functionaliteit kan je toevoegen door gebruik te maken van slimme Excel formules of een python script.
Ook is het mogelijk om de berekende kolommen te gebruiken voor het filteren van je resultaten. Als je bijvoorbeeld uiteindelijk alleen iets wil doen met kolommen die aan een bepaalde voorwaarde voldoen, kan je een extra berekende kolom toevoegen die op basis van een Excel formule waar of onwaar teruggeeft. Op basis van het resultaat van deze kolom kan je later een filtering toepassen op je dataset.
Resultaten filteren
Door een filtering toe te passen op je dataset is het mogelijk om alleen resultaten mee te nemen in de rest van de koppeling die voldoen aan bepaalde voorwaarden.
Door op de knop ‘Dataset filteren’ te klikken kan je een filtering toepassen op de dataset. Er opent een nieuwe popup, klik op het plus icoontje om een nieuwe filtergroep aan te maken. Druk vervolgens op het plus icoon in de filtergroep om een filter toe te voegen.
Vervolgens krijg je een scherm te zien met drie invoervelden. Het eerste veld is een dropdown met daarin alle kolommen (inclusief toegevoegde berekende kolommen) die zich in je dataset bevinden. Selecteer hier de kolom waarop je de filtering wil toepassen. In de laatste kolom kan je selecteren waar je voorwaarde mee overeen moet komen. Hier heb je de keuze tussen het selecteren van een andere kolom, hierbij geef je dus aan dat het resultaat alleen meegenomen mag worden als de waarden uit de twee geselecteerde kolommen dezelfde waarden hebben. Ook is het mogelijk om handmatig een waarde in te voeren. Klik naast het derde veld op de drie puntjes om de editor te openen. Hier kan je tussen quotes (““) de waarde aangeven waar je kolom aan moet voldoen, bijvoorbeeld ‘true’ of ‘false’, afhankelijk van wat je in de berekende kolom als resultaat teruggegeven hebt. Als laatste moet je aangeven of de twee expressies gelijk zijn aan elkaar (=), of dat ze juist niet aan elkaar gelijk zijn (<>). Dit doe je in het middelste invoerveld. Hierbij geef je aan of de geselecteerde kolom uit het eerste veld gelijk is aan de geselecteerde kolom of expressie uit het derde invoerveld.
Dataset verwijderen
Door op de knop ‘Dataset verwijderen’ te klikken verwijder je de complete dataset. Houd er rekening mee dat hiermee mogelijk ook eerder toegevoegde berekende kolommen van je dataset verwijderd worden.
Volgorde van verwerking binnen Dataset
Binnen een dataset wordt de logica als volgt toegepast. De reden dat dit belangrijk is, is bijvoorbeeld om te weten waarom iets niet wordt uitgefilterd. Denk bijvoorbeeld aan de situatie wanneer je een script over dataset uitvoert en er van uitgaat dat het filter op de dataset hier rekening mee houdt. Dat is dus niet het geval, zoals je hieronder ziet, vindt filtering plaats voordat het schript wordt uitgevoerd.
Verbinden van de bronnen (van boven naar beneneden)
Toevoegen berekende kolommen (van rechts naar links, ofwel je kunt de uitkomst van een kolom alleen maar gebruiken indien deze kolom rechts van de kolom staat)
Filtering op de dataset
Sortering op de dataset
Uitvoeren script na dataset