ChatGPT code interpreter, een praktische handleiding

ChatGPT Code Interpreter: Uw Digitale Assistent Voor Data-Analyse

GhatGPT Code Interpreter. Dit is een game-changer voor iedereen die bezig is met data-analyse, of u nu een ervaren datawetenschapper bent of iemand die net begint.

Een praktische introductie van de ChatGPT Code Interpreter

ChatGPT, ontwikkeld door OpenAI, is een geavanceerde AI-taalmodel dat al bekend staat om zijn vermogen om vragen te beantwoorden, essays te schrijven, en zelfs gedichten te componeren. Nu voegt het nog een andere indrukwekkende functie toe aan zijn repertoire: de mogelijkheid om Python-code te interpreteren en uit te voeren.

Wat Kan De ChatGPT Code Interpreter?

Met de Code Interpreter kunt u Python-code direct in de chat interface van ChatGPT schrijven en uitvoeren. Dit is ongelooflijk handig voor verschillende doeleinden, zoals:

 

  • Data-analyse: U kunt CSV-bestanden uploaden en de ChatGPT Code Interpreter vragen om gegevens te analyseren, grafieken te maken, en inzichten te genereren. Zoals bijvoorbeeld het analyseren van Google Analytics-gegevens om trends te ontdekken, zoals we eerder hebben gedaan.
  • Illustratie: Screenshot van de ChatGPT interface met een voorbeeld van data-analyse code en output.
  • Berekeningen en wiskundige problemen: Van eenvoudige rekenkundige operaties tot complexere wiskundige berekeningen, de Code Interpreter kan het allemaal aan.
  • Leer Python programmeren: Voor degenen die leren programmeren, kan de Code Interpreter dienen als een interactieve leeromgeving. U kunt code schrijven, uitvoeren en onmiddellijk feedback krijgen.
  • Datareiniging: Bij het werken met ruwe datasets komen vaak allerlei problemen naar voren, zoals ontbrekende waarden, inconsistenties of fouten. Met de Code Interpreter kunt u uw data opschonen en voorbereiden voor verdere analyse.

  • Statistische analyse: De Code Interpreter kan een reeks statistische analyses uitvoeren, van eenvoudige beschrijvende statistieken tot complexere inferentiële statistieken. Denk aan het berekenen van gemiddelden, medians, standaarddeviaties, het uitvoeren van t-tests, chi-kwadraat tests, en meer.

  • Machine Learning: U kunt de Code Interpreter gebruiken om machine learning modellen te trainen en te testen. Dit kan variëren van eenvoudige lineaire regressiemodellen tot complexere neurale netwerken, hoewel het belangrijk is op te merken dat de huidige versie van de Code Interpreter mogelijk beperkt is in het uitvoeren van zeer resource-intensieve taken.

  • Data manipulatie: Het hervormen van datasets, het samenvoegen van verschillende datasets, het filteren van rijen op basis van bepaalde criteria, en andere soorten data manipulatie zijn allemaal mogelijk met de Code Interpreter.

  • Tekstanalyse: U kunt de Code Interpreter gebruiken voor allerlei tekstanalysetaken, zoals het tellen van woorden of zinnen, het vinden van specifieke woorden of zinnen, het uitvoeren van sentimentanalyse, en meer.

Waarom is de ChatGPT Code Interpreter zo handig?

Het echte voordeel van de ChatGPT Code Interpreter ligt in de combinatie van de kracht van Python met de flexibiliteit en het gebruiksgemak van de ChatGPT-interface. Andere voordelen die wij zien van deze nieuwe functionaliteit zijn onder andere:

 

  • Directe interactie: In tegenstelling tot traditionele programmeeromgevingen waar je code moet schrijven in een apart venster of bestand, laat de ChatGPT Code Interpreter je direct in de chatinterface programmeren. Dit maakt het proces veel meer interactief en direct.
  • Foutcorrectie: De Code Interpreter kan u helpen bij het corrigeren van fouten in uw code. Als er een fout optreedt, zal het deze in begrijpelijke taal uitleggen en suggesties doen voor het oplossen van het probleem.
  • Leerhulpmiddel: Voor degenen die Python leren, kan de Code Interpreter dienen als een geweldig leerhulpmiddel. Je kunt code uitproberen, zien wat er gebeurt, en direct feedback krijgen. Dit maakt het leren van programmeren een stuk minder intimiderend.
  • Hulp bij data-analyse: De Code Interpreter is bijzonder nuttig voor data-analyse. Je kunt data uploaden, analyses uitvoeren, visualisaties maken, en resultaten interpreteren, allemaal binnen dezelfde interface.
  • Productiviteitsverhoging: Voor ervaren programmeurs kan de Code Interpreter een productiviteitsverhogend hulpmiddel zijn. Door de mogelijkheid om code direct in de chat te schrijven en uit te voeren, kunnen programmeurs snel ideeën testen, hypotheses controleren en problemen oplossen.
Ontwerp zonder titel

Zelf aan de slag met de ChatGPT code interpreter.

In dit hoofdstuk starten wij met een eenvoudig te volgen voorbeeld. We gaan data uit Google Analytics exporteren, bewerken en uploaden. Daarna gaan wij ChatGPT vragen om deze data te analyseren en visualiseren. Wij starten met de meest eenvoudige databron, namelijk een .csv bestand. ChatGPT kan naast .csv bestanden nog meer bestanden aan, denk hierbij aan:

    1. Tekstbestanden: Dit omvat eenvoudige tekstbestanden (.txt), Python scripts (.py), en andere soortgelijke bestandsformaten.
    2. CSV-bestanden: Deze bestanden (.csv) worden vaak gebruikt voor het opslaan van tabulaire data, zoals die uit spreadsheets of databases.
    3. JSON-bestanden: JSON (.json) is een veelgebruikt dataformaat voor gegevensuitwisseling tussen server en webapplicaties.
    4. Excel-bestanden: U kunt ook Excel-bestanden (.xls, .xlsx) uploaden, hoewel u specifieke bibliotheken zoals pandas nodig heeft om deze te verwerken.
    5. Afbeeldingen: Hoewel minder gebruikelijk, kan de ChatGPT Code Interpreter ook werken met afbeeldingsbestanden (.jpg, .png, .gif, etc.), bijvoorbeeld voor beeldverwerkingstaken.

Houd er echter rekening mee dat de Code Interpreter alleen bestanden kan lezen en verwerken, maar geen bestanden kan schrijven of downloaden. Daarnaast is het belangrijk om te weten dat de Code Interpreter geen toegang heeft tot het internet, dus alle gegevens die u nodig heeft voor uw code moet u uploaden via de chatinterface.

Google Analytics

Open een rapport in Google Analytics. Ga naar het account waar je de data van wilt analyseren.

In dit voorbeeld hebben wij ervoor gekozen om het rapport “gebruikerskenmerken” over de periode 1 januari 2023 t/m 30 juni 2023 te openen en te exporteren. Als je de datum hebt gekozen kies dan het “deel” icoon. Vervolgens kan je aan de rechterkant kiezen welk formaat je wilt exporteren. Kies voor .csv

Google Analytics exporteerd data altijd vrij rommelig. Alle data zal worden geexporteerd in diverse kolommen en rijen onder elkaar. Deze onlogische structuur zal niet door ChatGPT gelezen kunnen worden. Daarom moeten wij het bestand een beetje “orderenen” alvorens het te uploaden

data export google analytics

Geef je data een logische structuur.

Knip en plak alle rijen en kolommen netjes naast elkaar zodat er een logische structuur ontstaat. Onze dataset is heel eenvoudig. Het betreft zoals eerder aangegeven de bezoekerskenmerken zoals aantalen, dagen, bezoekersduur e.d. De data is geordend in 5 kolommen en een 182 rijen (titel en dagen). Deze structuur is goed leesbaar en het is ook duidelijk waar de cijfers voor staan.

Uiteraard is dit slechts een eenvoudig voorbeeld. Je kan dit voorbeeld vervangen door ieder gewenste dataset. Belangrijk te onthouden is dat hoe duidelijker de opbouw en structuur is hoe beter de respons van ChatGPT zal zijn.

data structureren

Als je klaar bent kan je het bestand opslaan als .csv, nu ben je klaar om te starten!

De volgende stap…

Log in bij ChatGPT. Zorg dat je onder setting (te vinden door op de 3 puntjes te klikken achter je account naam), de beta feartures aanzet. Zie onderstaande afbeelding. Alleen als deze functie is geactiveerd kan je gebruik maken van de ChatGPT Code Interpreter. 

setting

Start nu op de gebruikelijke manier een nieuwe chat. Kies voor GPT-4. Je ziet nu 3 opties. Default, Code Interpreter (beta) en Plugins (beta). Kies voor de Code Interpreter. 

chastgpt 4

Bij de inputregel zie je nu een extra “+”. Deze plus laat je naast een prompt ook het bestanden uploaden.

input1

Bij de inputregel zie je nu een extra “+”. Deze plus laat je naast een prompt ook het bestanden uploaden. Door op de plus te klikken kan je een bestand uploaden. In dit voorbeeld is het bewerkte .cvs bestand geupload. Het is handig om naast het uploaden van het bestand ook een duidelijke prompt te formuleren zodat je het systeem voorbereid op wat je met de data wilt gaan doen.

In dit voorbeeld hebben wij de navolgende eenvoudige prompt gebruikt:

Het databestand in bijlage bevat .csv data afkomstig van Google Analytics. Het betreft data die betrekking heeft op o.a. bezoekersaantallen van een website. Wij gaan je straks vragen stellen over de data. Kan je dit bestand goed lezen?

Vervolgens gaat ChatGPT de data analyseren. Het mooie is dat wanneer de data niet helemaal duidelijk is ChatGPT zelf het probleem probeert op te lossen door bijvoorbeeld fouttoleranties te verhogen of door bijvoorbeeld lege rijen en tabellen uit te sluiten. Na het invoeren van deze prompt analyseerde de Code Interpreter het bestand feilloos. ChatGPT gaf zelfs een korte terugkoppeling inclusief de gebruikte Python code. Deze code kan je kopieren door op “Show Work” te klikken. 

finished working

Nu is het systeem klaar om mee te werken. De eerste prompt hebben wij simpel gehouden:

Graag trends analyseren en ook op welke dagen er de meeste nieuwe bezoekers zijn

ChatGPT kwam terug met onderstaande grafieken en tekst!

grafiek 1
grafiek 2 met tekst

Hoe cool is dat? Uiteraard had je deze analyse zelf ook kunnen maken in Excel, maar de snelheid waarmee de Code Interpreter dit werk doet is verbluffend. Het exporteren van de data uit Google Analytics, het orderen en uploaden namen maximaal 5 minuten in beslag. Dus binnen 6 minuten weten dat de website op vrijdagen de meeste bezoekers krijgt en zondag de minste. Verder lijkt er een algemene opwaardse trend te zijn. En dit klopt!

Op de vraag van ChatGPT of er nog iets anders is dat wij willen analyseren gaven we de navolgende prompt:

zijn er nog andere opvallende zaken die je uit deze data kunt halen?

ChatGPT kwam met de navolgende feedback:

meer analyse

Deze output behoeft verder geen toelichting, duidelijke taal en het klopt ook nog allemaal, heel bijzonder. Maar er is meer! Zoals je aan het begin van deze pagina hebt kunnen lezen kan de Code Interpreter ook andere analyses maken. Wij vervolgen met een voorbeeld van hoe je een tekst analyse kunt maken. Chat GPT kan met verschillende tekstbestandformaten werken, zoals .txt, .csv, .json en .docx. Bovendien kan ChatGPT ook PDF-bestanden verwerken, hoewel de nauwkeurigheid van tekstextractie uit PDF’s kan variëren, afhankelijk van de specifieke opmaak en structuur van het bestand. 

Wellicht vraag je je af wat een tekstanalyse nu precies is? Er zijn meerdere soorten analyse mogelijk, denk hierbij bijvoorbeeld aan:

  • Sentimentanalyse: Dit is het proces van het bepalen van de emotionele toon achter woorden om te begrijpen van de attitudes, meningen en emoties van de schrijver.
  • Tekstclassificatie: Dit is het proces van het classificeren van tekst in georganiseerde groepen. Bijvoorbeeld, je kunt een set e-mails classificeren als “spam” of “niet-spam”.
  • Tekstclustering: Dit is het proces van het groeperen van ongestructureerde teksten op basis van gelijkaardige patronen of thema’s zonder voorafgaande kennis van deze patronen in de gegevens.
  • Entiteitenherkenning (NER, Named Entity Recognition): Dit is het proces van het identificeren van belangrijke elementen in de tekst, zoals personen, organisaties, locaties, medische codes, tijdsaanduidingen, percentages, enz.
  • Onderwerpmodellering: Dit is het proces van het identificeren van de belangrijkste onderwerpen die in een tekst of reeks teksten voorkomen.
  • Verbanden en relaties extraheren: Dit gaat verder dan alleen het identificeren van entiteiten en identificeert de relaties en verbindingen tussen entiteiten.
  • Automatisch samenvatten: Dit is het proces van het verminderen van de hoeveelheid tekst met behoud van de belangrijkste punten.

 Hans en Grietje

Op het internet vonden we in .pdf het verhaal van Hans en Grietje. We hebben dit bestand geupload met de vraag of ChatGPT het kon lezen. Onderstaande afbeelding toont hiervan het resultaat.

hans en grietje analyse

We hebben ChatGPT gevraagd om de volgende analyses uit te voeren:

  1. Sentimentanalyse
  2. Entiteitenherkenning
  3. Verbanden en relaties te extraheren

ChatGPG gaf aan voor 2 en 3 momenteel nog te weinig geheugen beschikbaar te hebben daar dit zeer zware analyses zijn. Vandaar dus ook waarschijnlijk dat het nog om een beta versie gaat. Deze sentimetanalyse was geen probleem. Zie het resultaat hieronder:

 

sentiment

Er kan dus gesteld worden dat Hans en Grietje een licht positief en subjectief verhaal is. Daarbij kaart ChatGPT wel aan dat het om een verhaal gaat en dat deze meestal subjectief zijn… We hebben dus een domme vraag gesteld! 

Al met al zien wij de toegankelijkheid en functionaliteit toenemen. Nu is het dus voor de gewone man mogelijk om middels Python data analyses te maken. Zou dit het einde betekenen van Data Science? Wij denken het niet maar het zal wel bijdragen aan de ontsluiting van Data Science voor iedereen. Alle eerder benoemde valkuilen van ChatGPT zijn nog steeds van toepassing, en ook betreft dit een beta versie. Neem dus nooit zomaar klakkeloos conclusies en bevinden over zonder dat je deze zelf hebt gecheckt!

Share This
/** * Adding a color picker to your form * * @link https://wpforms.com/developers/how-to-add-a-color-picker-to-your-form/ */ function wpf_dev_color_picker_field() { ?>