- De Circulaire
- Posts
- De Circulaire #184: hacken met 200 nerds in een oude gasfabriek 🤓
De Circulaire #184: hacken met 200 nerds in een oude gasfabriek 🤓
Ik deed mee aan een internationale Wikimedia hackathon, las veel over AI en een kat in een vogelnestje.
Met bijna 200 nerds hacken in een oude gasfabriek: de Wikimedia Hackathon 2023
In het weekend van 19, 20 en 21 mei was ik aanwezig bij de Wikimedia Hackathon in Athene. Zo’n 200 mensen die zich bezighouden met de Wikimedia-projecten (zoals Wikipedia) kwamen drie dagen bij elkaar om samen dingen te bouwen, te praten, discussiëren en bier te drinken. Het was de eerste keer sinds 2019 dat het evenement weer fysiek plaatsvond. Alleen al daarom een goede reden om weer eens te gaan. Zo ontmoette ik bijvoorbeeld Annie Rauwerda (van het social media-fenomeen Depths of Wikipedia), met wie ik eerder een presentatie maakte voor de Wikicon van 2021.
De hackathon vond plaats op Technopolis, een cultureel park op het voormalige terrein van een gasfabriek, vergelijkbaar met het Westergasterrein in Amsterdam. De locatie was prachtig, maar helaas waren er op vrijdag en zaterdag wel de hele dag soundchecks en optredens van respectievelijk een concert voor en van mensen met een beperking (“Cool Crips”, ja echt) en een indiepopband. Dat werd gelukkig gecompenseerd door het geweldige Griekse eten. Wist u overigens dat de Grieken de meeste olijfolie consumeren ter wereld? Misschien dat het daarom zo lekker is.
Depictor
Wat doe je zoal op zo’n hackathon? In 2018 was ik de laatste keer bij een Wikimedia Hackathon (die was toen in Barcelona). Ik merkte toen dat het weinig zin heeft om veel plannen te maken. Voor je het weet heb je een uur lang een interessant gesprek of ben je iets heel anders aan het uitzoeken dan dat je oorspronkelijk had bedacht.
Mijn enige “plan” was om “iets” te doen met Depictor, mijn tool om gestructureerde metadata toe te voegen aan de plaatjes op Wikimedia Commons. Die tool bestaat nu bijna twee jaar en heeft meer dan een miljoen edits opgeleverd (waaronder een half miljoen van een zéér actieve Poolse gebruiker). Tijdens de hackathon paste ik het tooltje aan zodat de plaatjes een stuk sneller laden. Mijn mede-hackathonner Siebrand (tevens trouwe lezer van deze nieuwsbrief) werd daar zo door gestimuleerd dat hij de afgelopen week meer dan 11.000 edits maaktte. Voor de toekomst ben ik van plan Depictor uit te breiden met meer datasets. Ik kreeg via Wikimedia-medewerker Matthias een dataset met 87 miljoen mogelijke “kandidaten”, dus Siebrand en mijn Poolse gebruiker zijn de komende tijd nog niet uitgedepictored.
The intangible
Nu we het toch over Siebrand hebben, hij organiseerde de showcase van de hackathon. Iedereen mag dan presenteren wat ze afgelopen dagen hebben gebouwd. Een nieuw onderdeel van die showcase, dat ik half samen met Siebrand bedacht, was iets dat hij the intangible (“het ontastbare”) noemde: wat waren de dingen die mensen hadden meegemaakt die zich niet lieten vertalen in geschreven regels code of opgeloste bugs? Het zorgde voor een rijke stroom aan prachtige anekdotes, verhalen en complimenten. Er was bijvoorbeeld iemand die vertelde hoe dit zijn eerste Wikimedia-bijeenkomst ooit was en hoe fijn hij door iedereen was ontvangen. Ik kan iedereen aanraden die een dergelijke conferentie organiseert om ook een intangible presentatie te doen.
Naast het coden waren er ook lezingen, waaronder eentje die ik zelf hield. Ik vertelde vooral over wat ik allemaal heb geleerd in de afgelopen negen jaar als tool developer. U kunt hier de notities teruglezen (er zijn geen video-opnames gemaakt).
Na die lezing werd ik aangesproken door een studente kunstgeschiedenis van de Ionische Universiteit op Corfu. Of ik nog tips had hoe zij als Wikipedian in Residence in een museum aan de slag kon (ik was zelf in 2013 de eerste Nederlandse Wikipedian in Residence). Ik drukte haar op het hart om vooral te kijken of ze binnen kon komen via de afdeling registraties of datamanagement. Informatieprofessionals snappen Wikipedia vaak beter dan curatoren of de directie.
AI
Een onderwerp van veel lezingen was hoe de gemeenschap om moet gaan met de snelle opkomst van AI. De data van Wikipedia wordt veel gebruikt om AI-modellen te trainen, maar ironisch genoeg doet de gemeenschap er zelf nog vrij weinig mee. Betrouwbaarheid is één van de belangrijkste pijlers onder de projecten. Dat laat zich lastig combineren met taalmodellen die nog wel eens zelf bronnen “fabriceren”. Een taalmodel dat alléén is gevoed met Wikimedia-content is helaas geen optie, daarvoor is zelfs die enorme hoeveelheid data niet voldoende.
Kansen zijn er echter genoeg. Bijvoorbeeld het samenvatten van lange stukken tekst. Of dat een goed idee is bij Wikipedia-artikelen weet ik nog niet. Maar voor de ellenlange discussies kan het mogelijk heel interessant zijn. Discussies op de encyclopedie hebben regelmatig de lengte van een universiteitsscriptie, als een AI dat een beetje zou kunnen samenvatten zou dat wellicht mijn enthousiasme om meer deel te nemen aan die discussies kunnen bevorderen.
Het ongrijpbare resultaat
Wat levert drie dagen hacken nou op? Dat zijn niet de meetbare resultaten, zoals het aantal geschreven regels code of het aantal gefixte bugs. Het is het feit dat ik na zo’n evenement thuiskom en zin heb om nieuwe dingen te gaan maken. Of terugdenk aan hoe tof het is om met een internationale groep van kennisnerds samen te werken. The intangible dus.
PS: in de vorige Circulaire schreef ik dat u iets aan mij kon doneren om een Griekse salade te bestellen. Mijn schoonvader bleek toevallig ook in de buurt te zijn van Athene en trakteerde mij op een Griekse maaltijd. Een donatie in natura dus. Bedankt Frans!
De beste linkjes
Podcast Freakonomics heeft een uitstekende driedelige reeks over de vraag wat musea moeten met de kunst die ze (al dan niet illegaal) in de koloniale tijd hebben verzameld.
Diep in de Sahara zijn gekke cirkels te zien. Wie heeft ze gemaakt en wat zijn het? Deze mini-documentaire van Vox is superinteressant en laat tevens heel goed zien hoe je in deze tijd (digitaal) onderzoeksjournalistiek bedrijft.
Ik zat de afgelopen week lang in een vliegtuig, dus ik kon eindelijk dit uitstekende stuk van 10.000 woorden lezen over kunstmatige en post-kunstmatige teksten, en wat dat te maken heeft met AI. Aanrader!
Rutger Pontzen legt uit waarom hij (inmiddels) vindt dat er een goede reden is dat musea inclusiever en diverser worden, en dat mensen die beweren dat het geforceerd is de geschiedenis niet goed hebben gevolgd.
Een maand geleden bracht een anonieme muzikant een “nieuw” nummer uit van Drake en The Weeknd, met AI-gegenereerde stemmen. Wat dat betekent voor de toekomst van muzikanten, en hoe de situatie in Japan een goed voorbeeld is van wat er in het Westen gaat gebeuren.
Aan het begin van deze eeuw won een Kroaat griezelig vaak met roulette in grote casino’s. Hoe Niko Tosa miljoenen verdiende met rien ne va plus.
Audioboeken op drie keer de snelheid luisteren zodat je meer informatie opneemt. En andere van dat soort manieren om efficiënt informatie op te nemen zijn een slecht idee.
Nederland heeft, in tegenstelling tot veel andere Europese landen, geen mogelijkheid in de wet opgenomen voor archiefinstellingen om sites legaal te archiveren. Instellingen zoals de Koninklijke Bibliotheek moeten dus elke sitebeheerder individueel vragen of dat wel mag. Dat moet makkelijker kunnen, aldus Martijn Kleppe en Susan Aasman.
Dat het een teringzooi is bij de Belastingdienst is geen nieuws. En ook niet dat ze er zeer slordig omgaan met persoonsgegevens. Maar dit NRC-stuk laat nog eens heel duidelijk zien hoe bizar slecht de Belastingdienst omgaat met jouw privé-gegevens.
Studenten die ChatGPT gebruiken? Je hebt geen idee hoeveel en hoe vaak ze dat al doen.
“Wie denk je wel dat ik ben, als je iemand zoals ik met zo'n minachting behandelt?”. Zelfs in het oude Mesopotamië (1750 v.c.) hadden ze al klachtenbrieven. (via ReindeR)
Over hoe Gandhi (geen) fan was van nucleaire wapens in de oude Civilization-spellen. (via Vera)
Leuk als je even niks te doen hebt tijdens de wiskundeles: How To Entertain With Your Pocket Calculator (1975).
Handig voor als de Derde Wereldoorlog uitbreekt: IKEA-bunkers gegenereerd met Midjourney. (via Bella)
Heeft u nog wat oude Game Boy-cartridges liggen? Maak een foto van de printplaat en zet het om naar een ROM.
De beste gifjes
Lotte Belice, mijn zeer behulpzame chef kattengifjes, doet al jaren boodschappen voor een oudere mevrouw bij ons in de buurt. Als u zich afvraagt wat een dame van 94 jaar allemaal van de lokale supermarkt wilt hebben kunt u op Lotte’s Instagram haar boodschappenbriefjes lezen.
De verzorger van deze struisvogel moet na dit incidentje ook naar de supermarkt.
En de vogels van dit nestje mogen ook naar de bouwmarkt.
En deze kat heeft er nog een handeltje naast met gestolen hondenbrokjes.
En een bonuskat! Trouwe lezer Marianne stuurde een filmpje van haar kat Aslan die zo op Wimbledon kan invallen.
En dat was het!
Op 12 juni verschijnt de laatste Circulaire van dit seizoen, daarna gaat deze nieuwsbrief een paar maanden met zomerstop. Die laatste editie is bijzonder, want die verschijnt in dezelfde week dat uw hoofdredacteur 40 jaar oud wordt (💀). Ik presenteer u dan de veertig dingen die ik de afgelopen veertig jaar heb geleerd.
Tot dan!
Het verzenden van deze nieuwsbrief kost mij maandelijks rond de vijftig euro. Wilt u me graag een beetje ondersteunen? Overweeg dan eens om een kleine donatie te doen. Drie trouwe lezers deden dat de afgelopen twee weken, waarvoor mijn hartelijke dank!