• De Circulaire
  • Posts
  • De Circulaire #115: de gestructureerde editie ⛓

De Circulaire #115: de gestructureerde editie ⛓

Hallo! Het is maandag 1 juni, tweede Pinksterdag (geen idee wat dat voor betekenis heeft), we mogen eindelijk weer het terras op (ik zit op de bank) en ons helemaal doodzuipen (ik drink water en misschien een half flesje Cola Zero bij de avondmaaltijd). Gelukkig zijn er ook dingen waar u geen anderhalve meter afstand voor hoeft te houden: deze Circulaire mag u zo dicht bij uw gezicht houden als u wilt (wel bij voorkeur met een niet-medisch mondkapje). Én er is een speciale pubquizbingo omdat deze nieuwsbrief bijna vijf jaar bestaat (maar dan moet u eerst even alles lezen in deze editie).

Veel plezier!

Gestructureerd zoeken

Zoals u wellicht weet doe ik wel eens wat met Wikipedia en aanverwante projecten. Zoals bijvoorbeeld Wikimedia Commons, de centrale mediabank van alle Wikimedia-projecten (zoals Wikipedia). Op Commons zijn inmiddels meer dan 60 miljoen foto's en andere mediabestanden te vinden. Allemaal te gebruiken onder een vrije licentie of zelfs helemaal zonder licentie. Oftewel: gratis en voor niks, vaak wel onder de voorwaarde dat je de auteur vermeldt.

Het zoeken op Commons gaat echter helaas niet altijd even makkelijk. Dat heeft te maken met twee dingen: de metadata van de bestanden is vaak gebrekkig én de zoekinterface is nogal...basaal.

De metadata is gebrekkig omdat woorden in een beschrijving vaak meerdere dingen kunnen betekenen. Een kiwi is bijvoorbeeld zowel een vrucht als een vogel. En die beschrijvingen zijn meestal beschikbaar in slechts één taal. Als je die taal dan niet machtig bent is het lastig zoeken: niet iedereen spreekt Engels, en niet alle beschrijvingen worden gegeven in het Engels.

Maar voor dit probleem is een oplossing bedacht: Structured Data. Je kan mediabestanden beschrijven met behulp van de items op Wikidata. Omdat die items een uniek nummer hebben is er geen verwarring over woorden ('kiwi de vrucht' en 'kiwi de vogel' hebben een apart nummer). Én die items zijn meertalig, dus je bent niet gebonden aan één taal.

Dan is er het tweede probleem: die basale zoekinterface. De standaard zoekmachine toont een hoop informatie die voor de meeste gebruikers weinig nut heeft (zoals bestandsgrootte en resolutie). En de manier om te zoeken op gestructureerde data is weinig gebruiksvriendelijk.

Maar daar heb ik een oplossing voor bedacht: Structured Search. Een nieuwe zoekinterface voor Wikimedia Commons die de afbeeldingen centraal zet, en zo is gemaakt om goed te kunnen zoeken met structured data. Dus je kunt bijvoorbeeld makkelijk zoeken op zowel kiwi's (de vrucht) als op kiwi's (de vogel). Mijn tool is meertalig, en vrijwilligers hebben al vertalingen voor de interface aangeleverd in 11 talen, waaronder het Nederlands (ok, dat was ik zelf), het Italiaans (Ricerca strutturata) en zelfs in het Japans (構造化サーチ).

Er zijn soms nog wat weinig resultaten. Nog lang niet alle mediabestanden op Commons hebben gestructureerde data (we zitten nu rond de 4%), maar dat is een kwestie van tijd en veel (vrijwillig) werk.

Mediadieet

Wat ik de afgelopen weken keek en luisterde.

  • 🌝 De Man en de Maan. Achtdelige podcast over Nederlandse wetenschappers die een radiotelescoop bouwen voor áchter de maan. Ze mogen meeliften op een Chinese satelliet. Je zou denken dat dit een hele nerdy wetenschapspodcast is. Maar het gaat vooral over de culturele verschillen tussen Nederland en China, en hoe dat leidt tot enorme communciatieproblemen en politieke intriges op hoog ambtelijk niveau. Zeer onderhoudend en vlot verteld door maker Saar Slegers, mede dankzij de hoofdpersoon: de sterrenkundige Mark Klein Wolt, die altijd doorgaat in situaties waarin ieder ander het al lang had opgegeven. (★★★★)

  • 🤑 The Missing Cryptoqueen. Nóg een achtdelige podcast (ik luisterde de eerste vijf delen), over de Bulgaarse Dr. Ruja Ignatova die een cryptocurrency bedacht waar miljoenen mensen in gingen investeren. Ignatova verdween met de noorderzon: de cryptomunt bleek een piramidespel. Interssant onderwerp, maar ik mis focus en redactie in deze podcast. Veel informatie wordt eindeloos vaak herhaald en is te fragmentarisch opgenomen. Ook is het af en toe op het prekerige af (ik begrijp na vijf afleveringen wel dat Ignatova een boef is). Een goede eindredacteur had dit tot vijf afleveringen van een half uur kunnen reduceren. (★★☆☆)

  • ⛹🏿‍♂️ The Last Dance. Tiendelige Netflix-docu over het laatste seizoen van Michael Jordan voor de Chicago Bulls, en hoe ze daar kwamen. Prachtig geschoten, met medewerking van vrijwel alle sleutelfiguren uit die periode en uitgebreide archiefbeelden. Zelfs leuk als je geen bijzondere interesse hebt in basketball (hoi). Enige minpuntje: het heen en weer springen in de tijd tussen de verschillende jaren is af en toe wat verwarrend. (★★★★)

Rare tijden

Het zijn rare tijden. En daarom heb ik een nutteloze Chrome extensie gemaakt die dat stomme zinnetje automatisch voor ELK artikel zet op de grootste Nederlandse nieuwssites.

En als je nog niet genoeg hebt van rare tijden tipte Marc me nog deze video die laat zien dat alle corona-reclama's hetzelfde zijn.

15 linkjes

3 gifjes

Zoals elke keer weer fantastisch gecureerd door de superlieve Lotte Belice!

Deze kat heeft wat met kersen.

Deze alpaca heeft niets met een nieuw vriendje dat zich niet normaal gedraagt.

En dit schaap is gewoon lekker zichzelf en staat graag in de spotlights.

Dat was het!

Over twee weken is het maandag 15 juni, en dan verschijnt behalve deze nieuwsbrief ook de nieuwe, 37-jarige editie van uw hoofdredacteur want dan ben ik 🎉jarig🎉.

Een dag later, op dinsdag 16 juni, is het precies vijf jaar geleden dat de allereerste Circulaire verscheen (time flies when you're writing newsletters). Om dat te vieren organiseer ik dan de allereerste Circulaire pubquizbingo. In de vorige editie al aangekondigd, en toen schreven zich opeens 15 mensen in, dus nu ben ik bang dat ik het ook echt moet organiseren.

Inschrijven voor de pubquizbingo is simpel: u stuurt een reply op deze nieuwsbrief en geeft aan dat u wilt meedoen. We beginnen om 19.30. Pubquizbingokaarten en verdere instructies verschijnen automatisch in uw mailbox. U mag meedoen met een team, maar dan moet u de geweldige prijzen wel delen met uw teamgenoten. Als u zich al heeft ingeschreven bij de vorige nieuwsbrief hoeft u dat niet nogmaals te doen: op die manier maakt u geen extra kans op de geweldige prijzen.

Tot over twee weken!