13
januari
2022
|
11:46
Europe/Amsterdam

Studenten helpen Naturalis vlinders herkennen met deep learning

naturalis-fontys

Biodiversiteit monitoren is een uitdaging en die zit ‘m voor Naturalis vooral op het vlak van data. Het biodiversiteitscentrum steunt voor hun onderzoek naar de distributie en verplaatsing van, bijvoorbeeld, vlindersoorten op basis van waarnemingen van vrijwilligers. Zij maken foto’s van vlinders, die door experts geïndexeerd kunnen worden op soort. Zo krijgt Naturalis goede data, zonder zelf het veld in te gaan. Maar wat nou als artificial intelligence (AI) die data direct kan omzetten in bruikbare inzichten?

Citizen Science 
Bijdragen leveren aan wetenschappelijk onderzoek, zonder zelf onderzoeker te zijn gebeurt vaker. Citizen science heet dat, wanneer vrijwilligers data delen van archeologische vondsten of flora en fauna die ze tegenkomen in de natuur. Deze data, inclusief coördinaten en datum, worden gedeeld via een platform of app. Image Recognition Models (IRM) zorgen voor identificatie via de apps Iobs (iOS) en ObsIdentify (Android). Maar identificatie van wat dan op die foto staat kan lastig zijn als de beeldkwaliteit slecht is. Met vlindersoorten, waar dit project betrekking op had, zijn er ook gevallen waar twee soorten niet van elkaar te onderscheiden zijn. Daarnaast worden ook niet overal observaties gedaan, wat voor gaten zorgt in de data.

Species Distribution Models 
Species distribution models kunnen hierin uitkomst in bieden. Op basis van geografische en klimaat-gerelateerde data kan zo’n model voorspellen hoe waarschijnlijk het is dat een soort vlinder voorkomt op locatie X. Dit zou vrijwilligers meteen een identificatie van hun observatie kunnen bieden, en de datakwaliteit voor Naturalis verbeteren. Bovendien maakt dit het mogelijk om voorspellingen te doen over populatie distributie (bijvoorbeeld, op basis van klimaatverandering), en dus ook die gaten in observaties aan te vullen. Het ontwikkelen van zo’n model met AI was de opdracht voor Fontys Hogeschool ICT Studenten Max de Goede, Lars van Driel, Pol Roskam en Jochem Wienk gebaseerd op deep learning AI.

Deep learning voor betere inzichten 
De studenten ontwikkelden de tooling om data te verwerken en samen te voegen voor dit model. Een ‘data pipeline’ die in de toekomst uitgebreid kan worden. Hiervoor waren twee datasets beschikbaar, vertelt student Max de Goede: “De eerste set bestond uit de observaties van vlindersoorten door vrijwilligers via observation.org. Afbeeldingen, met daarbij de soort, coördinaten en datum. De tweede set data was verzameld door Naturalis zelf met geo-factoren, zoals hoogte, klimaat, en andere variabelen.”

Check hier ook de video uit de reeks Eyes on AI. 

 

Hiermee ontwikkelden de studenten een neural network, wat uit de data met deep learning output haalde die voorspellingen mogelijk maakt. De applicatie van deep learning is dan ook de innovatie. Via een reeks stappen leert het systeem daarin zelf conclusies te trekken uit de data, zonder interventie. Max: “Wat opgeleverd is heeft twee dimensies. Het eerste is een model, dat je moet zien als een algoritme wat kan voorspellen hoe waarschijnlijk het is dat een soort vlinder op locatie X aanwezig kan zijn. Het tweede is de mogelijkheid om een kaart te tekenen die laat zien, hoe zeker het model is dat een vlindersoort op diverse locaties aanwezig kan zijn.” In hun paper geven de studenten aan dat dit een start is, een verdere samenwerking met biologen kan helpen het systeem te trainen om nog preciezer te functioneren.

Leren en innoveren in de praktijk 
“Het is erg leerzaam om met een partner samen te werken aan een echte onderzoeksvraag. Ik weet helemaal niks van vlinders, je spreekt dus echt een andere taal als je werkt met een bioloog. Er was ook een data scientist bij betrokken, waar we veel van leerden.” Het prototype van het SDM zou ingezet kunnen worden als ondersteuning in de observatie apps, legt Max uit: “Aan de hand van de data over de leefomstandigheden kan de app bij een observatie aangeven of het soort A of soort B is (wanneer deze onderscheidend zijn), omdat die bepalend zijn voor de verschillende soorten.” Niet alle vlindersoorten kunnen met het algoritme herkend worden. Het model is een proof of concept, wat zich beperkt tot 5 soorten. Naturalis kan dit concept verder uitbouwen om meer voorspellingen te kunnen doen op basis van hun observaties. Max ziet dat graag gebeuren: “Ik hoop dat dit project vervolg krijgt, er kan nog veel meer mee. De techniek groeit en ontwikkelt enorm, dus doorontwikkelen is de vervolgstap.”

Op 3 februari wordt onderzoek van Fontys Hogeschool ICT gepresenteerd tijdens het jaarlijkse ICT in Practice. Je kan je al aanmelden via deze link

Auteur: Guido Segers