Onderzoeker AI Daniel Daza onderzocht hoe de manier kan verbeteren waarop computers grote, onderling verbonden datasets, zogenaamde knowledge graphs (KG's), begrijpen en gebruiken. Deze grafieken organiseren informatie over entiteiten, zoals mensen, organisaties of moleculen, en de relaties daartussen. Hoewel ze uitstekend zijn voor het opslaan en ophalen van gegevens, missen ze vaak subtiele patronen en verbindingen.
Daza ontwikkelde nieuwe manieren voor computers om deze grafieken te analyseren en te begrijpen, waardoor ze patronen kunnen herkennen, complexe vragen kunnen beantwoorden en ontbrekende verbindingen kunnen voorspellen. Een belangrijke motivatie was om beter gebruik te maken van de rijke context in KG's, zoals patronen met groepen entiteiten of aanvullende informatie zoals tekstuele beschrijvingen. Dit heeft praktische toepassingen, zoals het beantwoorden van vragen in natuurlijke taal, het classificeren van entiteiten en het verkennen van biomedische gegevens zoals eiwit-molecuulinteracties. Zijn werk helpt het potentieel van KG's bij het oplossen van echte problemen te vergroten.
Het onderzoek toont aan dat we computers kunnen leren om grote netwerken van informatie, knowledge graphs genaamd, beter te begrijpen en te gebruiken door naar meer te kijken dan alleen naar eenvoudige verbindingen tussen stukjes data. In plaats van alleen te weten dat een persoon verwant is aan een ander, kunnen we bijvoorbeeld groepen relaties en aanvullende details, zoals beschrijvingen of kenmerken, onderzoeken om verborgen patronen te ontdekken.
Hierdoor kunnen computers nu complexere vragen kunnen beantwoorden, zoals het vinden van verbindingen die niet direct worden genoemd, maar waarschijnlijk gebaseerd zijn op context. Ze kunnen ook nieuwe soorten informatie verwerken, zoals het classificeren van gegevens of het analyseren van biomedische details zoals eiwitinteracties, zelfs wanneer er niet veel informatie beschikbaar is. We kunnen slimmer gebruik maken van de informatie die we al hebben, waardoor computers geavanceerdere en praktischere problemen kunnen oplossen.
Daza voerde het onderzoek uit door computermodellen te ontwerpen en te testen om knowledge graphs te analyseren en ervan te leren. Deze modellen simuleren hoe computers patronen in de gegevens kunnen ontdekken, zoals relaties tussen mensen, plaatsen of moleculen. Hij ontwikkelde nieuwe methoden die kijken naar groepen verbindingen (subgraphs) en aanvullende informatie, zoals beschrijvingen of moleculaire structuren, om te verbeteren hoe computers complexe patronen begrijpen en voorspellen.
Om deze methoden te testen, gebruikte hij echte datasets uit verschillende velden, zoals sociale netwerken en biomedische data. Hij evalueerde hoe goed de modellen vragen konden beantwoorden, informatie konden classificeren en nauwkeurige voorspellingen konden doen. Door middel van deze experimenten verfijnde hij de methoden om ervoor te zorgen dat ze efficiënt werkten en konden worden gegeneraliseerd naar nieuwe, ongeziene data. Het werk was sterk afhankelijk van computersimulaties en data-analyse om praktische tools te creëren die kunnen worden toegepast op bestaande problemen.
Meer informatie over het proefschrift