Hitta rätt detaljer i Big Data

Carolina Wählby och hennes forskargrupp ska utveckla metoder att hitta vetenskapligt relevant information i stora datamängder.

Hallå där, Carolina Wählby, professor vid institutionen för informationsteknologi, som tilldelats 29 miljoner kronor från Stiftelsen för Strategisk Forskning till projektet "Hierarkisk analys av bilddata i tid och rum". Grattis till bidraget! Hur känns det?

– Tack! Självklart känns det väldigt roligt, men också som ett stort ansvar för att genomföra våra planer! Jag tycker att vi har fått ihop ett mycket bra projektteam med kompletterande kompetenser och externa partners med spännande problemställningar och stort intresse för grundforskning och långsiktigt satta mål, så jag ser fram emot att komma igång!

Projektet heter ”Hierarkisk analys av bilddata i tid och rum” och i projektgruppen ingår IT-kollegan Andreas Hellander och medsökande Ola Spjuth från Institutionen för farmaceutisk biovetenskap, samt samarbetspartners Astra Zeneca, Vironova och Stockholms universitet. Vad handlar det om?

– Idag finns många olika avbildande system som samlar in stora mängder data, och med hjälp av digital bildbehandling och analys kan man automatiskt detektera och kvantifiera mönster och förlopp. Men analysen är resurskrävande, och oftast är den vetenskapligt värdefulla informationen glest utspridd både över tid och rum. Därför vill vi utveckla beräkningseffektiva mått för att beskriva sannolikheten att en del av en bild eller tidssekvens innehåller vetenskapligt relevant information.

– Vi kommer använda maskininlärningsmetoder och bygga upp ett ramverk för intelligenta informationshierarkier som kan fördela data till beräkningsresurser och lagringsalternativ baserat på relevans.  Fokus ligger på mikroskopibilder av hur celler tar upp läkemedel, i samarbete med Astra Zeneca, nanometer-upplöst elektronmikroskopidata i samarbete med Vironova, och digital patologi i samarbete med Mats Nilsson vid Stockholms universitet och SciLifeLab.

Det låter som att forskningen är inriktad på tillämpningar inom life science. Kan metoderna komma till nytta även inom andra områden?

– Stora datamängder är ju inte alls unikt för life science, och relevant information är glest utspridd i många andra vetenskapliga och industriella tillämpningar, som till exempel övervakning och kvalitetskontroll, så jag tror att det kan finnas många olika tillämpningar för den här typen av hierarkisk informationsanalys.

Vad kommer de 29 miljonerna att gå till?

– I första hand kommer pengarna gå till att rekrytera rätt personer för att förverkliga våra idéer. En del pengar kommer också gå till att mötas och arbeta i varandras miljöer, för att på bästa sätt förstå både möjligheter, flaskhalsar och behov. Jag är övertygad om att personliga möten och kommunikation är absolut nödvändigt för att driva forskningen på bästa sätt.

---

Läs mer:

Peter Waites

20 mars 2017