Julemøte Trondheim: Menneske-tolkbar maskinlæring med blikk for fysikk

1.12.2023, 17:00 - 1.12.2023, 22:59
Strindveien 2, 7034 Trondheim
Publisert 9.11.2023

Dette foredraget handler om hvordan overveldende strømmer av tekniske måledata kan tolkes av mennesker, omtrent som vi lytter til musikk.

Klimaet, økonomien og verdensfreden krever at vi gjør raske, men sindige endringer, ikke minst ved hjelp av teknologi. For å få det til, må vi forstå virkeligheten bedre. Det krever flere og bedre måledata, og enda bedre tolkning og bruk av disse.

Nye, kontinuerlige avbildende måleteknikker, for eksempel mangekanals hyperspektrale eller termiske videokameraer, gir tekniske stordata så det holder. Riktig brukt, har disse vist seg å ha stort informasjons-potensiale, både innen landbruk, medisin, miljøovervåking, prosessindustri, forsvar og romfart.

Men hvordan tolke og bruke moderne tekniske stordata på en enkel og robust måte? Strømmen av rådata blir overveldende, og både data-tolkningen, lagringen og den praktiske bruken krever derfor en eller annen form for matematisk data-forenkling og statistisk validering.

Vi mennesker deler oss ofte – grovt sett – i to grupper – eksaktikere og omtrentikere. Er man eksaktiker, kan man trives i Matematikkens Hus – der man liker konsise matematiske formler og bevis. På jobb kan man sette opp en kausal modell – et sett med eksakte matematiske ligninger som beskriver hva vi tror det er som skaper variasjon i våre målinger. Så kan vi tilpasse modellen til malstrømmen av faktiske måledata – med varierende hell. Mye god vitenskap er kommet ut av slik hypotetisk-deduktiv modellerings-tankegang. Men hvordan modellere variasjonsmønstre som vi kan se i dataene, men enda ikke forstår? Hvordan modellere det ukjente med differensial-ligninger?

Er man omtrentiker (som foredragsholderen, opprinnelig), trives man best i Huset for Alt Annet Enn Matematikk – kanskje med gammel matte-angst – eller kanskje man bare er litt lat. Da kan man fristes til å «bruke maskinlæring», f.eks. til klassifikasjon og prediksjon, – samle Big Data og trykke på en AI-knapp – så slipper man jo å tenke selv! Men den går ikke. Kunstig Intelligens-feltet har utviklet fantastiske datadrevne, induktive modelleringsverktøy, med stort potensiale til å endre vårt samfunn – på godt og vondt. Men fleksibiliteten og kompleksiteten i disse maskinlæringsmodellene gjør at de krever enorme mengder av velvalgte treningsdata, samt stor menneskelig system-innsikt, for å gi pålitelige løsninger. Å trene opp et dyplærings-nevralnett koster en god del strøm. Men det koster mer å fremskaffe alle treningsdataene. Og aller mest å senere måtte forsvare seg i retten når ens system har gått ufattelig galt.

Foredraget beskriver en tredje vei, som bygger to-vegs bro over Matte-Gapet i samfunnet:

Metodikken funker ikke for alle slags stordata. Men den har vist seg nyttig for mange typer teknisk-naturvitenskapelige målinger, i pragmatiske fagfelt som stordata kybernetikk og kjemometri – spesielt innenfor multivariat instrument-kalibrering. Og det med god grunn:

For selv om tekniske måledata påvirkes av flere ulike variasjonsårsaker, er det resulterende antallet relevante hoved-variasjonsmønstre i en gitt sammenheng som oftest relativt beskjedent – f.eks. 10 eller mindre. Og dersom man bruker moderne mange-kanals instrumenter – måler mange bilde-piksler, mange tidspunkter, mange bølgelengder lys og / eller mange kjemiske stoffer samtidig, kan den overveldende datastrømmen gjøres selv-modellerende! Man kan nemlig anse et moderne måleinstrument som et mange-strengs musikkinstrument, og slappe av mens man lytter til lyd og ulyd i signal-musikken: Man bruker et dataprogram som registrerer harmonier og rytmer – dvs dataenes samvariasjons- hovedmønstre (eigenvektorer), og som reagerer raskt når det kommer unormale disharmonier og arytmier. Slik slipper man naturlovene tett innpå seg.

Eksaktikerne blant oss vil da finne en velutviklet underliggende approksimasjonsteori, og mange akademiske og kommersielle anvendelser for dette. Omtrentikerne vil nok like den åpne musikalske arkitekturen, som lar brukerne nyte synet av både forventede og uventede samvariasjonsmønstre. Den relativt lave dimensjonaliteten i de resulterende datamodellene gjør det nemlig lett å tolke resultatene grafisk – altså ingen black box. Den underliggende, enklest-mulige, lokalt lineære underroms-modelleringen bygger stort sett kun på ungdomsskole-algebra:

A ~ B X C + D

Med andre ord: Ingen grunn til panikk.

Mer som dette

Nyhetsbrev

Nyhetsbrev Juni 2024

Vi dykker ned i et kapittel fra vår nyeste bok, viser opptak fra vårt siste møte, forteller om...

Mai 2024

Utdeling av ærespris, videoopptak av møte om Kina, møt vår nye president og dykk ned i et kapittel...

April 2024

Møter, æresprisutdeling og nye medlemmer i akademiet

Se mer

Artikler

Kapittel 3: Operasjonene som forsvant

Sykdommer i hjertet er den viktigste dødsårsaken i vår del av verden. I 1970-årene kom...

Kapittel 27: Vi er alle borgere i Digitalistan

Verdensveven var en allmenning, en vidunderlig gave til menneskene. Men den tiltrakk seg...

Kapittel 26: Data er den nye politikken

Du kan beskytte fortiden mot fremtiden, og du kan beskytte fremtiden mot fortiden – men du kan ikke...

Se mer

Publikasjoner

Teknologien endrer samfunnet

Teknologi endrer samfunn, noe som knapt nok er en nyhet. Om vi betrakter alt som er oppfunnet...

Den digitale hverdagen

Boken er den tredje i en serie fra Norges Tekniske Vitenskapsakademi, som tar for seg hvordan...

Det nye digitale Norge

Boken Det nye digitale Norge er en artikkelsamling som gir en oversikt over hvordan digitalisering...

Se mer

Arrangementer

Julemøte (nyttårsbord) i Trondheim

NTVA inviterer til vårt tradisjonelle rakfisklag på Lerchendal gård i Trondheim, men denne gangen...

Tap av naturmangfold – en stille krise?

Tap av naturmangfold er en av vår tids største utfordringer, tett sammenvevd med klimakrisen. Hva...

Fiskevelferd

Hvordan står det egentlig til med laksens velferd i norske oppdrettsanlegg, og hva kan vi gjøre for...

Se mer

Del på sosiale medier