NTVANorges Tekniske Vitenskapsakademi

Julemøte Trondheim: Menneske-tolkbar maskinlæring med blikk for fysikk

1.12.2023, 17:00 - 1.12.2023, 22:59
Strindveien 2, 7034 Trondheim
Publisert 9.11.2023

Dette foredraget handler om hvordan overveldende strømmer av tekniske måledata kan tolkes av mennesker, omtrent som vi lytter til musikk.

Klimaet, økonomien og verdensfreden krever at vi gjør raske, men sindige endringer, ikke minst ved hjelp av teknologi. For å få det til, må vi forstå virkeligheten bedre. Det krever flere og bedre måledata, og enda bedre tolkning og bruk av disse.

Nye, kontinuerlige avbildende måleteknikker, for eksempel mangekanals hyperspektrale eller termiske videokameraer, gir tekniske stordata så det holder. Riktig brukt, har disse vist seg å ha stort informasjons-potensiale, både innen landbruk, medisin, miljøovervåking, prosessindustri, forsvar og romfart.

Men hvordan tolke og bruke moderne tekniske stordata på en enkel og robust måte? Strømmen av rådata blir overveldende, og både data-tolkningen, lagringen og den praktiske bruken krever derfor en eller annen form for matematisk data-forenkling og statistisk validering.

Vi mennesker deler oss ofte – grovt sett – i to grupper – eksaktikere og omtrentikere. Er man eksaktiker, kan man trives i Matematikkens Hus – der man liker konsise matematiske formler og bevis. På jobb kan man sette opp en kausal modell – et sett med eksakte matematiske ligninger som beskriver hva vi tror det er som skaper variasjon i våre målinger. Så kan vi tilpasse modellen til malstrømmen av faktiske måledata – med varierende hell. Mye god vitenskap er kommet ut av slik hypotetisk-deduktiv modellerings-tankegang. Men hvordan modellere variasjonsmønstre som vi kan se i dataene, men enda ikke forstår? Hvordan modellere det ukjente med differensial-ligninger?

Er man omtrentiker (som foredragsholderen, opprinnelig), trives man best i Huset for Alt Annet Enn Matematikk – kanskje med gammel matte-angst – eller kanskje man bare er litt lat. Da kan man fristes til å «bruke maskinlæring», f.eks. til klassifikasjon og prediksjon, – samle Big Data og trykke på en AI-knapp – så slipper man jo å tenke selv! Men den går ikke. Kunstig Intelligens-feltet har utviklet fantastiske datadrevne, induktive modelleringsverktøy, med stort potensiale til å endre vårt samfunn – på godt og vondt. Men fleksibiliteten og kompleksiteten i disse maskinlæringsmodellene gjør at de krever enorme mengder av velvalgte treningsdata, samt stor menneskelig system-innsikt, for å gi pålitelige løsninger. Å trene opp et dyplærings-nevralnett koster en god del strøm. Men det koster mer å fremskaffe alle treningsdataene. Og aller mest å senere måtte forsvare seg i retten når ens system har gått ufattelig galt.

Foredraget beskriver en tredje vei, som bygger to-vegs bro over Matte-Gapet i samfunnet:

Metodikken funker ikke for alle slags stordata. Men den har vist seg nyttig for mange typer teknisk-naturvitenskapelige målinger, i pragmatiske fagfelt som stordata kybernetikk og kjemometri – spesielt innenfor multivariat instrument-kalibrering. Og det med god grunn:

For selv om tekniske måledata påvirkes av flere ulike variasjonsårsaker, er det resulterende antallet relevante hoved-variasjonsmønstre i en gitt sammenheng som oftest relativt beskjedent – f.eks. 10 eller mindre. Og dersom man bruker moderne mange-kanals instrumenter – måler mange bilde-piksler, mange tidspunkter, mange bølgelengder lys og / eller mange kjemiske stoffer samtidig, kan den overveldende datastrømmen gjøres selv-modellerende! Man kan nemlig anse et moderne måleinstrument som et mange-strengs musikkinstrument, og slappe av mens man lytter til lyd og ulyd i signal-musikken: Man bruker et dataprogram som registrerer harmonier og rytmer – dvs dataenes samvariasjons- hovedmønstre (eigenvektorer), og som reagerer raskt når det kommer unormale disharmonier og arytmier. Slik slipper man naturlovene tett innpå seg.

Eksaktikerne blant oss vil da finne en velutviklet underliggende approksimasjonsteori, og mange akademiske og kommersielle anvendelser for dette. Omtrentikerne vil nok like den åpne musikalske arkitekturen, som lar brukerne nyte synet av både forventede og uventede samvariasjonsmønstre. Den relativt lave dimensjonaliteten i de resulterende datamodellene gjør det nemlig lett å tolke resultatene grafisk – altså ingen black box. Den underliggende, enklest-mulige, lokalt lineære underroms-modelleringen bygger stort sett kun på ungdomsskole-algebra:

A ~ B X C + D

Med andre ord: Ingen grunn til panikk.

Mer som dette

Nyhetsbrev

Februar 2024

Tips om podcaster, interessante arrangementer og dypdykk i et kapittel fra boka 'Bærekfraft og...

Januar 2024

Spennende arrangementer, rekruttering av nye medlemmer og ny NTVA podcast

Til minne om Arve Johnsen

Arve Johnsen er død.

Se mer

Artikler

Kapittel 19: Kjernekraft i Norge?

En ny debatt om kjernekraft har blusset opp. Noen av forklaringene kan være krigen i Europa, en...

Kapittel 15: Den nye grønne steinalderen

Et skifte til en grønnere hverdag forutsetter økt tilgang til en rekke mineraler og materialer....

Kapittel 13: Bærekraft og sårbarhet i moderne...

Finanssystemene er som kroppens blodomløp for den moderne økonomien. De utgjør en kritisk...

Se mer

Publikasjoner

Bærekraft og digitalisering

Bærekraftig utvikling er en nøkkelutfordring i vår tid. Med et økende globalt fotavtrykk, har vi...

Se mer

Arrangementer

Norges forsknings- og teknologisamarbeid med...

De siste 25 år har Kina seilt opp til å bli verdens nest største - og i enkelte sammenhenger...

Bærekraft og sårbarhet i moderne pengesystemer....

Pengesystemene er kritisk infrastruktur i samfunnet. Hva koster det å drive dem? Og er det...

Digitalisering i skole og barnehage i Norge....

Det er mange diskusjoner om bruk av digitale teknologier i skolen og ulike perspektiver kommer til...

Se mer

Del på sosiale medier