Ollama er et lite program som lar deg tilpasse store språkmodeller som GPT-oss, Deepseek, Mistral og Gemma til din virksomhets rutiner og arbeidsflyter.
Tenk på Ollama som et strømuttak for lokale språkmodeller: du plugger inn den modellen du trenger, og verktøyene dine kan be den lese, skrive og svare for deg.
Dette er et praktisk grep for digital transformasjon: raskere eksperimentering, lavere kost per oppgave når volumet øker, og full kontroll på hvor data behandles. Du kan starte litt denne uken, lære underveis og skalere når effekten er dokumentert.
Les også: ChatGPT-5: Overlever virksomheten din uten?
Hva får du ut av Ollama?
- Raskere tekstarbeid: e-poster, rapportutkast, møtenotater, oppsummeringer.
- Svar basert på dine dokumenter og systemer, ikke generelt nettinnhold.
- Forutsigbar kost og datakontroll – nyttig når du forholder deg til volum og krav.
Ollama gjør digitalisering enkelt. Det er ikke et stort IT-prosjekt. Det er en måte å ta i bruk KI i kjerneprosessene dine – i passende størrelse, på dine premisser.
Hvorfor du som leder bør vurdere Ollama
Når språkmodellen står nær folkene dine og dataene deres, blir veien fra idé til effekt kortere. Du ser det i kalenderen først: færre runder for å få godkjent verktøy, færre avklaringer om hvor data havner, flere små leveranser som faktisk tas i bruk.
Kvaliteten følger etter fordi svarene bygger på egne avtaler, maler og rutiner – ikke på generelle antakelser.Tenk en salgsuke der førsteutkastet til tilbudet allerede speiler prisbok, tidligere leveranser og kapasitet.
Juristen retter mindre, selgeren bruker mer tid på kundens behov, og lederen får bedre kontroll på risiko.
Slik akkumuleres læring uten store prosjekter: vi utpeker en prosesseier, setter få og tydelige suksesskriterier, og evaluerer annenhver uke. Når tallene går riktig vei, skalerer vi – ikke før.
Les mer: Forretningsutvikling uten AI er umulig: Utdaterte strategier og nye løsninger
Forretningsmuligheter på egne data
Virksomheten din sitter allerede på gull: avtaler, produktark, manualer, prosjektmapper og møtenotater. Med Ollama tilgjengelig der folk jobber, blir dette innholdet lettere aktivert i daglige arbeidsflyter.
Kundeservice svarer med ordlyd som matcher vilkårene dine. Prosjektledere får presise sammendrag med pekere til kilden, og drift leverer ryddigere avviksmeldinger og rapporter fordi teksten starter riktig, ikke bare slutter riktig.
Nøkkelen er å velge et sted å begynne. Finn arbeidsflyten der tidsbruken svir mest, gi modellen tilgang til et avgrenset sett pålitelige kilder, og mål tid per sak og treff på første forsøk uke for uke.
Når folk merker at hverdagen blir lettere og kvaliteten stiger, kommer neste brukstilfelle av seg selv.
Les også: KI-strategi – Nøling koster bedriften din konkurransefortrinnet
Denne AI-ordlisten er laget spesielt for ledere i norske virksomheter. Her får du de viktigste begrepene innen kunstig intelligens (KI) kort forklart, uten fagprat.
Gratis E-bok
AI-ordliste: Kunstig intelligens enkelt forklart
Så hva er Ollama egentlig? (Begrepsforklaringer)
Ollama er ikke en språkmodell i seg selv. Det er et program som gjør det enkelt å kjøre språkmodeller (LLM-er) lokalt – altså på din PC, server eller i privat sky.
For ordens skyld: Du kan ikke kjøre hvilken som helst språkmodell. Du kan velge fritt blant de modellene som er del av Ollama sitt bibliotek. Der finner du blant annet åpne modeller fra aktører som Meta, Google, Microsoft, Mistral og OpenAI.
For å få grep på dette, trenger du bare å forstå fire ord:
Språkmodell (LLM)
Dette er selve “motoren” som skriver, oppsummerer og svarer. Eksempler er Llama 3 (Meta), Mistral, Gemma (Google), Phi (Microsoft) og GPT-oss (OpenAI). Hver modell har forskjellige styrker – noen er raske og små, andre er store og flinke til resonnement.
Vektfil
Dette er den konkrete filen som inneholder modellen. Når du laster ned en modell med Ollama, får du en vektfil lagret lokalt. Den kan startes, stoppes og oppdateres etter behov.
Modellkort
Et modellkort er som et produktark. Det beskriver hva modellen er god til, hvilke begrensninger den har, hvordan den ble trent og hvilken lisens som gjelder. Det hjelper deg å velge riktig modell til riktig oppgave.
Prompt og RAG
En prompt er ganske enkelt bestillingen du sender til modellen (f.eks. “skriv et sammendrag av denne kontrakten”).
Hvis du vil at modellen skal bruke dine egne dokumenter, legger du ved relevante utdrag i samme bestilling. Dette kalles RAG (Retrieval Augmented Generation). Det betyr at du først henter frem aktuell tekst, og så lar modellen bruke den for å generere et svar.
Poenget for deg som leder:
Ollama er kjøkkenet, språkmodellene er ingrediensene, og RAG er oppskriften som gjør at maten faktisk smaker som “dine” data. Du trenger ikke kunne teknikken i detalj. Det du bør avklare er:
- Hvilke kilder skal være fasit for oss?
- Hvilken modellstørrelse skal være standard?
- Hvordan måler vi om kvaliteten faktisk blir bedre?
Når de tre er på plass, kan du starte smått – og la teamet lære mens dere bygger videre.
Hva skiller Ollama fra sky-API-er
Når folk spør hva som egentlig er forskjellen, er svaret enklere enn det kan virke: Det handler om hvor språkmotoren kjører, og hvem som har styringen.
Chat i skyen – raskest i gang
Når du bruker ChatGPT i nettleseren eller en app, kjører alt i leverandørens sky. Du slipper installasjon, du får alltid siste versjon, og du betaler ingenting på gratisnivået. For eksperimentering, idémyldring og personlige oppgaver er dette den raskeste veien til verdi.
Sky-API – integrert i systemene dine
Skal du bygge inn språkmodeller i arbeidsflytene dine – for eksempel kundeservice, CRM eller rapportering – trenger du API-tilgang fra en leverandør. Da betaler du per kall, og kostnaden vokser i takt med bruken. Dette er glimrende når du vil teste ideer i liten skala, eller når behovet er sporadisk.
Ollama – din egen modellmotor
Med Ollama laster du ned en språkmodell og kjører den lokalt. Den oppfører seg som et API, men det er ditt eget: ingen tokenregning, ingen avhengighet av en ekstern leverandør, og du styrer selv hvordan dataene håndteres. Det betyr at når bruken blir stor eller dataene er sensitive, har du et verktøy som gir både forutsigbar kost og full kontroll.
Les også: ChatGPT-5: Verktøyet som endrer ditt lederskap
AI-agents krever ikke millionbudsjett, ekspertansettelser eller «disruptive» prosjekter for å skape verdi. Slik gjør du virksomheten din klar til å dra nytte av AI-agenter.
Gratis E-bok
Sjekkliste for oppstart med AI-agenter
Kost/nytte med Ollama: TCO og budsjettposter for SMB-er
Poenget med økonomien er ikke teknologien, det er kroner per løst oppgave. Med Ollama lokalt har du ingen “token-faktura”. Du eier kapasiteten selv, og månedskostnaden er forutsigbar: litt maskinvare, litt driftstid og litt tid til forbedring. Det gjør TCO lett å forklare i ledermøtet.
Tenk slik: “Hva koster det oss å behandle 10 000, 20 000 eller 50 000 saker i måneden?” For sky-API setter du bare inn leverandørens pris per samtale (de regner ofte i tokens – oversett det til pris per sak). For Ollama bruker du din faste månedspris så lenge du holder deg innenfor kapasiteten.
Budsjettlinjene du faktisk trenger
- Maskinvare (kjøp/leie) fordelt på levetid
- Drift (oppdatering, overvåking, strøm) – lav og forutsigbar
- Forbedring (prompt/arbeidsflyt) – timer som uansett følger prosessen
Hold det lite til effekten er bevist; skaler først når tallene støtter det.
Direktekostnader vs. API-bruk
Sky-API er supert i startfasen: null oppstart, betal per sak, lær fort. Ulempen er at hvert kall koster like mye – også når du gjør titusenvis av like oppgaver.
Med Ollama lokalt er logikken motsatt: du betaler fast per måned og marginalkostnaden per sak faller jo mer du bruker løsningen. Du kan i tillegg velge en mindre modell til enkle jobber og spare ytterligere uten at noen faktura øker.
En praktisk måte å tenke på:
- Bruk API når volumet er lavt eller ujevnt, og du vil teste ideer.
- Bruk Ollama lokalt når volumet er stabilt og du vil presse kost per sak ned.
- Bruk hybrid når du vil ha lav kost i grunnlast og fleksibilitet på toppene.
Skaleringskurver og break-even
Se for deg to kurver. Sky-API er en rett linje: dobler du volumet, dobler du kostnaden. Lokal kjøring er trappetrinn: fast pris til kapasiteten er fylt, så et nytt lite trinn.
Et enkelt eksempel med runde tall (bytt med dine):
- Leverandørens pris i sky ≈ 1,00 kr per sak.
- Ollama lokalt (maskinvare + drift) ≈ 12 000 kr per måned.
Break-even: 12 000 kr / 1,00 kr ≈ 12 000 saker per måned.
Under 12 000 saker? Sky er billigst. Over 12 000? Lokalt lønner seg. Midt i mellom? Kjør hybrid: grunnlast lokalt, toppene i sky.
Les også: Markedsanalyse med KI – Mindre flaks, mer vitenskap, optimal vekst
Vi har utviklet Sales Intelligence – en løsning som lar AI-agenter identifisere mulige nye kunder, finne riktige kontaktpersoner, gjøre undersøkelser og skrive personlige e-poster for deg. Du godkjenner, finjusterer om ønskelig og trykker send. Ta kontakt for å komme i gang med AI-drevet salg og markedsføring.Tenk Digitalt Agentflyt
Effektiviser salgsarbeidet med AI
Slik kobles Ollama med dine arbeidsflyter
Målet er å la folk bruke modellen der de allerede jobber. Vi kobler ikke om virksomheten, vi legger en motor under panseret.
Selve motoren kommer fra Ollama, men kontrollverktøy og dashboard settes opp av dere eller partneren deres. Det er små byggesteiner på toppen, ikke store prosjekter.
Tre enkle grep:
- Ett knutepunkt inn i huset: Ollama eksponerer modellen som en tjeneste som Teams, CRM og saksbehandling kan snakke med.
- Et lite kontrollverktøy: En liten tjeneste som ruter forespørsler, setter policy (hva får gå hvor), og logger bruken.
- Én tavle for effekt: Et dashboard som viser volum, svartid og kvalitetssignaler så vi justerer på fakta.
Typiske integrasjonspunkter
Vi starter der verdien oppstår: dialog i Teams/Slack (spør–svar og møtenotater), dokumentflyt i SharePoint/Google Drive, kundearbeid i CRM/ERP (Dynamics, HubSpot, Visma), og oppfølging i saks- og ticketsystem (Jira, Zendesk). For ansatte kjennes dette som en lett utvidelse, ikke et nytt system.
Arkitekturmønstre: RAG og mellomvare
RAG betyr at vi henter riktige avsnitt fra dine kilder før modellen skriver. Kildene kan være dokumentlager, wiki eller fagsystem. Resultatet er svar med kontekst og kildepeker.
Ollama gjør tre jobber i bakgrunnen: den ruter (velger riktig modell og løype), beskytter (maskerer felt som ikke skal ut, stopper lange løp), og henter frem det som trengs (cache og gjenbruk så svarene blir raskere). Dette holder arkitekturen slank, men styrt.
Datakvalitet som konkurransefortrinn
Språkmodellen er ikke smartere enn kildene du gir den. Tre enkle regler løfter kvaliteten raskt: utpek fasit-kilder (hva modellen skal stole mest på), sørg for eier og dato på hvert dokument, og behold sporbarhet. Svarene skal kunne vise hvor teksten kom fra.
Når kildene er rene, blir svarene konsise, like i stil, og tryggere å bruke i kundevendte flater. Det gir kortere vei fra pilot til varig praksis, og en læringssløyfe som faktisk forbedrer prosessen uke for uke.
Les også: Slik får du mest ut av Google Gemini – 10 tips for bedriftsledere
Hvordan kan kunstig intelligens og ny teknologi gi konkrete fordeler i din hverdag som leder? Jan Storehaug holder foredrag som gir praktiske råd, eksempler og løsninger du kan ta i bruk umiddelbart.
Foredrag med Jan Storehaug
Fremtidens verktøy – praktisk bruk av AI med Jan Storehaug
Fra pilot til produksjon: innføring av Ollama i tre faser
Målet er å få effekt i kjerneprosessene – raskt, trygt og målbart. Vi går fra idé til drift i tre trinn som hver avsluttes med en tydelig beslutning: Gå videre, juster, eller stopp.
Fase 1: avklaringsworkshop og use-case-valg
Vi samler prosesseier, fagbrukere, IT/drift og sikkerhet i én kort økt. Poenget er å lande hvor vi starter, hva som er suksess, og hvilke kilder som er “fasit”.
Workshoppen svarer på tre spørsmål:
- Hvor svir det mest? Vi velger én arbeidsflyt med tydelig tidstap eller kvalitetssvikt.
- Er dataene klare? Avgrenset kildeutvalg, kjent eierskap og enkle tilganger.
- Hvordan vet vi at det virker? 2–3 måltall og en enkel før-/nå-måling.
Utfall: problemformulering (én setning), avgrensede datakilder, suksesskriterier og startdato for piloten. Ingen teknologidebatt, bare enighet om hva som skal bli bedre.
Fase 2: pilot på én prosess med klare suksesskriterier
Piloten varer normalt 4–6 uker. Vi bygger minst mulig for å måle mest mulig: en liten integrasjon mot verktøyet folk allerede bruker, og en standard modellmeny (liten/middels/stor) for oppgaven.
Brukergruppen er liten, men representativ, og gir tilbakemeldinger ukentlig. Vi justerer løpende – på kilder, prompt og arbeidsflyt – uten å lage nye prosjekter.
Én kort leveranseliste holder:
- Arbeidsklar flyt i valgt verktøy (f.eks. Teams/CRM)
- Kildeoppsett med sporbarhet til dokumenter
- Målepanel for de tre suksesskriteriene
- Runbook light for feilhåndtering
Ved slutten av piloten sammenligner vi før/etter, sjekker at kvaliteten holder i praksis, og beslutter produksjon. Hvis gevinsten ikke er tydelig, justerer vi eller parkerer uten å ha brent unødvendig tid.
Fase 3: produksjon og gevinstrealisering
Når vi ruller ut bredt, flyttes løsningen fra “smart snarvei” til stabil tjeneste. SLO-ene fra driftskapittelet blir styringspunkt, og vi gir kort opplæring i hvordan oppgaven nå løses.
Gevinstene låses ved å oppdatere prosedyrer og fjerne gamle steg som ikke lenger trengs; ellers sklir hverdagen tilbake til slik den var.
Vi rapporterer månedlig på de samme måltallene som i piloten, og lar neste prosess stå klar i kø. Slik bygger vi kapasitet steg for steg: én prosess i drift, én i pilot, én i avklaring. Kontinuerlig læring, kontinuerlig gevinst, uten å blåse opp organisasjonen.
Les mer: Strategisk ledelse med AI — 10 grep for mer konkurransedyktig lederskap
Tenk Digitalt investornettverk
Oppdag spennende muligheter i Tenk Digitalt sitt investornettverk
Kompetanse og endring for skalering og vekst
Teknologien er klar. Nå handler det om mennesker, rytme og eierskap. Skaleringen lykkes når vi gjør KI til en del av arbeidshverdagen, ikke et sideprosjekt. Vi setter tempo med korte læringssløyfer, tydelige mål per prosess og en enkel beslutningsvei fra innsikt til forbedring.
Poenget er å flytte KI-kompetansen inn i kjernevirksomheten: fagfolkene som bruker løsningen hver dag, blir også de som foreslår forbedringer, og får dem innført uten ventetid.
Dette krever en lettvekts arbeidsform: små endringer ofte, lav terskel for tilbakemeldinger, og en kultur for å måle før og etter. Vi forankrer ansvaret der verdien skapes, og lar IT og sikkerhet være medspillere som gjør det trygt å bevege seg raskt.
Roller og ansvar: produkt-eier, MLOps og sikkerhet
Tenk triangel. Produkt-eier eier prosessen og effekten: hva skal forbedres, for hvem, og hvordan vet vi at det virker.
Machine Learning Operations (MLOps) sørger for at løsningen er stabil, oppdatert og enkel å bruke, én knapp inn, én vei ut, og korte endringsvinduer. Sikkerhet setter rammene og kvalitetssikrer at vi holder oss innenfor lovverk og interne krav uten å stoppe tempoet.
Rollene møtes fast, ser på de samme måltallene og prioriterer neste justering. Ansvarsfordelingen er skarp: produkt-eier beslutter hva vi endrer i prosessen; MLOps beslutter hvordan vi innfører det trygt; sikkerhet godkjenner rammene og følger opp avvik.
Opplæring, adopsjon og kontinuerlig forbedring
Opplæring virker når den skjer i kontekst. Vi lærer folk akkurat det de trenger i verktøyet de allerede bruker, og lar eksempler fra egen dokumentasjon være læreboka. Adopsjon handler ikke om kurskataloger, men om gode førsteopplevelser og raske tilbakemeldingssløyfer.
Én enkel vane holder dette i gang: Demo–mål–juster (ukentlig). Vis én forbedring i fem minutter, vis én målt effekt (tid/kvalitet), og velg én liten justering til neste uke.
Med den vanen får du en organisasjon som lærer kontinuerlig. Folk ser at innsatsen gir utslag på tallene, og forslagene blir konkrete: “Denne teksten bør ligge til grunn”, “denne varianten gir færre feil”, “her må vi stramme til”. Slik vokser kompetansen, prosessene blir skarpere, og virksomheten får et varig fortrinn: evnen til å forbedre seg med små steg – uke for uke – uten å miste fart.
Du har nå alt som trengs for å gå fra idé til varig praksis: en lett arkitektur, klare valg for plassering, et nøkternt kostbilde, og en modell for mennesker og endring som skalerer. Start der friksjonen er størst, mål effekten, og la teamet ditt lære mens dere leverer.
Det er slik digital transformasjon gir varig vekst.
Merk at vi har utviklet to AI-løsninger som automatiserer store deler av både markedsføring (inkludert SEO) og salg for norske virksomheter. Hvis du vil effektivisere dine prosesser kan du lese mer her om vår Marketing Intelligence og Sales Intelligence.
Les mer: AI-innovasjon endrer lederrollen – Norske SMB-er henger etter
FAQ om Ollama
Er Ollama gratis?
Ja, Ollama er gratis å laste ned og bruke. Modellene du kjører kan ha egne lisenser. Sjekk dem før kommersiell bruk.
Funker Ollama på Windows og Mac?
Ja. Det kjører på Mac, Windows og Linux.
Kan jeg bruke Ollama uten internett?
Ja. Last ned modellen én gang, så kan du kjøre helt lokalt.
Støtter Ollama norsk?
Det avhenger av modellen. Moderne modeller (f.eks. Llama/Mistral-familien) håndterer norsk greit.
Kan jeg kjøre flere modeller samtidig?
Ja. Du kan starte flere modeller og rute forespørsler via et lite mellomlag.
Hva er forskjellen på ChatGPT og Ollama?
ChatGPT er en ferdig skytjeneste – du logger inn, skriver, og får svar. Ollama er en lokal motor du kjører selv. Forskjellen er at du med Ollama kan velge mellom mange ulike språkmodeller (Llama, Mistral, Gemma, osv.), og du bestemmer hvor og hvordan de kjører.
Hva skal jeg med Ollama når jeg allerede har ChatGPT?
Hvis du bruker KI mest til idémyldring, tekstutkast eller en-til-en chat, holder ChatGPT. Ollama gir først verdi når du har høyt volum, sensitive data eller behov for fleksibilitet i modellvalg. Det handler om kontroll, kost i skala, og frihet – ikke om å “erstatte” ChatGPT.
Er Ollama “bedre enn ChatGPT”?
Det er ikke enten–eller. Chat-tjenester i sky er supre for idétesting; Ollama er best når du vil kjøre nært dataene dine med forutsigbar kost.
Gir Ollama meg tilgang til egne data?
Ikke automatisk. Uten RAG (Retrieval Augmented Generation) oppfører Ollama seg som en lokal variant av ChatGPT. Skal du bruke egne data, må du koble på en mellomløsning som henter utdrag fra kildene dine og gir dem til modellen ved hvert spørsmål.
Har Ollama permanent tilgang til alle mine filer?
Nei. Ollama lagrer ikke eller “gjennomsøker” dataene dine. Modellen ser kun de tekstbitene du velger å gi den i konteksten til en forespørsel.
Kan jeg integrere Ollama med Teams/Slack/CRM?
Ja. Ollama eksponerer et lokalt API; koble på via en liten tjeneste eller ferdige connector-bibliotek.
Kan Ollama bruke bilder eller lyd?
Det avhenger av modellen. Velg multimodale modeller for bilde/lyd, ellers tekst-kun.
Må jeg lagre alt i en vektordatabase?
Nei. For små case holder ofte en enkel søkeindeks. Vektordatabase blir nyttig når mengden kilder og brukere øker.
Hvordan starter jeg raskest mulig med Ollama?
Installer, velg en passende modell, koble til én arbeidsflyt (f.eks. møtenotater i Teams), mål tid/kvalitet én måned—og bygg videre derfra.







