Hva er Ollama? Og hvordan fungerer det? - Tenk Digitalt
Ollama sin maskot med en kappe laget av et norsk flagg - omringet av LLM-logoer.

Hva er Ollama? Og hvordan fungerer det?

Ollama er et lite program som lar deg tilpasse store språkmodeller som GPT-oss, Deepseek, Mistral og Gemma til din virksomhets rutiner og arbeidsflyter.

Tenk på Ollama som et strømuttak for lokale språkmodeller: du plugger inn den modellen du trenger, og verktøyene dine kan be den lese, skrive og svare for deg.

Dette er et praktisk grep for digital transformasjon: raskere eksperimentering, lavere kost per oppgave når volumet øker, og full kontroll på hvor data behandles. Du kan starte litt denne uken, lære underveis og skalere når effekten er dokumentert.

Les også: ChatGPT-5: Overlever virksomheten din uten?

Hva får du ut av Ollama?

  • Raskere tekstarbeid: e-poster, rapportutkast, møtenotater, oppsummeringer.
  • Svar basert på dine dokumenter og systemer, ikke generelt nettinnhold.
  • Forutsigbar kost og datakontroll – nyttig når du forholder deg til volum og krav.

Ollama gjør digitalisering enkelt. Det er ikke et stort IT-prosjekt. Det er en måte å ta i bruk KI i kjerneprosessene dine – i passende størrelse, på dine premisser.

Hvorfor du som leder bør vurdere Ollama

Når språkmodellen står nær folkene dine og dataene deres, blir veien fra idé til effekt kortere. Du ser det i kalenderen først: færre runder for å få godkjent verktøy, færre avklaringer om hvor data havner, flere små leveranser som faktisk tas i bruk.

Kvaliteten følger etter fordi svarene bygger på egne avtaler, maler og rutiner – ikke på generelle antakelser.Tenk en salgsuke der førsteutkastet til tilbudet allerede speiler prisbok, tidligere leveranser og kapasitet.

Juristen retter mindre, selgeren bruker mer tid på kundens behov, og lederen får bedre kontroll på risiko.

Slik akkumuleres læring uten store prosjekter: vi utpeker en prosesseier, setter få og tydelige suksesskriterier, og evaluerer annenhver uke. Når tallene går riktig vei, skalerer vi – ikke før.

Les mer: Forretningsutvikling uten AI er umulig: Utdaterte strategier og nye løsninger

Forretningsmuligheter på egne data

Virksomheten din sitter allerede på gull: avtaler, produktark, manualer, prosjektmapper og møtenotater. Med Ollama tilgjengelig der folk jobber, blir dette innholdet lettere aktivert i daglige arbeidsflyter.

Kundeservice svarer med ordlyd som matcher vilkårene dine. Prosjektledere får presise sammendrag med pekere til kilden, og drift leverer ryddigere avviksmeldinger og rapporter fordi teksten starter riktig, ikke bare slutter riktig.

Nøkkelen er å velge et sted å begynne. Finn arbeidsflyten der tidsbruken svir mest, gi modellen tilgang til et avgrenset sett pålitelige kilder, og mål tid per sak og treff på første forsøk uke for uke.

Når folk merker at hverdagen blir lettere og kvaliteten stiger, kommer neste brukstilfelle av seg selv.

Les også: KI-strategi – Nøling koster bedriften din konkurransefortrinnet

Gratis E-bok

AI-ordliste: Kunstig intelligens enkelt forklart

Denne AI-ordlisten er laget spesielt for ledere i norske virksomheter. Her får du de viktigste begrepene innen kunstig intelligens (KI) kort forklart, uten fagprat.

Så hva er Ollama egentlig? (Begrepsforklaringer)

Ollama er ikke en språkmodell i seg selv. Det er et program som gjør det enkelt å kjøre språkmodeller (LLM-er) lokalt – altså på din PC, server eller i privat sky.

For ordens skyld: Du kan ikke kjøre hvilken som helst språkmodell. Du kan velge fritt blant de modellene som er del av Ollama sitt bibliotek. Der finner du blant annet åpne modeller fra aktører som Meta, Google, Microsoft, Mistral og OpenAI.

For å få grep på dette, trenger du bare å forstå fire ord:

Språkmodell (LLM)

Dette er selve “motoren” som skriver, oppsummerer og svarer. Eksempler er Llama 3 (Meta), Mistral, Gemma (Google), Phi (Microsoft) og GPT-oss (OpenAI). Hver modell har forskjellige styrker – noen er raske og små, andre er store og flinke til resonnement.

Vektfil

Dette er den konkrete filen som inneholder modellen. Når du laster ned en modell med Ollama, får du en vektfil lagret lokalt. Den kan startes, stoppes og oppdateres etter behov.

Modellkort

Et modellkort er som et produktark. Det beskriver hva modellen er god til, hvilke begrensninger den har, hvordan den ble trent og hvilken lisens som gjelder. Det hjelper deg å velge riktig modell til riktig oppgave.

Prompt og RAG

En prompt er ganske enkelt bestillingen du sender til modellen (f.eks. “skriv et sammendrag av denne kontrakten”).

Hvis du vil at modellen skal bruke dine egne dokumenter, legger du ved relevante utdrag i samme bestilling. Dette kalles RAG (Retrieval Augmented Generation). Det betyr at du først henter frem aktuell tekst, og så lar modellen bruke den for å generere et svar.

Poenget for deg som leder:

Ollama er kjøkkenet, språkmodellene er ingrediensene, og RAG er oppskriften som gjør at maten faktisk smaker som “dine” data. Du trenger ikke kunne teknikken i detalj. Det du bør avklare er:

  • Hvilke kilder skal være fasit for oss?
  • Hvilken modellstørrelse skal være standard?
  • Hvordan måler vi om kvaliteten faktisk blir bedre?

Når de tre er på plass, kan du starte smått – og la teamet lære mens dere bygger videre.

Hva skiller Ollama fra sky-API-er

Når folk spør hva som egentlig er forskjellen, er svaret enklere enn det kan virke: Det handler om hvor språkmotoren kjører, og hvem som har styringen.

Chat i skyen – raskest i gang

Når du bruker ChatGPT i nettleseren eller en app, kjører alt i leverandørens sky. Du slipper installasjon, du får alltid siste versjon, og du betaler ingenting på gratisnivået. For eksperimentering, idémyldring og personlige oppgaver er dette den raskeste veien til verdi.

Sky-API – integrert i systemene dine

Skal du bygge inn språkmodeller i arbeidsflytene dine – for eksempel kundeservice, CRM eller rapportering – trenger du API-tilgang fra en leverandør. Da betaler du per kall, og kostnaden vokser i takt med bruken. Dette er glimrende når du vil teste ideer i liten skala, eller når behovet er sporadisk.

Ollama – din egen modellmotor

Med Ollama laster du ned en språkmodell og kjører den lokalt. Den oppfører seg som et API, men det er ditt eget: ingen tokenregning, ingen avhengighet av en ekstern leverandør, og du styrer selv hvordan dataene håndteres. Det betyr at når bruken blir stor eller dataene er sensitive, har du et verktøy som gir både forutsigbar kost og full kontroll.

Les også: ChatGPT-5: Verktøyet som endrer ditt lederskap

Gratis E-bok

Sjekkliste for oppstart med AI-agenter

AI-agents krever ikke millionbudsjett, ekspertansettelser eller «disruptive» prosjekter for å skape verdi. Slik gjør du virksomheten din klar til å dra nytte av AI-agenter.

Kost/nytte med Ollama: TCO og budsjettposter for SMB-er

Poenget med økonomien er ikke teknologien, det er kroner per løst oppgave. Med Ollama lokalt har du ingen “token-faktura”. Du eier kapasiteten selv, og månedskostnaden er forutsigbar: litt maskinvare, litt driftstid og litt tid til forbedring. Det gjør TCO lett å forklare i ledermøtet.

Tenk slik: “Hva koster det oss å behandle 10 000, 20 000 eller 50 000 saker i måneden?” For sky-API setter du bare inn leverandørens pris per samtale (de regner ofte i tokens – oversett det til pris per sak). For Ollama bruker du din faste månedspris så lenge du holder deg innenfor kapasiteten.

Budsjettlinjene du faktisk trenger

  • Maskinvare (kjøp/leie) fordelt på levetid
  • Drift (oppdatering, overvåking, strøm) – lav og forutsigbar
  • Forbedring (prompt/arbeidsflyt) – timer som uansett følger prosessen

Hold det lite til effekten er bevist; skaler først når tallene støtter det.

Direktekostnader vs. API-bruk

Sky-API er supert i startfasen: null oppstart, betal per sak, lær fort. Ulempen er at hvert kall koster like mye – også når du gjør titusenvis av like oppgaver.

Med Ollama lokalt er logikken motsatt: du betaler fast per måned og marginalkostnaden per sak faller jo mer du bruker løsningen. Du kan i tillegg velge en mindre modell til enkle jobber og spare ytterligere uten at noen faktura øker.

En praktisk måte å tenke på:

  • Bruk API når volumet er lavt eller ujevnt, og du vil teste ideer.
  • Bruk Ollama lokalt når volumet er stabilt og du vil presse kost per sak ned.
  • Bruk hybrid når du vil ha lav kost i grunnlast og fleksibilitet på toppene.

Skaleringskurver og break-even

Se for deg to kurver. Sky-API er en rett linje: dobler du volumet, dobler du kostnaden. Lokal kjøring er trappetrinn: fast pris til kapasiteten er fylt, så et nytt lite trinn.

Et enkelt eksempel med runde tall (bytt med dine):

  • Leverandørens pris i sky ≈ 1,00 kr per sak.
  • Ollama lokalt (maskinvare + drift) ≈ 12 000 kr per måned.

Break-even: 12 000 kr / 1,00 kr ≈ 12 000 saker per måned.
Under 12 000 saker? Sky er billigst. Over 12 000? Lokalt lønner seg. Midt i mellom? Kjør hybrid: grunnlast lokalt, toppene i sky.

Les også: Markedsanalyse med KI – Mindre flaks, mer vitenskap, optimal vekst

Tenk Digitalt Agentflyt

Effektiviser salgsarbeidet med AI

Vi har utviklet Sales Intelligence – en løsning som lar AI-agenter identifisere mulige nye kunder, finne riktige kontaktpersoner, gjøre undersøkelser og skrive personlige e-poster for deg. Du godkjenner, finjusterer om ønskelig og trykker send. Ta kontakt for å komme i gang med AI-drevet salg og markedsføring.

Slik kobles Ollama med dine arbeidsflyter

Målet er å la folk bruke modellen der de allerede jobber. Vi kobler ikke om virksomheten, vi legger en motor under panseret.

Selve motoren kommer fra Ollama, men kontrollverktøy og dashboard settes opp av dere eller partneren deres. Det er små byggesteiner på toppen, ikke store prosjekter.

Tre enkle grep:

  1. Ett knutepunkt inn i huset: Ollama eksponerer modellen som en tjeneste som Teams, CRM og saksbehandling kan snakke med.
  2. Et lite kontrollverktøy: En liten tjeneste som ruter forespørsler, setter policy (hva får gå hvor), og logger bruken.
  3. Én tavle for effekt: Et dashboard som viser volum, svartid og kvalitetssignaler så vi justerer på fakta.

Typiske integrasjonspunkter

Vi starter der verdien oppstår: dialog i Teams/Slack (spør–svar og møtenotater), dokumentflyt i SharePoint/Google Drive, kundearbeid i CRM/ERP (Dynamics, HubSpot, Visma), og oppfølging i saks- og ticketsystem (Jira, Zendesk). For ansatte kjennes dette som en lett utvidelse, ikke et nytt system.

Arkitekturmønstre: RAG og mellomvare

RAG betyr at vi henter riktige avsnitt fra dine kilder før modellen skriver. Kildene kan være dokumentlager, wiki eller fagsystem. Resultatet er svar med kontekst og kildepeker.

Ollama gjør tre jobber i bakgrunnen: den ruter (velger riktig modell og løype), beskytter (maskerer felt som ikke skal ut, stopper lange løp), og henter frem det som trengs (cache og gjenbruk så svarene blir raskere). Dette holder arkitekturen slank, men styrt.

Datakvalitet som konkurransefortrinn

Språkmodellen er ikke smartere enn kildene du gir den. Tre enkle regler løfter kvaliteten raskt: utpek fasit-kilder (hva modellen skal stole mest på), sørg for eier og dato på hvert dokument, og behold sporbarhet. Svarene skal kunne vise hvor teksten kom fra.

Når kildene er rene, blir svarene konsise, like i stil, og tryggere å bruke i kundevendte flater. Det gir kortere vei fra pilot til varig praksis, og en læringssløyfe som faktisk forbedrer prosessen uke for uke.

Les også: Slik får du mest ut av Google Gemini – 10 tips for bedriftsledere

 

Foredrag med Jan Storehaug

Fremtidens verktøy – praktisk bruk av AI med Jan Storehaug

Hvordan kan kunstig intelligens og ny teknologi gi konkrete fordeler i din hverdag som leder? Jan Storehaug holder foredrag som gir praktiske råd, eksempler og løsninger du kan ta i bruk umiddelbart.

Fra pilot til produksjon: innføring av Ollama i tre faser

Målet er å få effekt i kjerneprosessene – raskt, trygt og mål­bart. Vi går fra idé til drift i tre trinn som hver avsluttes med en tydelig beslutning: Gå videre, juster, eller stopp.

Fase 1: avklaringsworkshop og use-case-valg

Vi samler prosesseier, fagbrukere, IT/drift og sikkerhet i én kort økt. Poenget er å lande hvor vi starter, hva som er suksess, og hvilke kilder som er “fasit”.

Workshoppen svarer på tre spørsmål:

  1. Hvor svir det mest? Vi velger én arbeidsflyt med tydelig tidstap eller kvalitetssvikt.
  2. Er dataene klare? Avgrenset kildeutvalg, kjent eierskap og enkle tilganger.
  3. Hvordan vet vi at det virker? 2–3 måltall og en enkel før-/nå-måling.

Utfall: problemformulering (én setning), avgrensede datakilder, suksesskriterier og startdato for piloten. Ingen teknologi­debatt, bare enighet om hva som skal bli bedre.

Fase 2: pilot på én prosess med klare suksesskriterier

Piloten varer normalt 4–6 uker. Vi bygger minst mulig for å måle mest mulig: en liten integrasjon mot verktøyet folk allerede bruker, og en standard modellmeny (liten/middels/stor) for oppgaven.

Brukergruppen er liten, men representativ, og gir tilbakemeldinger ukentlig. Vi justerer løpende – på kilder, prompt og arbeidsflyt – uten å lage nye prosjekter.

Én kort leveranseliste holder:

  • Arbeidsklar flyt i valgt verktøy (f.eks. Teams/CRM)
  • Kildeoppsett med sporbarhet til dokumenter
  • Målepanel for de tre suksesskriteriene
  • Runbook light for feilhåndtering

Ved slutten av piloten sammenligner vi før/etter, sjekker at kvaliteten holder i praksis, og beslutter produksjon. Hvis gevinsten ikke er tydelig, justerer vi eller parkerer uten å ha brent unødvendig tid.

Fase 3: produksjon og gevinstrealisering

Når vi ruller ut bredt, flyttes løsningen fra “smart snarvei” til stabil tjeneste. SLO-ene fra driftskapittelet blir styringspunkt, og vi gir kort opplæring i hvordan oppgaven nå løses.

Gevinstene låses ved å oppdatere prosedyrer og fjerne gamle steg som ikke lenger trengs; ellers sklir hverdagen tilbake til slik den var.

Vi rapporterer månedlig på de samme måltallene som i piloten, og lar neste prosess stå klar i kø. Slik bygger vi kapasitet steg for steg: én prosess i drift, én i pilot, én i avklaring. Kontinuerlig læring, kontinuerlig gevinst, uten å blåse opp organisasjonen.

Les mer: Strategisk ledelse med AI — 10 grep for mer konkurransedyktig lederskap

 

Tenk Digitalt investornettverk

Oppdag spennende muligheter i Tenk Digitalt sitt investornettverk

Meld deg inn i Tenk Digitalt sitt investornettverk og få eksklusiv tilgang til spennende prosjekter og virksomheter før de tilgjengeliggjøres for offentligheten.

Kompetanse og endring for skalering og vekst

Teknologien er klar. Nå handler det om mennesker, rytme og eierskap. Skaleringen lykkes når vi gjør KI til en del av arbeidshverdagen, ikke et sideprosjekt. Vi setter tempo med korte læringssløyfer, tydelige mål per prosess og en enkel beslutningsvei fra innsikt til forbedring.

Poenget er å flytte KI-kompetansen inn i kjernevirksomheten: fagfolkene som bruker løsningen hver dag, blir også de som foreslår forbedringer, og får dem innført uten ventetid.

Dette krever en lettvekts arbeidsform: små endringer ofte, lav terskel for tilbakemeldinger, og en kultur for å måle før og etter. Vi forankrer ansvaret der verdien skapes, og lar IT og sikkerhet være medspillere som gjør det trygt å bevege seg raskt.

Roller og ansvar: produkt-eier, MLOps og sikkerhet

Tenk triangel. Produkt-eier eier prosessen og effekten: hva skal forbedres, for hvem, og hvordan vet vi at det virker.

Machine Learning Operations (MLOps) sørger for at løsningen er stabil, oppdatert og enkel å bruke, én knapp inn, én vei ut, og korte endringsvinduer. Sikkerhet setter rammene og kvalitetssikrer at vi holder oss innenfor lovverk og interne krav uten å stoppe tempoet.

Rollene møtes fast, ser på de samme måltallene og prioriterer neste justering. Ansvarsfordelingen er skarp: produkt-eier beslutter hva vi endrer i prosessen; MLOps beslutter hvordan vi innfører det trygt; sikkerhet godkjenner rammene og følger opp avvik.

Opplæring, adopsjon og kontinuerlig forbedring

Opplæring virker når den skjer i kontekst. Vi lærer folk akkurat det de trenger i verktøyet de allerede bruker, og lar eksempler fra egen dokumentasjon være læreboka. Adopsjon handler ikke om kurskataloger, men om gode førsteopplevelser og raske tilbakemeldingssløyfer.

Én enkel vane holder dette i gang: Demo–mål–juster (ukentlig). Vis én forbedring i fem minutter, vis én målt effekt (tid/kvalitet), og velg én liten justering til neste uke.

Med den vanen får du en organisasjon som lærer kontinuerlig. Folk ser at innsatsen gir utslag på tallene, og forslagene blir konkrete: “Denne teksten bør ligge til grunn”, “denne varianten gir færre feil”, “her må vi stramme til”. Slik vokser kompetansen, prosessene blir skarpere, og virksomheten får et varig fortrinn: evnen til å forbedre seg med små steg – uke for uke – uten å miste fart.

Du har nå alt som trengs for å gå fra idé til varig praksis: en lett arkitektur, klare valg for plassering, et nøkternt kostbilde, og en modell for mennesker og endring som skalerer. Start der friksjonen er størst, mål effekten, og la teamet ditt lære mens dere leverer.

Det er slik digital transformasjon gir varig vekst.

Merk at vi har utviklet to AI-løsninger som automatiserer store deler av både markedsføring (inkludert SEO) og salg for norske virksomheter. Hvis du vil effektivisere dine prosesser kan du lese mer her om vår Marketing Intelligence og Sales Intelligence.

Les mer: AI-innovasjon endrer lederrollen – Norske SMB-er henger etter

 

FAQ om Ollama

Er Ollama gratis?

Ja, Ollama er gratis å laste ned og bruke. Modellene du kjører kan ha egne lisenser. Sjekk dem før kommersiell bruk.

Funker Ollama på Windows og Mac?

Ja. Det kjører på Mac, Windows og Linux.

Kan jeg bruke Ollama uten internett?

Ja. Last ned modellen én gang, så kan du kjøre helt lokalt.

Støtter Ollama norsk?

Det avhenger av modellen. Moderne modeller (f.eks. Llama/Mistral-familien) håndterer norsk greit.

Kan jeg kjøre flere modeller samtidig?

Ja. Du kan starte flere modeller og rute forespørsler via et lite mellomlag.

Hva er forskjellen på ChatGPT og Ollama?

ChatGPT er en ferdig skytjeneste – du logger inn, skriver, og får svar. Ollama er en lokal motor du kjører selv. Forskjellen er at du med Ollama kan velge mellom mange ulike språkmodeller (Llama, Mistral, Gemma, osv.), og du bestemmer hvor og hvordan de kjører.

Hva skal jeg med Ollama når jeg allerede har ChatGPT?

Hvis du bruker KI mest til idémyldring, tekstutkast eller en-til-en chat, holder ChatGPT. Ollama gir først verdi når du har høyt volum, sensitive data eller behov for fleksibilitet i modellvalg. Det handler om kontroll, kost i skala, og frihet – ikke om å “erstatte” ChatGPT.

Er Ollama “bedre enn ChatGPT”?

Det er ikke enten–eller. Chat-tjenester i sky er supre for idétesting; Ollama er best når du vil kjøre nært dataene dine med forutsigbar kost.

Gir Ollama meg tilgang til egne data?

Ikke automatisk. Uten RAG (Retrieval Augmented Generation) oppfører Ollama seg som en lokal variant av ChatGPT. Skal du bruke egne data, må du koble på en mellomløsning som henter utdrag fra kildene dine og gir dem til modellen ved hvert spørsmål.

Har Ollama permanent tilgang til alle mine filer?

Nei. Ollama lagrer ikke eller “gjennomsøker” dataene dine. Modellen ser kun de tekstbitene du velger å gi den i konteksten til en forespørsel.

Kan jeg integrere Ollama med Teams/Slack/CRM?

Ja. Ollama eksponerer et lokalt API; koble på via en liten tjeneste eller ferdige connector-bibliotek.

Kan Ollama bruke bilder eller lyd?

Det avhenger av modellen. Velg multimodale modeller for bilde/lyd, ellers tekst-kun.

Må jeg lagre alt i en vektor­database?

Nei. For små case holder ofte en enkel søkeindeks. Vektor­database blir nyttig når mengden kilder og brukere øker.

Hvordan starter jeg raskest mulig med Ollama?

Installer, velg en passende modell, koble til én arbeidsflyt (f.eks. møtenotater i Teams), mål tid/kvalitet én måned—og bygg videre derfra.

Del denne artikkelen

Picture of Jan Storehaug

Jan Storehaug

Daglig leder i Tenk Digitalt AS og foredragsholder. Jan har et stort engasjement for entreprenørskap og hvordan nye teknologier utfordrer oss og skaper nye muligheter. Les mer om Jans foredrag på Storehaug.no Send gjerne en epost til jan@tenkdigitalt.no eller ring 97512077 for en hyggelig prat!

Del denne artikkelen

kommunikasjonstrategi

Gratis E-bok

Kommunikasjonsstrategi for digital markedsføring

Last ned vår praktiske guide til hvordan du kan utvikle en digital kommunikasjonsstrategi for din virksomhet. Guiden tar deg gjennom vår fem-stegs prosess for å nå ut til din målgruppe.
Gratis E-bok

Kommunikasjonsstrategi for digital markedsføring

Gratis E-bok

AI-ordliste: De viktigste begrepene innen kunstig intelligens (KI) enkelt forklart

Gratis E-bok

20 punkters sjekkliste for å komme i gang med AI-agenter i din virksomhet

Ditt neste steg mot suksess

Få hjelpen du trenger

Uansett om du trenger forretningsveiledning, markedsføring av din bedrift, eller utvikling av digitale løsninger, står vi parate til å hjelpe deg til topps i din bransje. Fyll ut skjemaet herunder, så tar vi kontakt ved første anledning.

Generell informasjon
Kort oppsummering av ditt behov
Tenk Digitalt investornettverk

Meld deg inn i Tenk Digitalt sitt investornettverk