Følger, rekker og lån

Følger og rekker

En tallfølge er en ordnet liste med tall: a1,a2,a3,a4,,an

En rekke er summen av tallene i en tallfølge. Delsummen sn av de n første leddene i en følge er gitt ved

sn=i=1nai=a1+a2+a3+a4++an
Forklaring Formel
Ledd i aritmetisk følge (rekursiv) an+1=an+d
Ledd i aritmetisk følge (eksplisitt) an=a1+(n1)d
Ledd i geometrisk følge (rekursiv) an+1=ank
Ledd i geometrisk følge (eksplisitt) an=a1kn1
Aritmetisk rekke (sum av følge) sn=a1+an2n
Geometrisk rekke (sum av følge) sn=a1kn1k1
Uendelig geometrisk rekke 1<k<1s=a11k

Rekker og konvergens

En rekke konvergerer og har summen s dersom summen sn av n første leddene nærmer seg tallet s når n. Altså

limnsn=s

En enkel tommelfingerregel for å sjekke om en rekke konvergerer er å sjekke om leddene går mot 0 når n. Dersom rekka ikke konvergerer, så divergerer den. Det er umulig å finne summen til en divergerende rekke fordi summen ikke eksisterer.

Uendelige geometriske rekker

Geometriske rekker er alltid konvergente når kvotiententen k1 , 11<k<1. Summen av denne typen rekker er gitt ved formelen

s=a11k

En uendelig geometrisk rekke kan ha en kvotient k(x) som er en funksjon av x istedenfor å ha et fast tall k som kvotient. Slike rekker har et konvergensområde i de intervallene av x hvor 1<k(x)<1.

Summen av slike rekker er gitt ved en funksjon s(x) som har samme definisjonsmengde som konvergensområdet.

s(x)=a11k(x),xkonvergensområdet

Programmering av følger og rekker

Ifølge læreplanen skal dere utforske rekursive sammenhenger med programmering. En rekursiv sammenheng vil si at vi bruker ett ledd til å regne ut det neste leddet – for å regne ut an+1 så trenger vi først å ha regnet ut an.

Ledd i aritmetisk tallfølge

# Regner ut de første leddene i en aritmetisk tallfølge
# med a_0 = 0 og d = 2.
a = 0 
d = 2
n = 10
for i in range(1, n + 1):
	print(f"a_{i} = {a}")
	a = a + d

Ved bruk av print(f"") så kan vi blande tekst og variabler. Variablene skriver vi med krøllparenteser slik: {variabelnavn}.

Delsum av geometrisk rekke

# Regner ut de første leddene og delsummene i
# geoemtrisk rekke med a_0 = 1 og k = 1.5
a = 1 
k = 1.5
delsum = a
n = 10
for i in range(1, n + 1):
	print(f"a_{i} = {a:.2f}. s_{i} = {delsum:.2f}")
	a = a * k
	delsum = delsum + a

Her bruker vi en teller, delsum, som i hver omgang av for-løkka blir oppdatert med den nye summen.

Vi kan avrunde desimaltall med {variabelnavn:.2f} der 2-tallet er antallet desimaler vi ønsker.

Eksempel med følge som ikke er geometrisk eller aritmetisk

Oppgavetekst: Gitt følgende tallfølge: 1,3,4,8,15,27,50,

De 3 første leddene i denne følgen er spesielle. Deretter følger tallene et fast mønster.

Lag et program som skriver ut de første n leddene i denne følgen. Hvis programmet ditt fungerer riktig vil du få a50=11986911799691.

Etter å ha funnet ut at a4=a1+a2+a3 og a5=a4+a3+a2 så kan vi tenke oss fram til at mønsteret i følgen er

an=an1+an2+an3,n4

Vi kan programmere dette på følgende måte

a_minus3 = 1
a_minus2 = 3
a_minus1 = 4
n = 50

for i in range(4, n + 1):
  a_i = a_minus3 + a_minus2 + a_minus1
  print(f"a_{i} = {a_i}")
  a_minus3 = a_minus2
  a_minus2 = a_minus1
  a_minus1 = a_i

Her oppdaterer vi hele tiden verdiene av de tre foregående leddene.

Vi kan også løse den samme oppgaven ved bruk av lister. Her bruker vi metoden append på lista a. Dette legger til et nytt element i slutten av lista. Dette nye elementet skal være lik summen av de tre foregående leddene.[1]

a = [1, 3, 4]
antall_ledd = 50
for i in range(4, antall_ledd+1):
  a.append(a[i-2] + a[i-3] + a[i-4])
print(a)

Ordliste

Begrep Forklaring
Rentefot/-sats Hvor mange prosent rente vi må betale per år (pro anno)
Terminer Antall innbetalinger
Lånebeløp Størrelsen på lånet da du tok det opp
Restlån Størrelsen på lånet i dag
Terminbeløp Hvor mye penger du betaler i hver termin
Renter Den delen av terminbeløpet som dekker rentene
Avdrag Den delen av terminbeløpet som betaler ned på lånet
Termingebyr Bankens gebyr for å sende ut faktura

Nåverdi forteller oss hvor mye et fremtidig (eller fortidig) beløp er verdt i nåtidens penger. Det er vanlig at penger blir mindre og mindre verdt for hvert år siden vi forventer avkastning på investeringene våre.

Nåverdien N til et fremtidig beløp B er gitt ved

N=Bvn

Der v er vekstfaktoren til kalkulasjonsrenta og n er antall perioder. Hvis du vil finne nåverdien til et beløp bakover i tid så velger du en negativ verdi for n.

Serielån

I et serielån er alle avdragene like store, men rentene minker og derfor minker også terminbeløpene.

Vi finner avdragene med

avdrag=lånebeløpantall terminer

Vi finner terminbeløpene med

terminbeløp=avdrag+rente av restlånet

Terminbeløpene danner en aritmetisk rekke hvor terminbeløp nummer n er gitt ved

Tn=T1+(n1)(avdragrentefot100)

Annuitetslån

I et annuitetslån er alle terminbeløpene like store. Rentene synker i løpet av nedbetalingsperioden og avdragene øker. Lånebeløpet L skal være lik summen av nåverdiene av terminbeløpene:

L=i=1nTvi

Der T er terminbeløpet og v er vekstfaktoren til kalkulasjonsrenta.

Legg merke til at dette er en geometrisk rekke med k=1v. Mange oppgaver med annuitetslån på del 2 kan løses ved å sette opp likningen over i CAS.

Vi kan også bruke formler til å regne ut terminbeløpene eller lånebeløpet til et annuitetslån. Lånebeløpet L er terminfaktoren F multiplisert med terminbeløpet T.

L=FT

Vi finner terminfaktoren ved hjelp av følgende formel hvor v er vekstfaktoren til renta per termin og n er antall terminer

F=11vnv1

Funksjonsdrøfting

Funksjonsdrøfting handler om å finne ut hvordan funksjoner ser ut når du tegner dem.

Logaritmer

Egenskaper ved logaritmefunksjoner

En logaritmefunksjon er den inverse funksjonen til en eksponentialfunksjon.

Siden logaritmefunksjonen og eksponentialfunksjonene er inverse så vil disse nulle hverandre ut:

lnex=xelnx=xlog10x=x10logx=xlogaax=xalogax=x

Logaritmefunksjonene er definert for alle positive tall slik at definisjonsmengden blir Df=0,.

Vi velger som oftest den naturlige logaritmen, lnx, i S2 siden denne er enklere å derivere og integrere enn de andre logaritmene.

Regneregler for logaritmer

Her bruker jeg den naturlige logaritmen som eksempel, men disse reglene gjelder for alle typer logaritmer.

Forklaring Formel
Bruke logaritme på likning a=blna=lnb
Hente ned eksponent lnax=xlna
Logaritme til produkt ln(ab)=lna+lnb
Logaritme til kvotient lnab=lnalnb
Nullpunkt til logaritmer ln1=0

Merk at den siste regelen forteller oss at alle typer logaritmefunksjonene har sitt eneste nullpunkt i x=1. For f(x)=lnx vil funksjonen være negativ for 0<x<1 og positiv for alle x>1.

Rasjonale funksjoner

En rasjonal funksjon består av en brøk med polynomfunksjoner i teller og nevner:

f(x)=P(x)Q(x)

Rasjonale funksjoner har følgende egenskaper:

Asymptoter

Asymptoter er tenkte linjer som en funksjon nærmer seg. Asymptoter kan være horisontale, vertikale eller skrå.

Derivasjon

Definisjon: Hvis f(x) er kontinuerlig i et punkt x så er den deriverte i punktet:

f(x)=limΔx0f(x+Δx)f(x)Δx

Den deriverte i et punkt er lik den momentane vekstfarten i punktet og dermed også lik stigningstallet til tangenten til f i punktet.

Forklaring Funksjon Derivert
Konstant k 0
Potensfunksjon xr rxr1
Konstante koeff. kg(x) kg(x)
Summer g(x)±h(x) g(x)±h(x)
Produkt u(x)v(x) u(x)v(x)+u(x)v(x)
Kvotienter u(x)v(x) uvuvv2
Eksponentialfunk ex ex
Eksponentialfunk ax axlna
Logaritme lnx 1x
Kjerneregelen g(u(x)) g(u)u(x)

Huskeregel kjerneregelen: Multipliser den deriverte av den ytre funksjonen med den deriverte av kjernen.

Den deriverte av ln x

(ln(x))=1x

Merk at selv om g(x)=1x er definert for xR0 så er den deriverte av logaritmefunksjonen kun definert for x>0.

Funksjonen f(x)=lnx har definisjonsmengde Df=0,. Derfor kan ikke den deriverte ha noe større definisjonsmengde enn dette. For å derivere en funksjon så den være kontinuerlig i punktet. Det gir ikke mening å snakke om vekstfarten til f i x=2 siden f(2) ikke eksisterer.

Stigningstall og tangenter

Stigningstallet, a, til tangenten til f(x) i punktet ved x=x1 er lik den deriverte i punktet, f(x1). For å finne likningen til tangenten kan vi sette inn kjente tall i likningen for rett linje

y=ax+b

Vi kan også bruke ettpunktsformelen hvor y1=f(x1)

yy1=a(xx1)

Integrasjon

Ubestemte integraler

Et ubestemt integral er å finne alle antideriverte F(x) til en funksjon f(x) slik at F(x)=f(x).

Vi har følgende integrasjonsregler

Forklaring Funksjon Integrert
Konstant k kx+C
Koeffisient kf(x) kf(x)dx
Flere ledd f(x)±g(x) f(x)dx±g(x9)dx
Potensfunksjon xr 1r+1xr+1+C,r1
Spesialtilfelle 1x ln|x|+C,x0
Eksponentialfunksjon ekx 1kekx+C
Eksponentialfunksjon ax axlna+C,a>0a1
Naturlig logaritme lnx xlnxx+C

Bestemt integral som grense av sum

Vi har en funksjon f(x). Vi ønsker å finne arealet under grafen fra x=a til x=b.

Vi forsøker å dele opp området under grafen i n rektangler. Bredden på hvert rektangel må da være Δx=ban.

Hvis vi kaller x-verdien i starten av rektangelet for xi der i{1, 2, 3, , n} så vil høyden av hvert rektangelet være f(xi).

Siden arealet til et rektangel er høyde multiplisert med bredde vil summen av arealene til rektanglene altså være

Sn=f(x1)Δx+f(x2)Δx+f(x3)Δx+=i=1nf(xi)Δx

Hvis vi lar bredden av rektanglene bli veldig små slik at rektanglene egentlig bare blir infitesimalt smale striper får vi

limΔx0Sn=limni=1nf(xi)Δx=abf(x) dx

Fundamentalsetningen

Fundamentalsetningen eller analysens fundamentalteorem forteller oss at integrasjon og derivasjon er motsatte operasjoner.

Fundamentalsetningen del 1

La f være en kontinuerlig funksjon på [a,b]. La

F(x)=f(x)for allex[a,b]

Denne førsten delen av fundamentalsetningen forteller oss at alle kontinuerlige funksjoner f har antideriverte funksjoner F.

Fundamentalsetningen del 2

Gitt f fra del 1 så er

abf(x)dx=[F(x)]ab=F(b)F(a)

Denne andre delen av fundamentalsetningen forteller oss at vi kan beregne et bestemt integral ved hjelp av det ubestemte integralet

Areal under grafer

La f(x) være en funksjon som er positiv for alle x[a,b]. Da er arealet, A, av flatestykket som er avgrenset av grafen til en funksjon f(x), x-aksen og linjene x=a og x=b lik integralet av

A=abf(x)dx

Dersom grafen ligger under x-aksen så er arealet gitt ved

A=abf(x)dx

Dersom funksjonen krysser x-aksen i intervallet [a,b], så er du nødt til å dele opp integralet ved nullpunktene og legge sammen summene av arealene.

Areal mellom grafer

Hovedprinsippet for å finne arealet mellom grafer er å ta integralet av den øverste grafen og trekke fra integralet fra den nederste grafen.

La f og g være to funksjoner. For å finne arealet, A, av flatestykket mellom grafene er du først nødt til å finne skjæringspunktene mellom grafene ved å løse likningen f=g.

Areal mellom grafer med to skjæringspunkter

Dersom du får to løsninger x1 og x2 fra likningen f=g så er arealet

A=x1x2(f(x)g(x))dxderfgfor allex[x1,x2]

Dersom gf på intervallet [x1,x2] så må du bytte om på rekkefølgen av leddene i integranden til (g(x)f(x)).

Areal mellom grafer med tre eller flere skjæringspunkter

Hvis du har tre eller flere skjæringspunkter mellom f og g så er du nødt til å dele opp integralet i flere deler. La oss si at du får de tre løsningene x1, x2 og x3 fra likningen f=g. Hvis fg for x[x1,x2] og gf for x[x2,x3] så kan du finne det samlede arealet med følgende formel

A=x1x2(f(x)g(x))dx+x2x3(g(x)f(x))dx

Integrasjonsteknikker

Delvis integrasjon

Delvis integrasjon brukes ofte dersom du skal integrere et produkt av ulike to ulike funksjoner. Du kan gjerne tenke på delvis integrasjon som en omvendt produktregel for derivasjon.

Delvis integrasjon er spesielt nyttig dersom den ene faktoren er enkel å integrere og den andre faktoren er enkel å derivere.

Sett den ene faktoren til å være u, dette er den faktoren som blir derivert. Den andre faktoren setter setter du lik v. Deretter bruker du formelen nedenfor.

uvdx=uvuvdx
DI-metoden for delvis integrasjon

Det er også mulig å bruke oppsettet kalt DI-metoden. Eksempelet under viser DI-metoden for x2e2xdx. Du lager en tabell med tre kolonner.

  1. Den første kolonnen viser fortegnet. Dette veksler mellom + og .
  2. Den andre kolonnen inneholder faktoren som skal deriveres (D). For hver rad så deriverer du faktoren.
  3. Den tredje kolonnen inneholder faktoren som skal integreres (I). For hver rad så integrerer du faktoren.
D I
+ x2 e2x
2x 12e2x
+ 2 14e2x
0 18e2x

Svaret med DI-metoden finner du ved å starte på fortegnet oppe til venstre (+), gå en til høyre (x2) og deretter på skrå ned til høyre (12e2x i raden under). Bruk + som fortegnet og multipliser de to faktorene slik at du får +x212e2x. Du fortsetter på samme måte nedover. Svaret på oppgaven vår blir

+x212e2x2x14e2x+218e2x+C=12e2xx212e2xx+14e2x+C

Du lager rader i tabellen fram til du får en null, eller helt til du ser at du kan integrere produktet av faktorene i en rad. Hvis du ser at du kan integrere produktet av faktorene i en rad (for eksempel kan vi integrere produktet av 2 og 14ex i rad 3), så kan du sette opp følgende

+x212e2x2x14e2x+214e2xdx=12e2xx212e2xx+12e2xdx

Når du løser dette vil du få samme svar som tidligere.

Variabelskifte

Variabelskifte brukes hvis du skal integrere en sammensatt funksjon. Variabelskifte kalles ofte for den omvendte kjerneregelen.

  1. Velg en del av integranden som u, dette er variabelskiftet ditt.
  2. Deriver u slik at du finner u=dudx.
  3. Løs likningen med hensyn på dx slik at du får dx=duu
  4. Substituer dx med duu i det opprinnelige uttrykket ditt.
  5. Substituer inn u i integranden.
  6. Integrer uttrykket som nå har formen g(u)du
  7. Substituer ut alle u i svaret med det opprinnelige uttrykket for u
Se etter en faktor du kan derivere

Dersom du kan derivere en av faktorene i integranden, og den deriverte blir lik en annen faktor i integranden så bør du bruke variabelskifte. Ta for deg følgende regnestykke

lnxxdx

Vi vet at (lnx)=1x, dermed er lnx et svært godt valg for variabelskifte.

Vi setter u=lnx og skriver den deriverte av u som dudx

u=lnxu=dudx=1xdu=1xdxdx=xdu

Vi kan nå bytte ut dx i integranden med xdu og vi får

uxxdu=udu=12u2+C

Vi bytter tilbake lnx for u og får svaret

12(lnx)2

Økonomi

Her lar vi I(x) være inntektene ved salg av x enheter og K(x) være produksjonskostnadene ved produksjon av x enheter. Overskuddet O(x) er da gitt ved

O(x)=I(x)K(x)

Grenseinntekt og grensekostnad

Grenseinntekten I(x) er den deriverte av inntektsfunksjonen. Grenseinntekten I(x) forteller oss omtrent hvor mye vi tjener på å selge én mer enhet.

Grensekostnaden K(x) er den deriverte av kostnadsfunksjonen. Grensekostnaden K(x) forteller oss omtrent hvor mye det koster å produsere én mer enhet.

Vi bruker også begrepene marginalinntekt og marginalkostnad.

Maksimalt overskudd

Vi har maksimalt overskudd når grenseinntekt er lik grensekostnad fordi

O(x)=0I(x)K(x)=0I(x)=K(x)

Hvis du får flere løsninger så bør du sjekke hvilke løsninger som er toppunkter.

Enhetskostnader

Enhetskostnaden E(x) fordeler produksjonskostnadene K(x) på antall enheter x.

E(x)=K(x)x

Vi kan finne de laveste enhetskostnadene på tre måter:

  1. Ved å løse likningen E(x)=0
  2. Ved å finne en tangent til kostnadsfunksjonen som går gjennom origo
  3. Ved å løse K(x)=E(x). Utledningen for den siste formelen er som følger
E(x)=K(x)xE(x)=K(x)xK(x)1x2

Vi setter uttrykket til den deriverte E(x)=0 siden vi leter etter bunnpunktet til E(x).

E(x)=K(x)xK(x)1x2=0K(x)xK(x)1=0K(x)xK(x)=0K(x)x=K(x)K(x)=K(x)xK(x)=E(x)

Etterspørsel

Etterspørselen q er en funksjon av prisen p slik at q(p). Etterspørselen er også lik antall solgte enheter x slik at

x=q(p)

Inntektene er pris×antall solgte eller I(x)=px. Hvis vi bytter ut x med q(p) så får vi I(p)=pq(p)

På samme måte kan vi vise at kostnadene blir K(x)=K(q(p)).

Sannsynlighet og statistikk

Diskrete sannsynlighetsfordelinger

I diskrete sannsynlighetsfordelinger så inneholder utfallsrommet til den stokastiske variabelen X kun visse verdier. Ofte vil utfallsrommet til en diskret stokastisk variabel kun inneholde noen heltallsverdier.

Eksempel på diskret sannsynlighetsfordeling

Dersom du kaster to mynter og lar X være antall kron du får på disse kastene så er utfallsrommet {0,1,2}. Det er ikke mulig å få 0,43 eller 1,783 mynt på to kast.

Uniform sannsynlighetsfordeling

I en uniform sannsynlighetsfordeling er sannsynligheten for alle utfallene like stor. Et eksempel på uniform sannsynlighetsfordeling er et terningkast: her har alle de seks sidene like stor sannsynlighet.

For å regne ut sannsynlighet ved uniform sannsynlighet tar vi

antall gunstigeantall mulige

Binomisk sannsynlighetsfordeling

Vi bruker binomiske fordelinger når vi kun har to ulike utfall. Vi bruker ofte bionomisk fordeling når vi definerer at en hendelse enten inntreffer eller så inntreffer den ikke.

Hvis vi gjør det samme binomiske forsøket flere ganger etter hverandre får vi en binomisk sannsynlighetsfordeling. Vi kaller antall forsøk for n og observerer om hendelsen A inntreffer eller ikke. Sannsynligheten for A i hvert delforsøk er p.

La X være antallet ganger A inntreffer på n forsøk, da er sannsynligheten for at A inntreffer nøyaktig k ganger gitt ved

P(X=k)=(nk)pk(1p)nk=n!k!(nk)!pk(1p)nk
Vilkår for binomisk sannsynlighetsfordeling

  1. Alle delforsøkene må være uavhengige
  2. Sannsynligheten for suksess, p, er lik i alle delforsøkene

Hypergeometrisk sannsynlighetsfordeling

Vi bruker hypergeometrisk sannsynlighetsfordeling når vi har to ulike grupper med gjenstander og skal få et gitt antall av hver av dem. I hypergeometriske forsøk så er ikke delforsøkene uavhengige av hverandre.

Du har to typer objekter i en bolle, du har n1 objekter av type 1 og n2 objekter av type 2. Til sammen har du n1+n2=n objekter. Du trekker k objekter fra bollen. La X være antallet objekter av type 1 blant de k. Sannsynligheten for at du trekker k1 objekter er gitt ved:

P(X=k1)=(n1k1)(n2k2)(nk)

Forventningsverdi, varians og standardavvik

Forventningsverdi

Forventningsverdi er den gjennomsnittlige verdien vi kan forvente over lang tid. Forventningsverdien til X finner vi med

μ=E(X)=i=1nxP(X=x)

Vi bruker vanligvis en tabell med sannsynlighetsfordelingen for å regne ut forventingsverdien. Nedenfor er et eksempel som viser sannsynlighetsfordelingen når X er antall kron på ett myntkast.

x P(X=x) xP(X=x)
0 12 012=0
1 12 112=12
Sum 1 12
Forventningsverdi i binomisk sannsynlighetsfordeling

I binomisk sannsynlighetsfordeling hvor antall forsøk er n og sannsynligheten for suksess i hvert forsøk er p, er forventningsverdien gitt ved:

μ=E(X)=np
Forventningsverdi i kontinuerlige sannsynlighetsfordelinger

I kontinuerlige sannsynlighetsfordelinger finner vi forventningsverdien til X ved å bestemme integralet

abxf(x)dx

hvor f er sannsynlighetstettheten (også kalt tetthetsfunksjonen) med definisjonsmengde Df=[a,b].

Varians og standardavvik

Varians og standardavvik er spredningsmål – de måler variasjonen i observasjonene våre.

Varians og standardavvik

  • Standardavviket er kvadratroten av variansen: σ=SD(X)=Var(X)
  • Standardavvik har samme måleenhet som observasjonene våre
  • Variansen har måleenheten til observasjonene opphøyd i andre

Variansen til X finner vi med

Var(X)=i=1N((xiμ)2P(X=xi))

Vi bruker vanligvis en tabell med sannsynlighetsfordelingen for å regne ut variansen. Nedenfor er et eksempel som viser sannsynlighetsfordelingen når X er antall kron på ett myntkast. Jeg har valgt å først regne ut (xμ)2, før jeg multipliserer med sannsynligheten i kolonne 5.

x P(X=x) xP(X=x) (xμ)2 (xμ)2P(X=x)
0 12 012=0 (012)2=14 1412=18
1 12 112=12 (112)2=14 1412=18
Sum 1 12 14

Fra summen i den femte kolonnen ser vi at Var(X)=14.

Varians i binomisk fordeling

I binomisk sannsynlighetsfordeling hvor antall forsøk er n og sannsynligheten for suksess i hvert forsøk er p, er variansen gitt ved

Var(X)=np(1p)
Varians i kontinuerlige sannsynlighetsfordelinger

I kontinuerlige sannsynlighetsfordelinger finner vi variansen til X ved å bestemme integralet

ab(xμ)2f(x)dx

hvor f er sannsynlighetstettheten (også kalt tetthetsfunksjonen) med definisjonsmengde Df=[a,b], og μ er forventningsverdien til X.

Regneregler for forventningsverdi og varians

La X være en stokastisk variabel og a og b konstanter. Da har vi følgende regler

E(aX+b)=aE(X)+bogVar(aX+b)=a2Var(X)
Regneregler for sum av stokastiske variabler

La X1,X2,X3,,Xn være stokastiske variabler. Da gjelder

E(X1+X2+X3++Xn)=E(X1)+E(X2)+E(X3)++E(Xn)

Hvis (og bare hvis) X1,X2,X3,,Xn er uavhengige, så gjelder også

Var(X1+X2++Xn)=Var(X1)+Var(X2)++Var(Xn)

Kontinuerlige sannsynlighetsfordelinger

I kontinuerlige sannsynlighetsfordelinger så inneholder utfallsrommet til den stokastiske variabelen X alle verdier innenfor et intervall.

Sannsynligheten for at X ligger innenfor et intervall [a,b] er gitt ved

P(a<X<b)=P(aXb)=abf(x)dx

Her er f(x) sannsynlighetstettheten (eller tetthetsfunksjonen) til X.

Punktsannsynlighet i kontinuerlige sannsynlighetsfordelinger

Legg merke til at P(a<X<b)=P(aXb).

Punktsannsynligheter i kontinuerlige sannsynlighetsfordelinger er lik null (altså P(X=a)=0) siden

P(X=a)=aaf(x)dx=F(a)F(a)=0
Krav til sannsynlighetstettheten f(x)

  1. f må ha en definisjonsmengde Df=[a,b]
  2. f(x)0
  3. abf(x)dx=1

Normalfordelingen

Normalfordelingen er en kontinuerlig sannsynlighetfordeling med tetthetsfunksjon gitt ved

f(x)=1σ2πe(xμ)22σ2

Definisjonsmengden er Df=R. Normalfordelingen er symmetrisk om linja x=μ.

Standard normalfordeling

Alle normalfordelinger kan gjøres om til en standard normalfordeling med forventningsverdi 0 og standardavvik 1. Vi bruker den stokastiske variabelen Z i standard normalfordeling.

La X være normalfordelt med forventningsverdi μ og standardavvik σ. For å bestemme P(X<a) kan vi gjøre om XZ ved å først regne ut en z-verdi:

z=xμa

Deretter bestemmer vi sannsynligheten P(Z<z) ved å gå inn i tabellen med standard normalfordeling.

z i standard normalfordeling

z er antall standardavvik i standard normalfordeling. For eksempel betyr z=2 at grensa vår ligger to standardavvik til venstre for forventningsverdien.

Normalfordeling som tilnærming for binomiske fordelinger

Binomiske fordelinger blir tilnærmet normalfordelte når antall forsøk n går mot uendelig, altså limn. Som tommelfingerregel sier vi at dersom X er binomisk fordelt og Var(X)5, så kan vi bruke normalfordeling som tilnærming for den binomiske fordelingen.

Forventningsverdi og varians er den samme for begge fordelingene.

μ=npogVar(X)=np(1p)

La X være binomisk fordelt med μ=np og σ=np(1p). Hvis vi skal tilnærme med X med normalfordeling må vi gjøre følgende halvkorreksjoner:

BinomiskNormalfordeltP(a<X<b)P(a0,5<X<b+0,5)P(X=a)P(a0,5<X<a+0,5)
Halvkorreksjon

Siden P(X=a)=0 i normalfordelingen så er vi nødt til å gjøre en halvkorreksjon når vi finner sannsynligheter i binomiske fordelinger tilnærmet med normalfordelingen. Behovet for halvkorreksjon forsvinner når n.

Sentralgrensesetningen

Sentralgrensesetningen

Sentralgrensesetningen sier at dersom vi gjør tilstrekkelig mange forsøk, vil sannsynlighetsfordelingen til alle stokastiske variabler kunne tilnærmes med en normalfordeling.

La X være en stokastisk variabel med forventningsverdi μ og standardavvik σ.

Vi lar S være summen av n delforsøk med X slik at

S=X1+X2++Xn

Når n er summen S tilnærmet normalfordelt med

E(S)=nE(X)=nμVar(S)=nVar(X)SD(S)=Var(S)=nVar(X)=nVar(X)=nσ

Denne tilnærmingen er best for store verdier av n. Som tommelfingerregel gjelder sentralgrensesetningen når n30.

Simuleringer med python

Vi bruker ofte Monte Carlo-simuleringer i programmer for å finne sannsynligheter som er vanskelig å bestemme ved regning. Prinsippet for slike simuleringer er:

  1. Du definerer en hendelse A
  2. Du gjennomfører et tilfeldig forsøk N ganger
  3. Du teller antall ganger A inntreffer og kaller denne summen for m
  4. Du beregner sannsynligheten ved: P(A)mN=antall gunstigeantall mulige

Dette er imidlertid ikke den ekte sannsynligheten, men m/N gir en veldig god tilnærming når N er høy. Prøv deg gjerne frem med stadig høyere N (for eksempel 10000, 100 000, 1 000 000 og så videre), men stopp når du merker at programmet tar lang tid å kjøre.

Å trekke fra et statistisk fordeling

Vi kan trekke ut en tilfeldig prøve fra mange ulike statistiske fordelinger. I S2 skal vi fokusere på:

Vi bruker funksjoner fra biblioteket random til å gjøre uttrekk. Vi må derfor ha med linjen import random i toppen av programmene våre.

Trekke tilfeldig heltall

For å trekke et tilfeldig heltall i intervallet [1,6] (fra og med 1, til og med 6) så kan du bruke random.randint(a,b).

import random
tilfeldig_tall = random.randint(1,6)
Trekke tilfeldig desimaltall

For å trekke et tilfeldig desimaltall i intervallet [0,1 så kan du bruke random.random().

import random
tilfeldig_tall = random.random()

Hvis du trenger å ha et tilfeldig desimaltall i intervallet [5,15 så kan bare gange det tilfeldige tallet med 10 og legge til 5:

import random
tilfeldig_tall = 10 * random.random() + 5
Trekke fra normalfordeling

For å trekke et tilfeldig tall fra en normalfordeling med forventningsverdi μ=180 og standardavvik σ=7 så kan du bruke random.gauss(mu, sigma).

import random
tilfeldig_tall = random.gauss(180, 7)

Eksempel på simulering fra eksempeleksamen høst 2022

På en skole er det 323 jenter og 301 gutter. X er høyden på en tilfeldig valgt jente. Y er høyden på en tilfeldig valgt gutt.

Anta at X og Y er normalfordelt med μX=168,μY=180,σX=6,σY=8.

Lag et program som du kan bruke til å smulere sannsynligheten for at en tilfeldig valgt elev er høyere enn 175 cm.

import random

n_x = 323
n_y = 301
mu_x = 168
mu_y = 180
s_x = 6
s_y = 8

grense = 175
antall_simuleringer = 10000
antall_gunstige = 0

for i in range(antall_simuleringer):
    # Vi trekker en tilfeldig elev, men vi må finne ut om
    # eleven er gutt eller jente.
    # Det er 301 gutter. Hvis vi trekker et tilfeldig tall mellom
    # 1 og 301+323=624 så kan vi si at dersom tallet er mindre enn
    # eller lik 301, så er det en gutt.

    if (random.randint(1, n_x + n_y) <= n_y):
        # Her har vi altså trukket en gutt og vi trekker en tilfeldig gutt
        # fra en normalfordeling
        hoyde = random.gauss(mu_y, s_y)
    else:
        # ellers har vi trukket ei jente
        hoyde = random.gauss(mu_x, s_x)
    if (hoyde > grense):
        antall_gunstige += 1

sannsynlighet = antall_gunstige/antall_simuleringer

print(f"Sannsynligheten for å trekke en tilfeldig elev over 175 cm er "
      f"estimert til {sannsynlighet * 100:.1f} "
      f"med {antall_simuleringer} simuleringer")

Eksempel på simulering fra eksamen høst 2023

Høyden X til en tilfeldig valgt jente på 24 måneder er tilnærmet normalfordelt med forventningsverdi E(X)=87 cm og standardavvik SD(X)=3,3 cm.

Høyden Y til en tilfeldig valgt gutt på 24 måneder er tilnærmet normalfordelt med forventningsverdi E(Y)=88 cm og standardavvik SD(Y)=3,1 cm.

Lag et program som du kan bruke til å anslå sannsynligheten for at høyden til et tilfeldig valgt barn på 24 måneder er mindre enn 84 cm. Gå ut ifra at det er like mange jenter som gutter i populasjonen.

import random

EX = 87
SDX = 3.3
EY = 88
SDY = 3.1
N = 100_000
antall_gunstige = 0

for i in range(N):
    tilfeldig_tall = random.randint(1,2)

    if tilfeldig_tall == 1:
        # Vi har trukket en jente
        hoyde = random.gauss(EX, SDX)
    else:
        # Vi har trukket en gutt
        hoyde = random.gauss(EY, SDY)
    if hoyde < 84:
        antall_gunstige += 1

sannsynlighet = antall_gunstige / N
print(sannsynlighet)

Hypotesetesting

Vi bruker hypotesetester til å trekke slutninger om en hel populasjon basert på et utvalg eller stikkprøve.

I hypotesetester så bestemmer vi sannsynligheten for at observasjonene våre kan forekomme, gitt at en nullhypotese er sann.

Begrep Forklaring
Hypotesetesting Gjøre et utvalg/stikkprøve av en populasjon og finne ut om vi kan forkaste en nullhypotese.
Nullhypotese (H0) Den gjeldende hypotesen eller det vi ønsker å motbevise. Vi antar at denne er sann i hypotesetesting.
Alternativ hypotese (HA) Den hypotesen vi ønsker å teste ("bevise")
Testobservator (X) En stokastisk variabel med en valgt sannsynlighetsfordeling forutsatt at H0 er sann
Signifikansnivå (α) Er som oftest 0,05. Det betyr at vi forkaster nullhypotesen i 5 % av tilfellene hvor vi ikke burde forkastet den (at vi gjør feil i 5 % av tilfellene).
p-verdi Sannsynligheten for observasjonen, gitt at H0 er sann
Forkastningsmengde De verdier av X som gjør at H0 forkastes
Aksepteringsmengde De verdier av X som gjør at H0 beholdes
Venstresidig test Tester om andelen er mindre enn nullhypotesen, altså HA: p<p0
Høyresidig Tester om andelen er større enn nullhypotesen, altså HA: p>p0
Tosidig test Tester om den egentlige verdien er ulik fra nullhypotesen μμ0
Algoritme for hypotesetester

  1. Sett opp nullhypotese og alternativ hypotese. Nullhypotesen er det vi < motbevise.
  2. Anta at nullhypotesen er sann og sett opp sannsynlighetsfordelingen for X
  3. Regn ut p-verdien (sannsynligheten for å få observasjonene gitt at nullhypotesen er sann)
  4. Sammenlign p-verdien med signifikansverdien α.
    • p<α betyr at vi forkaster H0. Sannsynligheten for at observasjonene skal oppstå tilfeldig er mindre enn signifikansnivået.
    • p>α betyr at vi ikke forkaster H0. Sannsynligheten for at observasjonene skal oppstå tilfeldig er større enn signifikansnivået.
  5. Skriv konklusjon

Hypotesetesting av andeler

Vi undersøker om sannsynligheten p i en binomisk fordeling har en bestemt verdi ved å teste H0:p=p0 mot

  1. Vi velger X som testobservator og tar en stikkprøve der X får verdien a.
  2. Vi regner ut p-verdien[2]
    • Ved venstresidig test så beregner vi p-verdien P(X<a).
    • I en høyresidig test regner vi ut p-verdien P(X>a).
    • I en dobbeltsidig test regner vi ut p-verdien P(X<a)+P(X>a).
  3. Hvis p<α så forkaster vi H0

Hypotesetest av andel ved å bruke normalfordeling

Siden binomiske fordelinger kan være tilnærmet normalfordelte (se kapittel 6.4.2), så kan vi bruke normalfordelingen til å teste andeler når Var(X)5.

I hypotesetesten bruker vi da en normalfordeling med μ=np og σ=np(1p).

Hypotesetesting av gjennomsnitt

La X¯ være gjennomsnittsverdien i en stikkprøve bestående av n elementer av den stokastiske variabelen X. X har forventningsverdi μ og standardavvik σ. Forventningsverdien og standardavviket til X¯ er da

E(X¯)=E(X)=μSD(X¯)=SD(X)n=σn

I hypotesetesten vår så bruker vi en normalfordeling med E(X¯)=μ og SD(X¯)=σn.


  1. Merk at python-lister begynner på indeks 0. Det vil si at for å hente ut det første elementet i ei liste som heter min_liste så skriver vi min_liste[0]. For å hente du det fjerde elementet i lista skriver vi min_liste[3]. ↩︎

  2. p-verdi og sannsynligheten p i binomisk modell er ikke det samme. ↩︎