Den stora tråden om STATISTIK

Hur funkar tekniken bakom bra hifi?

Moderator: Redaktörer

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:34

Eftersom statistiska frågor återkommer gång på gång på faktiskt.se i samband med olika lyssningstest tyckte jag att det kunde vara bra med EN text som förklarar hur detta med STATISTIK fungerar i experimentsammanhang. Fokus kommer att vara f/e-lyssningar eftersom det verkar vara det ämne som oftast ger upphov till lika oändliga som förvirrade diskussioner. Min avsikt är att texten skall ge en intuitiv förståelse för de som läser den. Jag har funderar lite på pedagogiken, men jag ser framför mig att man avhandlar olika delämnen i en logisk sekvens som leder till förståelse av helheten. Jag har ju en del erfarenhet från hur resonemang brukar föras men jag kan ju inte se in i huvudet på alla som läser men inte gör inlägg. Tanken är alltså presentera kortare texter om olika teman som sedan kan bearbetas med frågor och kommentarer från de som är intresserade. Fokus är alltså statistiken, inte relevansen av blindtest, f/e-lyssning, ABX, objektiva test, induktion eller något annat ämne. Jag har reserverat ett antal inlägg för de olika deltexterna.

Jag är vare sig matematiker eller statistiker, dvs. jag har ingen grundexamen i statistik eller matematik, om någon undrar.

/DQ-20
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:34

1. STATISTISK INFERENS
Statistisk inferens handlar om att utifrån ett begränsat antal fall (URVAL; STICKPROV) uttala sig om ett stort antal fall som vi av någon anledning anser utgöra en avgränsad grupp med gemensamma attribut (POPULATION). Populationer kan vara ÄNDLIGA och empiriska, som t.ex. alla barn födda i Sverige 2012. En sådan population skulle vi i princip kunna göra en totalundersökning på om vi bara hade tillräckligt fullständiga register. Egenskaper i en POPULATION, t.ex. medelvärdet, kallas för en PARAMETER. När det gäller experiment använder man sig av en annan typ av populationsbegrepp, nämligen en HYPOTETISK OÄNDLIG POPULATION, t.ex. alla utförda och ännu inte utförda f/e-lyssningar genomförda under samma förutsättningar. Fördelen med att använda sig av URVAL är att vi i fallet med ÄNDLIGA populationer kan spara resurser genom att endast undersöka ett mindre antal fall. När det gäller HYPOTETISKA OÄNDLIGA populationer är en totalundersökning inte ens möjlig.

En HYPOTETISK OÄNDLIG POPULATION av försök (fall; händelser) är alltså det begrepp som ligger till grund för statistisk inferens från experiment. Kravet på att göra den hypotetiska populationen OÄNDLIG kommer sig av att vi måste säkerställa att populationen innehåller ALLA möjliga fall, även framtida, från vilka vi kan sägas dra ett slumpmässigt urval när vi utför experiment. I en oändlig population har varje försök en oändligt liten sannolikt att komma med i urvalet, dvs. de försök som vi verkligen genomför. Dessutom antar man att alla försök har lika stor chans att komma med. En OÄNDLIG HYPOTETISK population kan också vara en lämplig modell för en till synes ÄNDLIG population, om man tänker sig att resultaten även skall gälla framtida versioner av populationen.

Överkurs:
Länken mellan URVALET och POPULATIONEN bygger på sannolikhetskalkyler. För att denna länk skall hålla måste vi kunna definiera sannolikheten för att ett visst försök eller fall ska komma med i urvalet. Alla fall måste INTE ha samma sannolikhet att inkluderas, men deras individuella sannolikheter måste vara KÄNDA. Detta kräver någon form av slumpmässig mekanism för att ta fram urvalet, men möjliggör också viktning av vissa typer av fall baserat på extern information om populationen. Om vi till exempel på FÖRHAND vet att en viss population består av 10% röda och 90% blå fall kan vi ÖVERSAMPLA de röda fallen så att vi får tillräckligt med röda fall (i ANTAL) i vårt urval. URVALET kommer alltså att ha en högre andel ”röda” än vad POPULATIONEN innehåller. ”Värdet” av dessa röda fall i urvalet måste vi dock ”skala ned” med inversen på vår översampling när vi gör inferenser till vår population.


EDIT: röd text
Senast redigerad av DQ-20 2013-02-04 13:27, redigerad totalt 3 gånger.
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:34

2. SANNOLIKHETSBEGREPP
Det är sannolikhetskalkyler som länkar resultat i URVALET (dvs. de försök vi faktiskt gör) och den HYPOTETISKA OÄNDLIGA POPULATIONEN som gör resultaten GENERALISERBARA för framtiden. Men vad är ”sannolikhet”? Det finns faktiskt flera olika sannolikhetsbegrepp och minst fyra av dem är aktuella för att förstå och tolka de statistiska resultaten av t.ex. ett f/e-test. Det handlar inte om att lära sig att räkna ut sannolikheter utan att förstå vad de innebär på en kunskapsteoretisk nivå.

OBJEKTIV SANNOLIKHET
Sannolikhetsbegreppen har utvecklats i takt med att de empiriska vetenskaperna börjat använda sannolikhetskalkyler och SIGNIFIKANSTEST. Det KLASSISKA sannolikhetsbegreppet är främst en matematisk konstruktion där man på förhand kan resonera sig fram till alla alternativ. Begreppet förknippas med kända matematiker som Bernouilli och Laplace. KLASSISK sannolikhet kan definieras som ”samtliga fördelaktiga fall delat med det totala antalet möjliga fall när alla fall har samma sannolikhet att inträffa”. Ett vanligt tankeexempel är hypotetiska tärningskast med en teoretisk perfekt tärning. Sannolikheten att få en ”2:a” är då 1/6 (≈0,167). När man använder kombinatorik för att räkna ut chansen för svara rätt 7 gånger i rad i ett f/e-test trots att svaren är avgivna helt slumpmässigt, är det en KLASSISKA definitionen av sannolikhet som dyker upp. Sannolikheten att i en helt slumpmässig process svara alla rätt ELLER alla fel 7 gånger i rad blir då (1+1)/2^7≈0,0156.

Problemet med den KLASSISKA definitionen av sannolikhet att de flesta naturligt förekommande fenomen inte har någon på förhand given sannolikhetsfördelning. Dessa fördelningar kan därför endast erhållas empiriskt eller, i brist på annat, ANTAS följa en viss fördelning. Om vi tar exemplet med tärningen igen så ser vi att det första exemplet egentligen inte handlar om en riktig tärning utan endast om en matematisk modell som vi försöker ILLUSTRERA med ett fysiskt exempel. Om vi istället ställer oss frågan ”Hur stor är sannolikheten att slå en ”2:a” med JUST DEN HÄR TÄRNINGEN måste vi helt enkelt slå tärningen ett relativt stort antal gånger och se hur resultaten fördelar sig. Sannolikheten för att få en ”2:a” blir då den RELATIVA FREKVENSEN av just det resultatet. Om vi slår tärningen 1000 gånger och det blir en ”2:a” 175 gånger innebär detta att sannolikheten för att slå en ”2:a” är 175/1000=0,175. Detta är dock endast ett STATISTISKT VÄRDE som gäller URVALET. När det gäller den HYPOTETISKA OÄNDLIGA POPULATIONEN av tärningskast som en funktion av PARAMETERN så VET vi inte det sanna värdet (PARAMETERN) och kan heller aldrig VETA.

Jämfört med vår KLASSISKA modell ser vi att vår verkliga tärning HITTILLS verkar ha en större chans att hamna på en ”2:a” än vår teoretiskt perfekta tärning. Vad vi kan göra är att beräkna sannolikheten för UTFALLET givet ett ANTAGANDE av PARAMETERN, men vi kan inte VETA om resultatet i utfallet beror på att PARAMETERN har ett viss värde ELLER om avvikelsen från den teoriskt perfekta tärningen beror på slumpmässiga variationer i urvalsprocessen. I detta exempel kan vi alltså räkna på både KLASSISK sannolikhet och sannolikhet som RELATIV FREKVENS. För många naturliga fenomen finns det dock ingen möjlighet att tillämpa det klassiska begreppet - det är främst en matematisk konstruktion. Den tolkning av sannolikhet som är helt dominerande inom vetenskap idag är RELATIV FREKVENS eftersom det bättre tillfredsställer de behov som vetenskapen har. Dess dominans växte snabb i början av 1900-talet i takt med att statistiska metoder för SIGNIFIKANSTEST utvecklades. Pionjärer var R.A. Fisher, Jerzy Neyman, Egon Pearson, och John Venn.

LIKELIHOOD
Ett med sannolikhet närbesläktat begrepp är LIKELIHOOD. En LIKELIHOODFUNKTION kan sägas vara en spegelbild av en SANNOLIKHETSFUNKTION och definieras så att

Bild .

Detta uttolkas att ”LIKELIHOODFUNKTIONEN för PARAMETERN givet UTFALLET är lika med SANNOLIKHETSFUNKTIONEN för UTFALLET, givet PARAMETERN”. Men varför gör man då skillnad på LIKELIHOOD och SANNOLIKHET när de ger identiska värden? Svaret ligger i vad man anser att en PARAMETER är. Med ett OBJEKTIVT sannolikhetsbegrepp är PARAMETERN det SANNA värdet i en population, t.ex. medelvärdet. Som sådan är det inte en (slump)variabel. Den bara är. PARAMETERN kan därför INTE vara en funktion av insamlad DATA, utan insamlad DATA är en funktion av PARAMETERN. Och här går det ofta fel, både för lekmän och forskare. Vi vill så gärna uttala oss om PARAMETERN och ge den ett sannolikhetsvärde som speglar vårt förtroende för dess värde baserat på DATA, men det kan vi inte med ett OBJEKTIVT sannolikhetsbegrepp. Att sätta ett sannolikhetsvärde på en PARAMETER är i grunden en SUBJEKTIV process. Om vi felaktigt tolkar LIKELIHOOD som identiskt med SANNOLIKHET gör vi oss skyldiga till OMVÄND SANNOLIKHET och det är inte förenligt med tolkningen av sannolikhet som RELATIV FREKVENS, som är den tolkning som ligger till grund för traditionella SIGNIFIKANSTEST. Sannolikhetslänken kan alltså bara utgå från en PARAMETER till DATA, inte från DATA till en PARAMETER. Detta är en av de absolut vanligaste feltolkningarna av SIGNIFIKANSTEST och det viktigast skälet till att ordet ”konfidens” inte bara är gravt missledande utan står i direkt strid mot antagandena i normala SIGNIFIKANSTEST. LIKELIHOOD har en mycket viktig roll i modern statistik genom en familj ESTIMATORER (ung. "algoritmer för parameterskattning") som kallas MAXIMUM LIKELIHOOD. Det är en metod att ESTIMERA parametrar som blivit populär i takt med att persondatorer blivit tillräckligt kraftfulla för att numeriskt räkna ut de integraler som är förknippade med metoden. Den är främst tillämpbar på större urvalsstorlekar.

SUBJEKTIV SANNOLIKHET OCH BAYESIANSK INFERENS
Men finns det då verkligen ingen väg att utifrån DATA sätta något värde på vårt förtroende för PARAMETERN? Även om vi inte sätter ett formellt numeriskt värde så måste vi ändå sätta en viss (subjektiv) tilltro till en viss uppfattning om hur verkligheten är beskaffad. Annars har vi som människor ingen grund för att agera. Jo, det finns det och då hamnar vi ett fjärde sannolikhetsbegrepp, nämligen SUBJEKTIV sannolikhet eller BAYESIANSK sannolikhet. En SUBJEKTIV sannolikhet anger graden av förtroende för något uttryckt som ett numeriskt värde. Det handlar alltså om ett PROBABILISTISKT förhållningssätt till världen. Till skillnad från sannolikhet som RELATIV FREKVENS kan man tillämpa SUBJEKTIVA sannolikheter i enskilda fall. En viktig implikation av att gå från ett OBJEKTIVT till SUBJEKTIVT sannolikhetsbegrepp är den ställning som PARAMETERN har. Med ett OBJEKTIVT sannolikhetsbegrepp (t.ex. RELATIV FREKVENS) är PARAMETERN ingen varibel. Med ett SUBJEKTIVT sannolikhetsbegrepp blir PARAMETERN istället en SLUMPVARIABEL med en viss fördelning. PARAMETERNS ställning är alltså väsensskild mellan dessa båda tolkningar av sannolikhet.

Namnet BAYESIANSK inferens kommer av BAYES THEOREM. I korthet kan man säga att det är en algoritm som visar hur man ska uppdatera en subjektiv sannolikhet som man har INNAN man samlar in data (kallad en PRIOR) med den ”LIKELIHOOD” man erhåller för för DATA GIVET HYPOTESEN när man samlar in DATA. Den subjektiva sannolikhet som man erhåller EFTER man har uppdaterat sin PRIOR med ny informationen kallas POSTERIOR. En POSTERIOR kommer att bli en ny PRIOR när man samlar in mer data i nya försök. Denna process kallas BAYESIANSK INFERENS och löser problemet med att OMVÄND SANNOLIKHET. BAYES THEOREM kan skrivas på lite olika sätt men för INFERENS ser den ofta ut såhär:

Bild

där H står för "Hypotes" och E står för Evidens, dvs. data, och | betyder "givet".
Detta skall tolkas som att en POSTERIOR för en viss HYPOTES GIVET NY DATA är lika med PRIOR gånger ”LIKELIKHOOD” för DATA givet HYPOTESEN, delat med sannolikheten för DATA. P(E) är en normaliseringskonstant som kan vara svår att räkna ut, men budskapet är (ganska) enkelt: POSTERIOR är PROPORTIONELL mot PRIOR multiplicerat med SANNOLIKHETEN FÖR DATA GIVET HYPOTESEN.

Priset är dock högst påtagligt, framför allt när det gäller att bestämma fördelningen för PRIOR och DATA. Dessutom är begreppet inte kompatibelt med traditionella SIGNIFIKANSTEST. Litteraturen kring BAYESIANSK inferens upphåller sig till stor del kring olika principer för att objektivt välja en lämplig fördelning för en PRIOR. Viktigast är ”MAXIMUM ENTROPY” som i lekmannatermer innebär att man skall välja en PRIOR som antar så lite som möjligt utan att för den sakens skull anta för lite. Som en passus kan man tillägga att det KLASSISKA sannolikhetsbegreppets ”indifferensprincip” som tillskriver alla utfall samma sannolikhet, är ett gränsvärde för ”maximum entropy” när det inte finns någon tidigare information som säger att ett visst utfall borde vara mer sannolikt än något annat. Att gräva djupare i bayesiansk inferens skulle snabbt leda bort från målet med denna text, nämligen att ge ett slags ”känsla” för statistiken. Den är heller inte relevant för traditionella SIGNIFIKANSTEST, mer än som en påminnelse om hur man INTE kan tolka SIGNIFIKANSVÄRDEN. Den som är mer intresserad kan hitta mycket på Internet om detta. Formell behandling av bayesiansk inferens återfinns främst inom litteraturen för maskininlärning och statistik mekanik. En besläktad litteratur handlar om "bayesianska nätverk" inom data- och systemvetenskapen.

SAMMANFATTNINGSVIS kan vi konstatera att det finns två grundläggande förhållningssätt till sannolikhet: OBJEKTIV och SUBJEKTIV sannolikhet. Bland OBJEKTIVA sannolikhetsbegrepp är SANNOLIKHET SOM RELATIV FREKVENS idag den helt dominerade. KLASSISK sannolikhet dyker dock upp när vi vill beräkna hypotetiska värden för en PARAMETER med hjälp av kombinatorik. SUBJEKTIV sannolikhet är en ett numerisk värde på vår grad av förtroende för något, t.ex. ett samband eller en parameter. SUBJEKTIV sannolikhet är förknippat med BAYESIANSK INFERENS som är en algoritm för att hantera SUBJEKTIVA sannolikheter på ett matematiskt korrekt sätt. Att hantera subjektiv sannolikhet (dvs. grad av förtroende) för ett visst utfall UTAN att ta hänsyn till bayesiansk inferens leder till felaktiga slutsatser.

_____________________________________________
Frågor på det?

OBS. Jag vill återigen framföra att den stora utmaningen i texten är pedagogisk så kritik i form av påpekanden och frågor är mycket välkomna. Den här typen av texter är för övrigt INTE "snutna ur näsan", i alla fall inte för mig, så ta det försiktigt med F5 den kommande veckan.

/DQ-20

EDIT i rött
Senast redigerad av DQ-20 2013-02-08 16:14, redigerad totalt 5 gånger.
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:34

3. STATISTISKA SIGNIFIKANSTEST

Vi inleder med följande lilla jakthistoria:

- Jag satt ute på pass i helgen när det kom en älg förbi.
  Jag skulle just till att skjuta då det plötsligt dök upp
  en björn som började gör utfall mot älgen!
  Jag visste inte riktigt vad jag skulle göra.

- Det var som sjutton! Vad gjorde älgen?

- Den klättrade upp i ett träd!

- Men älgar kan väl inte klättra i träd?!

- Nej, jag vet. Men vad fan skulle den göra?

Statistiska signifikanstest åläggs ofta uppgifter de egentligen inte kan lösa. Det gäller främst möjligheten att utifrån insamlad data uttala sig om de mekanismer som genererar data. Att gå från det ”partikulära” (de fall man verkligen undersöker) till det ”generella” (lagbundenheter som genererar utfallen) är inte oproblematiskt. Minst sagt. Och det är ingen slump att det kallas signifikanstest och inte ”konfidenstest”.

Att något är STATISTISKT SIGNIFIKANT kommer av engelskans significant som betyder ungefär ”betydelsefull”, ”viktig” eller ”värd att lägga märke till”. Begreppet populariserades av R A Fisher under 1920-talet då den moderna doktrinen för signifikanstest grundlades. Andra viktiga bidrag kom då från bl.a. Jerzy Neuman och Egon Pearson. Den grundläggande tolkningen av sannolikhet som ligger till grund för deras arbeten är RELATIV FREKVENS. Det som avgör om ett resultat är STATISTISKT SIGNIFIKANT är om det i statistisk mening är ovanligt. Vi kan ta ett exempel.

Den som sett matcher från den amerikanska basketligan NBA kan inte ha undgått att lägga märke till att genomsnittslängden och variationen kring detta genomsnitt skiljer sig från övriga befolkningen – de flesta är runt 2 meter. Men det finns även spelare kring 1,75 m som regelbundet ”dunkar” bollen. Om vi drar ett slumpmässigt urval bland spelarna i NBA finns det en liten, men dock, chans att vi får en samling spelare som alla mäter mellan 1,75 och 1,85 och som vi inte skulle uppfatta som representativa för spelare i NBA som grupp betraktat. Om vi vet medellängden och hur populationen av spelare är fördelade runt detta medelvärde så kan vi beräkna sannolikheten för att få ett urval med en medellängd som avviker med ett visst värde från det sanna medelvärdet för alla spelare i NBA. Fördelningar av naturliga fenomen följer ofta en mindre samling matematiskt väldefinierade funktioner, vilket underlättar beräkningarna.

Om vi däremot försöker uttala om populationens egenskaper utifrån vårt urval stöter vi på patrull. Om vi inte känner till populationens sanna egenskaper så är data från vårt urval det enda vi har att gå på. Men hur kan vi veta om urvalet är representativt? Svaret är förstås: det vet vi inte. Det enda vi kan uttala oss om hur sannolikt ett visst urval är utifrån ANTAGANDEN om egenskaper hos populationen. Och det är precis vad ett SIGNIFIKANSTEST gör: hur (o)sannolikt är ett visst resultat givet vissa ANTAGANDEN om populationens egenskaper? Repris: ett statistiskt SIGNIFIKANT resultat är ett resultat som är statistiskt ovanligt och därför värt att lägga märke till.

Ett vanligt förförande vid hypotestestning går till på följande sätt:

1a. Ställ upp en nollhypotes (H0), som är den hypotes som skall testas
1b. Ställ upp en alternativ hypotes (uttalad eller outtalad) som är nollhypotesens komplement, dvs. INTE H0.
2. Genomför ett statistiskt test av nollhypotesen
3. Tillämpa en beslutsregel som avgör under vilken sannolikhetsnivå som du skall förkasta nollhypotesen. Välj den lägsta av flera standardiserade nivåer (t.ex. 0,01 eller 0,05) som den erhållna sannolikheten underskrider.

Litteraturen kring signifikanstest är inte samstämmig, i synnerhet inte om man går till urkällorna. Det gäller främst alternativhypotesens ställning och tillämpandet av en eventuell beslutsregel. Den ovanstående processen är det ”moderna” gängse sättet att gå tillväga men stöds faktiskt inte av någon av de grundläggande ”skolorna” inom signifikanstest (R A Fisher och Neyman/Pearson). Man kan kritiskt säga att man tagit det bästa (eller sämsta) av två världar och format en oheliga allians.

För att återgå till vårt basketexempel kan vi tänka oss att vi av olika anledningar (teori, observationer) vill testa om medellängden för spelare i NBA är MINST 2,00 meter. Detta är vår nollhypotes. Att ”noll” ingår i nollhypotesen har inget med ”ingen effekt” eller ”inget resultat” att göra utan kommer av engelskans ”null hypothesis”. Detta bör snarare tolkas som ett slags grundantagande eller ”baseline”. I vårt hypotetiska fall blir vår implicita alternativa hypotes att medelvärdet MINDRE är 2,00 meter.

UTVIKNING
Det skall sägas att nollhypoteser ofta är utformade i termer av ”ingen effekt” eller "ingen skillnad". Den alternativa hypotesen blir då ”någon effekt” eller "någon skillnad" men utan att man specificerar ett värde på hur stor effekten eller skillnaden är. Detta är praktiskt om man inte har särskilda skäl att definiera en viss effektstorlek.

Själva signifikanstestet i vårt exempel går till så att vi räknar ut sannolikheten för vårt urval under antagandet att det sanna medelvärdet är 2,00 meter eller mer. Om det skull slumpa sig så att vi får ett urval med många spelare under medellängd kommer våra beräkningar visa att det är mycket osannolikt att urvalet kommer från en population med det medelvärde över 2,00 m. Rent hypotetiskt kan vi säga att sannolikheten är 0,02 för vårt erhållna urval. Lika hypotetiskt tillämpar vi en beslutregel som säger ”förkasta nollhypotesen om sannolikheten för resultatet (p) är mindre än 0,05. Eftersom 0,02 är mindre än 0,05 förkastar vi nollhypotesen. Logiskt sett har vi inget annat att välja på än att behålla den alternativa hypotesen, nämligen att medelängden bland spelarna i den amerikanska basketligan är UNDER 2,00 m. Vi har inte bevisat något i strikt mening, men vad fan ska man göra.

Här har vi valt ett exempel där beslutsregeln leder till ett felaktigt beslut. Vi har förkastat en sann nollhypotes och gör oss därför skyldiga till ett beslutsfel av typ 1. Men så var vårt urval också osannolikt.

När det gäller F/E-tester bygger de flesta redovisade uträkningarna på kombinatorik. För att öka förståelsen kan vi istället angripa problemet med en PARAMETRISERAD modell där den hypotetiska oändliga populationen karaktäriseras av en central tendens (medelvärde) och ett spridningsmått (varians eller standardavvikelse), dvs. populationens PARAMETRAR. Den relevanta sannolikhetsfunktionen för en variabel som kan anta värdena 1 eller 0 med sannolikheterna p respektive 1-p kallas binomialfunktionen. Medelvärdet för ett försök är p och variansen för ett försök är p*(1-p). För en serie med n försök blir medelvärdet n*p och variansen n*p*(1-p).

Om vi har en variabel med värdena 0 (fel) och rätt (1) kommer en helt slumpmässig process att generera ett långsiktigt medelvärdet på 0,5 för varje försök. Om vi vill undersöka om en serie försök kommer från en population som INTE har ett medelvärdet på 0,5, dvs INTE kommer från en helt slumpmässig process, kan vi ställa upp följande hypoteser.

H0: Det sanna medelvärdet = 0,5
HA: Det sanna medelvärdet är INTE 0,5

Binomialfunktionen tecknas på detta sätt:

Bild (1)

Tolkningen är att sannolikheten P att få exakt k ”rätt” i en serie försök beror av hur många försök man gör (n), hur stor sannolikheten patt få ”rätt” är i varje försök, samt hur stor sannolikheten q är att svara fel.

q=1-p (2)

och

Bild (3)

Vi kan här lägga märke till att p kan varieras. Vi skulle således kunna ställa upp en nollhypotes med valfritt värde på p och är inte bundna till just 0,5 även om det är det enda förekommande i just F/E-lyssningar

ETT EXEMPEL
Vad är sannolikheten att få MINST 8 rätt i 9 försök om sannolikheten för att svara rätt i varje försök är 0,5. Vi måste då använda den KUMULATIVA sannolikhetsfunktionen. För kontinuerliga sannolikhetsfunktioner, exempelvis den klassiska normalfördelning, innebär detta arean under kurvan för sannolikhetsfunktionen, dvs. att den kumulativa sannolikhetsfunktionen eller sannolikhetsfördelningen är integralen av sannolikhetsfunktionen. För diskreta sannolikhetsfördelningar summera vi de enskilda sannolikheter som ges av sannolikhetsfunktionen.

I vårt fall blir den kumulerade sannolikheten att vi får MINST 8 av 9 rätt summan av sannolikheten att få 8 av 9 rätt PLUS sannolikheten att får 9 av 9 rätt, formellt ”P(k≥8 )”

För 8 av 9 rätt gäller

k=8
n=9
p=0,5
q=0,5

För 9 av 9 rätt gäller:

k=9
n=9
p=0,5
q=0,5

För den som är road är det bara att plugga in värdena formlerna (1) och (3) och summera. För den som är mindre road, finns färdiga kalkylatorer på nätet, t.ex.

http://stattrek.com/online-calculator/binomial.aspx

Svaret blir i alla fall 0,0195

Om vi tillämpar beslutsregeln att förkasta H0 om p är mindre än 0,05 så innebär resultatet minst 8 av 9 rätt att vi förkastar H0. Slutsatsen blir att våra försök INTE kommer från en hypotetisk oändlig population med medelvärdet 0,5, dvs. våra svar är inte helt slumpmässiga.

Skulle vi acceptera utfallen som innebär minst 8 av 9 FEL stiger den kumulerade sannolikheten till det dubbla, dvs. p=0,039, eftersom vi också kommer att acceptera resultat med "ett eller färre fel". Beslutet att förkasta H0 kvarstår dock.

Och sådär kan man hålla på…

ÖVERKURS
Centrala gränsvärdesteoremet ger att SUMMAN av en serie STATISTISKT OBEROENDE och IDENTISKT FÖRDELADE slumpvariabler (sk. i.d.d., independently and identically distributed) tenderar att vara fördelade enlig normalfördelningen OBEROENDE av variablernas grundläggande fördelning. Om vi betraktar varje försök i en serie på 7 som en slumpvariabel kommer alltså fördelning av denna summa tendera mot normalfördelning. Tumregeln säger att när det ingår 20 försök i varje serie/testomgång kan man med acceptabelt resultat ersätta binomialfördelningen med normalfördelningen. Ju kortare serie, desto större fel får man genom att approximera binomialfördelningen med normalfördelningen. Fördelen är att normalfördelningen är markant mindre beräkningskrävande vid ökande serielängder.

För att summera några av de viktigaste punkterna i signifikanstest:

1. Ett signifikanstest provar hur sannolikt ett erhållet resultat är givet antaganden om parametrarnas värden, INTE sannolikheten för de parametrar som antas styra utfallen.
2. Statistiskt SIGNIFIKANTA resultat är resultat som är ovanliga, givet vissa antaganden om PARAMETERARNA (populationsegenskaper). Osannolika resultat är värda att lägga märke till. Förenklat: SIGNIFIKANT är det samma som OVANLIGT.
3. Desto ovanligare ett utfall är (dvs. har LÅG sannolikhet för att inträffa) desto HÖGRE är dess statistisk signifikans (ovanlighet).
4. Ett signifikanstest provar H0, men INTE den alternativa hypotesen HA.
5. Vi förkastar H0 på grundval av en BESLUTSREGEL och hur (o)sannolikt utfallet är.
6. (O)sannolikheten för ett utfall under antagandena i H0 är INTE det samma som hur sannolik den alternativa hypotesen är. Det beror dels på att vi formellt inte testar den alternativa hypotesen HA utan endast H0, dels på att det skulle innebära ”omvänd sannolikhet” vilket inte är förenligt med definitionen av sannolikhet som relativ frekvens, vilket är den definition som signifikanstest förutsätter.

En slutsats man bör dra är att användningen av ordet ”konfidens” för (1-p), tolkat som ”förtroende för den alternativa hypotesen”, inte har med signifikanstest att göra, hur gärna vi än skulle vilja.

Och älgar kan inte klättra i träd.

Frågor på det?

Nästa avsnitt kommer sannolikt att behandla hur man kan tänka kring signifikansvärden vid avbrutna serier. Grundidén är att det i t.ex. F/E-test inte handlar om att man förlänger en testserie i hopp om att uppnå ett statistiskt signifikant resultat utan att man förkortar en testserie som egentligen är längre när man väl har uppnått ett statistiskt signifikant resultat.

/DQ-20

PS: Jag vill upprepa att jag är mycket tacksam för påpekanden om:
1. Sakfel
2. Pedagogiska missgrepp. Indikationer på pedagogiska missgrepp är att du inte förstår inlägget, tycker det inte är tillräcklig informativt eller tycker det är FÖR informativt.
3. Jag hade velat använda tecken för "mer än" och "mindre än" men det tolkar forumprogramvaran som html-taggar och vägrar acceptera texten.
4. Möjligen genererar mitt basketexempel mer frågor än svar. Jag skall klura på det lite till.
Senast redigerad av DQ-20 2013-03-05 16:04, redigerad totalt 8 gånger.
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:35

DQ-20 skrev:
DQ-20 skrev:Reserverat
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 18:35

Reserverat
You leave me no option but to key your car.

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 13289
Blev medlem: 2005-01-01
Ort: Göteborg

Inläggav Almen » 2013-01-30 18:38

Nice. Kanske kan bli en artikel av det. :)
Meine Herren, der Senate ist ja keine Badenanstalt, warum darf eine Frau nicht dorthin?
David Hilbert

Användarvisningsbild
hifikg
Mr Clickbait
 
Inlägg: 10837
Blev medlem: 2011-09-17
Ort: Metropolen Hallstahammar

Inläggav hifikg » 2013-01-30 18:38

Vad behöver du veta?
Sitter nöjd :-)

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Inläggav DQ-20 » 2013-01-30 18:41

Almen skrev:Nice. Kanske kan bli en artikel av det. :)


Ja, i alla fall EN sammanhängande text.

/DQ-20
You leave me no option but to key your car.

Användarvisningsbild
PerStromgren
Redaktör/Diskmästare
 
Inlägg: 24112
Blev medlem: 2005-03-25
Ort: Karlstad

Inläggav PerStromgren » 2013-01-30 19:10

F5.F5.F5.F5.F5.F5.

:D
... tycker jag!

Per

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 35932
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2013-01-30 20:26

Kul! Jättebra att du förklarar alla "grundorden" själv snubblar jag ofta på dem när jag läser det du skriver.

Jag känner mig konfident att detta kommer att bli en bra tråd.

DQ-20 skrev:Reserverat


Voffödådå, det är väl bara att redigera förstainlägget?
Samarbeta med människor som söker sanningen.
Undvik de som har funnit den.

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 35932
Blev medlem: 2004-03-03
Ort: oakustisk

Inläggav Svante » 2013-01-30 20:28

PerStromgren skrev:F5.F5.F5.F5.F5.F5.
_________________
... tycker jag!

Per


Du menar väl "trycker jag"?
Samarbeta med människor som söker sanningen.
Undvik de som har funnit den.

Användarvisningsbild
Naqref
Saknad grundare, †2014
 
Inlägg: 27894
Blev medlem: 2003-03-23
Ort: Krischansta

Inläggav Naqref » 2013-01-30 20:29

Den här gör vi till sticky redan nu. :D
Audiodesigner åt en del. Larsen, Holographic Audio etc.
CEO och huvudägare i Acoustic Landscape R&D AB.
CTO / R&D Manager och delägare i Acoustic Illusion AB.

Användarvisningsbild
KarlXII
Dussinmänniska/Admin
 
Inlägg: 27607
Blev medlem: 2007-02-17
Ort: Himlafiket

Re: Den stora tråden om STATISTIK

Inläggav KarlXII » 2013-01-30 20:45

DQ-20 skrev:Jag är vare sig matematiker eller statistiker, dvs. jag har ingen grundexamen i statistik eller matematik, om någon undrar.

/DQ-20


Vad är du då? :evil:
T H E. G O O S E B U M P. F A C T O R

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Inläggav DQ-20 » 2013-01-30 20:45

Naqref skrev:Den här gör vi till sticky redan nu. :D


Härreguud vilken press! 8)

Nåja, det blir väl inte hyperfart på mina inlägg: det tar lite tid att knåpa ihop text och man har ju annat att göra om dagarna. Men nästa inlägg kommer sannolikt att heta "Sannolikhetsbegrepp". :D

/DQ-20
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 20:45

KarlXII skrev:
DQ-20 skrev:Jag är vare sig matematiker eller statistiker, dvs. jag har ingen grundexamen i statistik eller matematik, om någon undrar.

/DQ-20


Vad är du då? :evil:


Skit i det du, så lever du längre! :twisted:
You leave me no option but to key your car.

Användarvisningsbild
Laila
 
Inlägg: 9542
Blev medlem: 2005-05-31
Ort: Nattmössan

Inläggav Laila » 2013-01-30 22:05

Prisjägare/pillertrillare/begravningsentreprenör, allt i ett . . . typer ? :evil:

Slut på OT. :oops:
Sterio . . . krävs dä tvillingar för å lyssna på´t åsså, typ . . . ?
Sedan mitt andra jag gick bort lyssnar jag mest på monio . . . typ.

dimitri
 
Inlägg: 4598
Blev medlem: 2003-09-20
Ort: Götelaborg

Inläggav dimitri » 2013-01-30 22:07

statistik är område där det intuitiva kan krocka med det matematiska. Det är eller brukar vara eller naturligt att det intuitiva försvaras. Det har hänt mig här på Faktiskt. Med all respekt för statistik och matematik kommer människan alltid att reagera intuitivt i livsavgörande situationer. Nu är inte F/E tester livsavgörande. Gott så
I'm not a complete idiot... Some parts are missing

Användarvisningsbild
Nattlorden
pumpkin
 
Inlägg: 48031
Blev medlem: 2003-10-28
Ort: Grå Hamnarna

Inläggav Nattlorden » 2013-01-30 22:26

dimitri skrev:Nu är inte F/E tester livsavgörande.


Vad säger du, människa!!? :evil:

8)
The future is already here — it's just not very evenly distributed. // William Gibson

Användarvisningsbild
roggaro
 
Inlägg: 4738
Blev medlem: 2009-06-11
Ort: Hising Island

Inläggav roggaro » 2013-01-30 22:43

nån nämnde instinktivt, tror ja :? :x

EDIT: förresten vad har sannolikhetskalkyler med faktiskt att göra :roll:
burning in the eyes of the maker

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Inläggav DQ-20 » 2013-01-30 22:59

dimitri skrev:statistik är område där det intuitiva kan krocka med det matematiska. Det är eller brukar vara eller naturligt att det intuitiva försvaras. Det har hänt mig här på Faktiskt. Med all respekt för statistik och matematik kommer människan alltid att reagera intuitivt i livsavgörande situationer. Nu är inte F/E tester livsavgörande. Gott så


Det beror kanske på vad man menar med "intuitivt". Tänk "kliniska blicken" eller "känsla för", så förstår du vad jag menar. Vad jag avser är att man kan "se" begrepp och samband framför sig utan att nödvändigtvis kunna ställa upp formler och räkna på det. Kan det vara en lagom målsättning?

/DQ-20
You leave me no option but to key your car.

Användarvisningsbild
aisopos
 
Inlägg: 3636
Blev medlem: 2011-11-20
Ort: ogonal

Inläggav aisopos » 2013-01-30 23:06

Ett väldigt trevligt initiativ DQ-20.



I mina försök att låta begreppet "inferens" sjunka in och fördjupas lite har jag googlat
fram följande:
Först denna, mycket lite, mycket enkelt, ger kanske inte mer info än vi redan finner
i tråden, och dessutom kanske en tveksam källa? men i vilket fall,
http://www.aktiesite.se/Statistik/infer ... tistik.htm

Däremot denna (som jag inte själv är klar med än) verkar rejält gedigen med hur mycket
info som helst att ösa ur.
http://www.bbs.hik.se/utbildning/kurssi ... ns_bbs.pdf
Redan inledningen var ju lovande, med bilden och förklaringen över hur man antingen
söker svaret på sin fråga från ena eller andra hållet.
Där tror jag att jag själv har tänkt bort mig en del, att blanda ihop sannolikheterna
med förutsägelse av verkligheten utifrån stickproven.
Senast redigerad av aisopos 2013-01-30 23:10, redigerad totalt 1 gång.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2013-01-30 23:08

Svante skrev:Jag känner mig konfident att detta kommer att bli en bra tråd.

Ussare, kvanting!

Svante skrev:
DQ-20 skrev:Reserverat

Voffödådå, det är väl bara att redigera förstainlägget?

Skit i det, så lever du längre! (Mitt nya avsnoppande universalsvar.)

/DQ-20
You leave me no option but to key your car.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Inläggav DQ-20 » 2013-01-30 23:20

aisopos skrev:Däremot denna (som jag inte själv är klar med än) verkar rejält gedigen med hur mycket
info som helst att ösa ur.
http://www.bbs.hik.se/utbildning/kurssi ... ns_bbs.pdf


Gulligt med klassisk statistiksvenska: "stickprov". :)

För att förtydliga så jag själv inga problem med detta. Problemet är främst pedagogiskt och ligger mycket i innebörden av de grundläggande begreppen inferens, sannolikhet, och signifikanstest och hur dessa är kopplade. Målet är att eventuellt kunna sätta punkt för fler statistikdiskussioner om samma saker om och om igen, främst vad gäller f/e-tester. Det handlar alltså inte om allmänna kunskaper utan ganska specifikt för experimentliknande situationer där man väljer mellan två alternativ i relativt korta serier.

/DQ-20

PS. Den första länken kan du glömma.
You leave me no option but to key your car.

Användarvisningsbild
Nattlorden
pumpkin
 
Inlägg: 48031
Blev medlem: 2003-10-28
Ort: Grå Hamnarna

Inläggav Nattlorden » 2013-01-30 23:22

roggaro skrev:EDIT: förresten vad har sannolikhetskalkyler med faktiskt att göra :roll:


Nu kom jag att tänka på Harrisburg...
The future is already here — it's just not very evenly distributed. // William Gibson

Användarvisningsbild
petersteindl
Der Eiermann
 
Inlägg: 30276
Blev medlem: 2007-04-17
Ort: Saltsjö-Boo

Re: Den stora tråden om STATISTIK

Inläggav petersteindl » 2013-01-30 23:41

DQ-20 skrev:1. STATISTISK INFERENS
Statistisk inferens handlar om att utifrån ett begränsad antal fall (URVAL) uttala sig om ett stort antal fall som vi av någon anledning anser utgöra en avgränsad grupp med gemensamma attribut (POPULATION). Populationer kan vara ÄNDLIGA och empiriska, som t.ex. alla barn födda i Sverige 2012. En sådan population skulle vi i princip kunna göra en totalundersökning på om vi bara hade tillräckligt fullständiga register. När det gäller experiment använder man sig av en annan typ av populationsbegrepp, nämligen en HYPOTETISK OÄNDLIG POPULATION, t.ex. alla utförda och ännu inte utförda f/e-lyssningar genomförda under samma förutsättningar. En HYPOTETISK OÄNDLIG POPULATION av försök (fall; händelser) är alltså det begrepp som ligger till grund för statistisk inferens från experiment. Kravet på att göra den hypotetiska populationen OÄNDLIG kommer sig av att vi måste säkerställa att populationen innehåller ALLA möjliga fall, även framtida, från vilka vi kan sägas dra ett slumpmässigt urval när vi utför våra experiment. Vi vill ju att våra slutsatser skall hålla även i framtiden. I en oändlig population har varje försök en oändligt liten sannolikt att komma med i urvalet, dvs. de försök som vi verkligen genomför. Dessutom antar man att alla försök har lika stor chans att komma med. En OÄNDLIG HYPOTETISK population kan också vara en lämplig modell för en till synes ÄNDLIG population, om man tänker sig att resultaten även skall gälla framtida versioner av populationen.

Överkurs:
Länken mellan URVALET och POPULATIONEN bygger på sannolikhetskalkyler. För att denna länk skall hålla måste vi kunna definiera sannolikheten för att ett visst försök eller fall ska komma med i urvalet. Alla fall måste INTE ha samma sannolikhet att inkluderas, men deras individuella sannolikheter måste vara KÄNDA. Detta kräver någon form av slumpmässig mekanism för att ta fram urvalet, men möjliggör också viktning av vissa typer av fall baserat på extern information om populationen. Om vi till exempel på FÖRHAND vet att en viss population består av 10% röda och 90% blå fall kan vi ÖVERSAMPLA de röda fallen så att vi får tillräckligt med röda fall (i ANTAL) i vårt urval. URVALET kommer alltså att ha en högre andel ”röda” än vad POPULATIONEN innehåller. ”Värdet” av dessa röda fall i urvalet måste vi dock ”skala ned” med inversen på vår översampling när vi gör inferenser till vår population.

Frågor på det?


Reserverat.
VD Bremen Production AB; Grundare av Ljudbutiken AB; Fd import av hifi; Konstruktör av LICENCE No1 D/A, Bremen No1 D/A, Forsell D/A, SMS FrameSound, Bremen 3D8 m.fl.

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 13289
Blev medlem: 2005-01-01
Ort: Göteborg

Inläggav Almen » 2013-01-30 23:42

Nu är jag kanske fel ute, men vore det hemskt opassande att inkludera en lätt resonerande Bayes-analys av en F/E-lyssning? Som ett komplement, liksom.
Meine Herren, der Senate ist ja keine Badenanstalt, warum darf eine Frau nicht dorthin?
David Hilbert

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 7741
Blev medlem: 2003-12-03
Ort: ografi

Inläggav DQ-20 » 2013-01-30 23:58

Almen skrev:Nu är jag kanske fel ute, men vore det hemskt opassande att inkludera en lätt resonerande Bayes-analys av en F/E-lyssning? Som ett komplement, liksom.


Det kommer, hade jag tänkt, dels under sannolikhetsbegrepp, dels under tolkning av signifikanstest. Mest som en passus, men det är viktigt för att förstå att signfikansnivå inte säger något om hur sannolika parametrarna är, såvida man inte använder sig av en bayesiansk approach. Och det gör ju inte så många och de som gör det är kufar. Det blir kanske en kalldusch för de som tror att 1-p har något med matematiskt bevisat förtroende att göra...
You leave me no option but to key your car.

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 13289
Blev medlem: 2005-01-01
Ort: Göteborg

Inläggav Almen » 2013-01-31 00:01

Sweet. :)
Meine Herren, der Senate ist ja keine Badenanstalt, warum darf eine Frau nicht dorthin?
David Hilbert

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 35932
Blev medlem: 2004-03-03
Ort: oakustisk

Inläggav Svante » 2013-01-31 00:22

F5
Samarbeta med människor som söker sanningen.
Undvik de som har funnit den.

Nästa

Återgå till Teknikforum


Vilka är online

Användare som besöker denna kategori: RogerGustavsson och 1 gäst