1

lørdag, 5. december 2009, 12:21


Jeg sidder og arbejder med en statistik projektopgave hvor vi har givet et datasæt.

Den ene opgave betsår i at lave en simpel lineær regression - dette er simpelt og forstår princippet bagved.

Men da jeg var oppe og snakke med vejlederen blev jeg anbefalet at lave datatransformation. - Men som jeg hørte det skulle jeg efter datatransmission opnå en "pæn normalfordeling", men det gør jeg ikke ved at benytte de mere "almidelige" datatransmissioner (kv-rod, ku-rod, Log og invers).

Jeg kan umiddelbart så konkludere to ting, enten er datasættet noget lo**, eller også skal jeg sidde og prøve mig frem efter alle kunstensregler og mere eller mindre kreative datatransformationer.

Er der eventuelt nogen, som kender et program der kan lave datatransmission?

Dette indlæg er blevet redigeret 1 gange, senest redigeret af "Zalam" (05.12.2009, 12:22)


2

mandag, 7. december 2009, 22:18


Det lyder umiddelbart som om du kører lidt rundt i begreberne. Som du -- ganske rigtigt -- skriver første gang, så har din vejleder sagt, at du bør foretage en datatransformation. Hvad en transmission er for noget i relation til data, har så vidt jeg ved ikke noget med databehandling at gøre.

Nu har du ikke givet så meget information om dit problem, så det er svært at sige hvorfor du ikke får en normalfordeling, når din vejleder siger du bør. Hvis det er rigtige data, så kan du ikke forvente at få en pæn normalfordeling, med mindre du har ualmindelig mange observationer. Typisk ser dit histogram lidt skævt og underligt ud. Alternativt kan det være, at dit problem er baseret på simulerede data. Hvis det er tilfældet, så bør du få noget, der ser meget normalfordelt ud, hvis din vejleder siger det. Hvis I har lært om goodness-of-fit tests, kan du jo prøve at teste dine data mod normalfordelingen.

Mht. hvilken transformation du skal bruge, plejer man vidst at tage logaritmen (10-tals eller naturlig, det er ikke så vigtigt), for at reducere variansen, dvs. gøre 'halerne' mindre.

Måske kan du uddybe dit problem lidt? Hvis du stadig har behov for hjælp.


3

tirsdag, 8. december 2009, 07:40


Alt efter typen af data, så er det meget normalt at bruge 20*log10.


Nyeste Videoer og Trailers

Partner sider
Indsend nyhed
Har du fundet en fed nyhed så indsend den så alle andre på Tweak.dk kan få glæde af den.