본문 바로가기
👨‍🎓약대 전공공부/약품분석화학

31_약품분석화학_2.2 측정치의 통계적 처리

by 소우118 2020. 6. 22.

-같은 실험을 반복하였을  얻은 여러 개의 측정치로부터 가장 바람직한 결과를 도출하고  결과 신뢰성에 대해여 평가할  있어야 한다.

-일련의 실험결과 중에서 폐기해야  측정치가 존재하는지의 판단 또는 서로 다른 방법으로 얻어진 결과를 비교할 때도 자료의 통계적인 처리가 필요하다.

 

<정규분포곡선>

존재하지 않는 이미지입니다.

 

▶평균값 μ를 중심으로 하여 좌우대칭이며, μ에서 높이가 가장 크다.

▶큰 오차 보다 작은 오차의 빈도가 크다.

▶대단히  오차는 거의 나타나지 않는다.

▶곡선의 변곡점과 중앙선 사이의 거리는 표준편차와 같다.

▶곡선 아래의 면적은  범위의 측정치의 확률을 나타낸다.

 

 

<유한  측정치의 통계 처리>

모집단을 대표할  있도록 무작위로 시료를 채취하여도 한정된 개수(n) 시료에 지나지 않으므로,  평균치(x bar)나표준편차(s) 완전히 모평균μ  모표준편차 σ 일치한다는 보증은 없다.

 이유는 ‘무한과 유한’사이의 차이 때문이며 양자 간에 유사성은 있으나 같다고 단정할 수는 없다.

그러므로n, x bar, s등의 수치를 이용하여 어느 확률 수준에서 모집단에 관한 여러 가지 사항을 통계적 방법으로 추정하는 것이 합리적이다.

è 이러한 모집단과 표본의 관계를 나타내는 것이 confidence level (신뢰도 수준)이다.

 

 

 

 

 

<기술통계량>

1) 집중경향: 아래의  가지 집중경향 척도는 정규 분포 곡선에서는 일치하나, 유한  측정에서는 일치 하지 않을 수도 있으며 n 작을수록 일치하지 않는 경향이 커진다.

존재하지 않는 이미지입니다.

 

2) 산포도: n 측정치의 분포를 나타내는 척도

 

존재하지 않는 이미지입니다.

존재하지 않는 이미지입니다.

 

<t-분포 = student’s t-분포>

: 모평균, 모분산을 몰라서 표본평균과 표본분산 값을 쓰는데 표본크기가 작아서 정규분포를    사용한다. 실제 분석의 경우에는 모평균과 모분산을   없는 경우가 대부분이다.

t분포의 경우 자료의 개수가 많으면(30 이상) 정규분포와 매우 비슷해지지만 그렇지 않은 경우에는 모양이 달라진다.

▶그래서 t표는 표준정규분포와는 달리 항상 자유도(n-1) 따라서 나타낸다.

t분포는 신뢰구간을 나타낼 떄와  군의 실험 결과를 비교하는 유의성 검정에 자주 쓰인다.

-> t-검정

 

*

존재하지 않는 이미지입니다.

신뢰구간(confidence intervla)이란?

모평균이 있으리라 추측되는 측정치의 평균의 구간을 나타낸다.

<신뢰구간 추정> 시험문제 나옴. 신뢰구간 계산예시 풀어보기!

▶한정된 수의 측정으로부터 모평균(μ) 모표준편차(σ) 구하는 것은 불가능하다.

▶실제로 결정되는 것은 측정치의 평균(x bar) 표준편차(s)이다.

▶신뢰구간(confidence interval) 모평균이 있으리라 추측되는 측정치의 평균의 구간을 나타낸다.

▶모평균의 신뢰구간은 다음과 같다.

존재하지 않는 이미지입니다.

▶일반적으로 사용되는 확률수준은 95%이다.

 

 

<실험 결과의 비교: t-검정 >

t검정=귀무가설 검정:

2군의 분석치 사이에 차가 생겼을   유의성의 유무를 판단하는 방법. 다음과 같이 다시 세분화 해볼  있다.

1) 2군의 측정치에 대한 평균의 비교 -> 표본 2 그룹을 비교하는 지표로 평균을 잡은 .

2) 측정치의 평균과 표준치의 비교 (정확도 검정)

3) 개별측정에 대한 비교 -> 같은 표본을 다른 분석법으로 측정하여 비교해보는 . 새로운 분석법을 개발할 많이 쓴다. ex. 코로나 진단키트의 정확도 검정.

 

각각의 t 계산법을 외워야 하며.. 계산  t값이 t-table 값보다 크면 유의미한 차이가 있는 것으로 해석한다.

 

1) 2군의 측정치에 대한 평균의 비교

존재하지 않는 이미지입니다.

존재하지 않는 이미지입니다.

① 같은 시료를  가지 분석법으로 분석한 분석한  평균치  차에 유의성 -> 계통 오류가 있다.

 2군의 시료를 같은 분석법으로 분석한  평균치  차에 유의성 -> 우발적이 아니라 분명한 차이가 있다.

è 기타 여러가지 조건(실험자, 장소, 일시, 시약 ) 서로 달리한 실험의  가지 평균치에 관하여  유의성을 판정한다.

2) 측정치의 평균과 표준치의 비교(정확도 검정)

존재하지 않는 이미지입니다.

 

3) 개별 측정에 대한 비교

존재하지 않는 이미지입니다.

F분포와 분산의 비교

두 군의 분산을 비교하는 목적은?

주어진 신뢰도 내에서 두 군의 실험치를 혼합할 수 있는지의 여부나, 어느 군의 정밀도가 더 좋은지를 검정하기 위함

계산한 F값이 table의 F값보다 크면 차이에 유의성이 있다고 판단된다.

이 경우 주어진 신뢰도 내에서 두 종류의 측정치는 서로 혼합되어 처리될 수 없으며,

분산이 작은 쪽이 큰 쪽보다 정밀도가 더 크다는 사실을 유추할 수 있다.

F분포는 분산의 동일성검정에서 뿐만 아니라 세 집단 이상의 평균값들에 대한 차이의 검정에도 이용된다.

이때 이용되는 유의성 검정방법은 분산분석(analysis of varienec; ANOVA)이라 한다.

요인이 하나인 경우 one-way ANOVA를, 요인이 두 개인 경우 two-way ANOVA를 쓴다.

분산분석을 위해 필요한 조건은

1) 모집단들이 모두 정규분포를 따라야한다.

2)모집단들이 동일한 분산을 가져야 한다.

3) 각 모집단에서 추출된 표본들이 상호독립적이어야 한다.

반응형

댓글