나도' 통계학' 제 4 판 방과후 연습 답안을 하나 구하는데 .. 자준평 하효군 김용진 .. 감사합니다.

제 4 장 연습 문제 답변

4.1 (1) 대중 수: m0 = 10; 중간: 중간 위치 =n+1/2=5.5, me = 10; 평균:

(2)QL 위치 =n/4=2.5, QL = 4+7/2 = 5.5; QU 위치 =3n/4=7.5, QU=12

(3)

(4) 평균이 중앙값과 중수보다 작기 때문에 자동차 판매량은 좌측 분포이다.

4.2 (1) 표에서 볼 수 있듯이 연령이 가장 많이 발생하는 것은 19 와 23 이므로 중수, 즉 M0=19 와 M0=23 이 있다.

원시 데이터가 정렬된 후 계산된 중앙값은 중앙값 위치 = n+1/2=13, 13 번째 위치의 숫자 값은 23 이므로 중앙값은 Me=23

입니다

(2)QL 위치 =n/4=6.25, QL = = 19; QU 위치 =3n/4=18.75, QU=26.5

(3) 평균 600/25=24, 표준 편차

(4) 바이어스 계수 SK=1.08, 피크 계수 K=0.77

(5) 분석: 대중, 중위수, 평균치로 볼 때 누리꾼 연령이 23 ~ 24 세인 사람이 다수를 차지한다. 표준편차가 크기 때문에 네티즌의 나이 사이에 큰 차이가 있음을 보여준다. 편향 계수로 볼 때 나이 분포는 오른쪽 편향이며, 편향 계수가 1 보다 크기 때문에 편향도가 매우 크다. 피크 상태 계수가 양수이므로 피크 분포입니다.

4.3 (1) 줄기와 잎그림은 다음과 같다:

줄기 잎 빈도

5

6

7 5

6 7 8

1 3 4 8 8 1

3

5

(2) 63/9=7,

(3) 두 큐잉 방식의 평균이 다르기 때문에 이산계수로 비교한다.

첫 번째 대기열 방법: V1 = 1.97/7.2 = 0.274; V2=0.714/7=0.102. V1 > V2 로 인해 첫 번째 대기열 방법의 이산도가 두 번째 대기열 방법보다 크다는 것을 나타냅니다.

(4) 두 번째 대기열 방식의 평균 대기 시간이 짧고 분산도가 첫 번째 대기열 방식보다 작기 때문에 방법 2 를 선택합니다.

4.4 (1) 8223/30=274.1

중간 위치 =n+1/2=15.5, Me=272+273/2=272.5

(2)QL 위치 =n/4=7.5, QL = = (258+261)/2 = 259.5; QU 위치 =3n/4=22.5, QU=(284+291)/2=287.5

(3)

4.5 (1) a 기업의 평균 원가 = 총 원가/총 생산량 =

을 기업의 평균 원가 = 총 원가/총 생산 =

원인: 두 기업의 단가는 같지만, 단가가 낮은 제품은 을기업의 생산량에서 비중이 높기 때문에 총 평균 원가를 낮췄다.

4.6 (1) (계산 중 표략), 51200/120=426.67

SK=0.203 K=-0.688

4.7 (1) 두 조사위원이 받은 평균 키는 거의 같아야 한다. 평균의 크기는 기본적으로 샘플 크기의 영향을 받지 않기 때문이다.

(2) 두 조사위원이 받은 높이의 표준 편차는 거의 같아야 한다. 표준 편차의 크기는 기본적으로 샘플 크기의 영향을 받지 않기 때문이다.

(3) 큰 샘플을 가진 조사관들은 최고나 최저를 얻을 수 있는 기회가 더 크다. 샘플이 클수록 변화의 범위가 커질 수 있기 때문이다.

4.8 (1) 남녀 학생의 체중 이산도를 비교하기 위해서는 이산계수를 사용해야 한다. 여자 체중의 이산계수는 v 여자 =5/50=0.1 이고 남자 체중의 이산계수는 v 남 =5/60=0.08 이므로 여자 체중의 차이가 크다.

(2) 남자: 60×2.2=132 (파운드), s=5×2.2=11 (파운드)

여자: 50×2.2=110 (파운드), s=5×2.2=11 (파운드)

(3) 체중이 대칭 분포라고 가정하면, 경험법칙에 따르면 평균에서 1 표준 편차 범위 내의 데이터 수는 약 68 이다. 따라서 남학생 중 약 68 명은 몸무게가 55kg-65kg 사이이다.

(4) 체중이 대칭 분포라고 가정하면, 경험법칙에 따르면 평균에서 2 개의 표준 편차 범위 내에 있는 데이터 수는 약 95 이다. 따라서 남학생 중 약 95 명은 몸무게가 40kg-60kg 사이이다.

4.9 표준 점수를 계산하여 판단:

이 테스터는 A 항 테스트에서 평균 점수보다 1 표준 편차가 높았고 B 항 테스트에서는 평균 점수 0.5 표준 편차만 높았습니다. A 항 테스트의 표준 점수가 B 항 테스트보다 높기 때문에 A 항 테스트가 이상적이었습니다.

4.10 은 표준점수로 판단하고, 하루의 표준점수는

표와 같다

날짜 월요일 화요일 수요일 목요일 금요일 토요일 일요일

표준 점수 Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0

월요일과 토요일 이틀 동안 통제를 잃었다.

4.11

(1) 불연속 계수를 사용해야 합니다. 이는 서로 다른 데이터 수준 그룹의 영향을 제거하기 때문입니다.

(2) 성인 그룹 높이의 이산 계수:

유아그룹 높이의 이산계수:

유아그룹 높이의 이산계수가 성인그룹 높이의 이산계수보다 크기 때문에 유아그룹 높이의 이산도가 상대적으로 크다는 것을 알 수 있다.

4.12

(1) 평균과 표준편차 두 가지 측면에서 평가해야 한다. 다양한 방법의 이산도를 비교할 때 이산계수를 사용해야 합니다.

(2) 다음 표는 다양한 방법에 대한 주요 설명 통계를 제공합니다.

방법 a 방법 b 방법 C

평균 165.6

중앙값 165

대중 수 164

표준 편차 2.13

극차 8

최소값 162

최대 170 평균 128.73

중앙값 129

대중 수 128

표준 편차 1.75

극차 7

최소값 125

최대 132 평균 125.53

중앙값 126

대중 수 126

표준 편차 2.77

극차 12

최소값 116

최대 128

세 가지 방법의 집중 추세로 볼 때, 방법 A 의 평균 생산량이 가장 높고, 중앙과 중수도 모두 다른 두 가지 방법보다 높다. 분산의 관점에서 볼 때, 세 가지 방법의 이산계수는 각각,, 입니다. 방법 A 의 이산도가 가장 작기 때문에 방법 A 를 선택해야 합니다.

4.13

(1) 분산 또는 표준 편차로 투자의 위험을 평가한다.

(2) 히스토그램에서 볼 수 있듯이 상업주식수익률의 이산도가 낮기 때문에 투자위험도 적다는 것을 알 수 있다.

(3) 투자 위험 관점에서 위험이 적은 상업주식을 선택해야 한다. 물론 어떤 주식을 선택하느냐는 투자자의 주관적인 판단과도 큰 관련이 있다.

제 5 장 연습 문제 답변

5.1 (1) 평균 점수는 0 에서 100 사이의 연속 변수이며 ω =

(2) 이미 만난 청신호 수는 0 부터 시작하는 자연수, ω = n

(3) 이전에 생산된 제품 중 무결점일 수도 있고 무결점일 수도 있다. ω = [10,11,12,13 ...]

5.2 설정 일간지의 집합은 A, 석간신문의 집합은 B, 적어도 한 가지 신문의 집합은 A∩B, 동시에 두 가지 신문의 집합은 A ∩ B 입니다.

P (a ∩ b) = p (a)+p (b)-p (a ∩ b) = 0.5+0.65-0.85 = 0.3

5.3p (a ∩b) = 1/3, P(A∩ )=1/9, p (b) = p (a ∩ b)-p (a ∩))

5.4p (ab) = p (b) p (a √b) = 1/3 * 1/6 = 1/18

P (≈) = p () = 1-p (ab) = 17/18

P( )=1- P(B)=2/3

P () = p ()+p ()-p (∩) = 7/18

P (√) = p ()/p () = 7/12

5.5 갑옷 발아는 사건 A, 을발아는 사건 B 입니다.

(1) 두 개의 씨앗이기 때문에 두 이벤트는 서로 독립적이므로 P(AB)= P(B)P(B)=0.56

입니다

(2) p (a ∩b) = p (a)+p (b)-p (a ∩ b) = 0.94

(3) p (a)+p (b) = p (a) p ()+p (b) p () = 0.38

5.6 합격은 사건 a 로, 합격품 중 1 급품은 사건 B

P (ab) = p (a) p (b √a) = 0.96 * 0.75 = 0.72

5.7 설정 전 5,000 시간은 이벤트 A 로 나쁘지 않고, 이후 5,000 시간은 이벤트 B 로 나쁘지 않습니다.

P(A)=1/3, P(AB)=1/2, p (b √a) = p (ab)/p (a) = 2/3

5.8 직공 문화도 초등학교를 사건 A 로, 직공 문화도 중학교는 사건 B, 직공 문화도 고등학교는 사건 C, 직공 나이 25 세 이하는 사건 D 로 설정한다.

P(A)=0.1 P(B)=0.5, P(C)=0.4

P (d √a) = 0.2, p (d √b) = 0.5, p (d √c) = 0.7

P (a √d) =

같은 p (b √d) = 5/11, p (c √d) = 28/55

5.9 결함은 d 로 설정되고 베이지안 공식은 다음과 같습니다:

P (a √d) = = 0.249

같은 p (b √d) = 0.112

5.10 은 이항 분산에서 사용할 수 있습니다. P(x=0)=0.25, P(x=1)=0.5, P(x=2)=0.25

5.11 (1) P(x=100)=0.001, P(x=10)=0.01, P(x=1)=0.2, p (x = 0)

(2) e (x) = 100 * 0.001+10 * 0.01+1 * 0.2 = 0.4

5.13 정답은 적어도 네 가지 질문에 두 가지 상황, 네 가지 잘못된 것, 다섯 가지를 포함한다.

C54 C65 =1/64

5.14 포아송 분포의 특성은 다음과 같다:

P(X=1)=, P(X=2)=, 사용 가능 =2

P(X=4)=2/3e

5.15

따라서 P(x=k) 는 k= -1 및 k= 일 때 가장 큽니다.

5.16 (1) p (> 2) = p (x > 2)+p (x <-2) = (0.5)+1-(2.5) = 0.6977 N (3,4) 이 평균 3 대칭이기 때문에 p (x > 3) = 0.5

5.17p (120 < x < 200) = p (

5.18 (1)

(2)

제 7 장 연습 문제 참조 답변

7.1 (1) 알려진 =5, n=40, =25, =0.05, =1.96

샘플 평균에 대한 샘플 표준 편차 = =

(2) 추정 오차 (한계 오차라고도 함) E= =1.96*0.79=1.55

7.2(1) 알려진 =15, n=49, =120, =0.05, =1.96

(2) 샘플 평균의 샘플 표준 편차 = = 2.14

추정 오차 E= =1.96* 4.2

(3) 전체 표준 편차가 알려져 있기 때문에 전체 평균의 95 신뢰 구간은

입니다

=120 1.96*2.14=120 4.2, 즉 (115.8,124.2)

7.3(1) 알려진 =85414, n=100, =104560, =0.05, =1.96

전체 표준 편차가 알려져 있기 때문에 전체 평균의 95 신뢰 구간은

입니다

=104560 1.96* 104560 16741.144 (87818.856, 121301.144)

7.4(1) 알려진 n=100, =81, s=12, =0.1, =1.645

N=100 이 큰 샘플이기 때문에 전체 평균의 90 신뢰 구간은

입니다

=81 1.645* 81 1.974, 즉 (79.026,82.974)

(2) 알려진 =0.05, =1.96

N=100 이 큰 샘플이기 때문에 전체 평균의 95 신뢰 구간은

입니다

=81 1.96* 81 2.352, 즉 (78.648,83.352)

(3) 알려진 =0.01, =2.58

N=100 이 큰 샘플이기 때문에 전체 평균의 99 신뢰 구간은

입니다

=81 2.58* 81 3.096, 즉 (77.94,84.096)

7.5(1) 알려진 =3.5, n=60, =25, =0.05, =1.96

전체 표준 편차가 알려져 있기 때문에 전체 평균의 95 신뢰 구간은

입니다

=25 1.96* 25 0.89, 즉 (24.11,25.89)

(2) 알려진 n=75, =119.6, s=23.89, =0.02, =2.33

N=75 가 큰 샘플이기 때문에 전체 평균의 98 신뢰 구간은

입니다

=119.6 2.33* 119.6 6.43, 즉 (113.17,126.03)

(3) 알려진 =3.419, s=0.974, n=32, =0.1, =1.645

N=32 이므로

큰 샘플이기 때문에 전체 평균의 90 신뢰 구간은

입니다

=3.419 1.645* 3.419 0.283, 즉 (3.136, 3.702)

7.6(1) 알려진: 전체 준수 정규 분포, =500, n=15, =8900, =0.05, =1.96

전반적으로 정규 분포에 따르므로 전체 평균의 95 신뢰 구간은

입니다

=8900 1.96* 8900 253.03, 즉 (8646.97,9153.03)

(2) 알려진: 전체 불복종 정규 분포, =500, n=35, =8900, =0.05, =1.96

전반적으로 정규 분포에 복종하지는 않지만 n=35 가 큰 샘플이기 때문에 전체 평균의 95 신뢰 구간은

입니다

=8900 1.96* 8900 165.65, 즉 (8734.35,9065.65)

(3) 알려진: 전체 불복종 정규 분포, 알 수 없음, n=35, =8900, s=500, =0.1, =1.645

전반적으로 정규 분포에 복종하지는 않지만 n=35 가 큰 샘플이기 때문에 전체 평균의 90 신뢰 구간은

입니다

=8900 1.645* 8900 139.03, 즉 (8760.97,9039.03)

(4) 알려진: 전체 불복종 정규 분포, 알 수 없음, n=35, =8900, s=500, =0.01, =2.58

전반적으로 정규 분포에 복종하지는 않지만 n=35 가 큰 샘플이기 때문에 전체 평균의 99 신뢰 구간은

입니다

=8900 2.58* 8900 218.05, 즉 (8681.95,9118.05)

7.7 알려진: n=36, = 0.1,0.05,0.01 인 경우 해당 =1.645, =1.96, =2.58

샘플 데이터를 기준으로 계산됩니다. =3.32, s=1.61

N=36 이 큰 샘플이기 때문에 평균 인터넷 시간의 90 신뢰 구간은

입니다

=3.32 1.645* 3.32 0.44, 즉 (2.88,3.76)

평균 인터넷 시간의 95 신뢰 구간은

입니다

=3.32 1.96* 3.32 0.53, 즉 (2.79,3.85)

평균 인터넷 시간의 99 신뢰 구간은

입니다

=3.32 2.58* 3.32 0.69, 즉 (2.63,4.01)

7.8 알려진: 전체 준수 정규 분포, 알 수 없음, n=8 은 작은 샘플, =0.05, =2.365

샘플 데이터를 기준으로 계산됩니다. =10, s=3.46

전체 평균의 95 신뢰 구간은

입니다

=10 2.365* 10 2.89, 즉 (7.11,12.89)

7.9 알려진: 전체 준수 정규 분포, 알 수 없음, n=16 은 작은 샘플, =0.05, =2.131

샘플 데이터를 기준으로 계산됩니다. =9.375, s=4.113

집에서 단위 평균 거리까지의 95 신뢰 구간은

입니다

=9.375 2.131* 9.375 2.191 또는 (7

. 18,11.57)

7.10 (1) 알려진: n=36, =149.5, =0.05, =1.96

N=36 은 큰 샘플이기 때문에 평균 부품 길이의 95 신뢰 구간은

입니다

=149.5 1.96* 149.5 0.63, 즉 (148.87,150.13)

(2) 위의 추정에서 통계의 중심 극한 정리가 사용되었다. 이 정리는 평균이, 분산이 인 전체에서 용량이 N 인 임의 샘플을 추출했고, N 이 충분히 클 때 (일반적으로 요구됨) 샘플 평균의 샘플 분포는 평균에 근접하고 분산이 인 정규 분포를 따른다는 것을 보여준다.

7.12 (1) 알려진: 전체 준수 정규 분포, 알 수 없음, n=25 는 작은 샘플, =0.01, =2.797

샘플 데이터를 기준으로 계산됩니다. =16.128, s=0.871

전체 평균의 99 신뢰 구간은

입니다

=16.128 2.797* 16.128 0.487, 즉 (15.64,16.62)

7.13 알려진: 전체 준수 정규 분포, 알 수 없음, n=18 은 작은 샘플, =0.1, =1.74

샘플 데이터를 기준으로 계산됩니다. =13.56, s=7.8

인터넷 회사 직원들이 매주 평균 초과근무를 하는 90 의 신뢰 구간은

입니다

=13.56 1.74* 13.56 3.2, 즉 (10.36,16.76)

7.14 (1) 알려진: n=44, p=0.51, =0.01, =2.58

전체 비율의 99 신뢰 구간은

입니다

=0.51 2.58 =0.51 0.19, 즉 (0.32,0.7)

(2) 알려진: n=300, p=0.82, =0.05, =1.96

전체 비율의 95 신뢰 구간은

입니다

=0.82 1.96 =0.82 0.04, 즉 (0.78,0.86)

(3) 알려진: n=1150, p=0.48, =0.1, =1.645

전체 비율의 90 신뢰 구간은

입니다

=0.48 1.645 =0.48 0.02, 즉 (0.46,0.5)

7.15 알려진 사항: n=200, p=0.23, 0.1 및 0.05 인 경우 해당 =1.645, =1.96

전체 비율의 90 신뢰 구간은

입니다