기본 콘텐츠로 건너뛰기

GNOME Display Manager 49 (gdm-49)

원문 보기:  https://dawoum.duckdns.org/wiki/GNOME_Display_Manager   그놈 버전 49가 출시되면서, GDM-49가 같이 출시되었습니다.  몇 가지 문제에 부딪힐 수 있습니다. 버전 49.0.1을 설치 후에, 부팅 자체가 완료되지 않고 다른 tty로 접근도 되지 않습니다. 리커버리로 부팅 후에, lightdm으로는 부팅이 됩니다. 이와 관련된 버그는 다음에서 볼 수 있습니다: https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/2121017 결론적으로, 오래 전에 설치된 시스템에서 /etc/nsswitch.conf 파일에서 문제가 발생합니다.  따라서, shadow:         files systemd와 같이 수정해서 GDM 로긴 화면을 만날 수 있습니다.  다른 문제는 Xsession이 목록화되지만, 해당 세션으로 접근되지 않는다는 것입니다. 게다가, Xsession으로 접근 후에, GDM이 오동작해서 다른 Wayland 세션으로 로그인할 수도 없습니다. 이때, 다른 tty로 접근해서 GDM을 재시작하면 제대로 동작합니다. 만약 Xsession으로 로그인하고 싶을 때에는 lightdm과 같은 다른 로긴 관리기를 사용해야 합니다.    덧, 만약 GDM에서 Xsession으로 정상적으로 로긴하기 위해, GDM 패키지를 다시 컴파일해야 합니다.  데비안 패키지에서 GDM-49.0.1 파일을 받아서 debian/rules 파일에서 -Dgdm-xsession=true 구성 옵션을 추가해야 합니다.     

모평균의 추정

원문 보기: https://dawoum.duckdns.org/wiki/모평균의_추정

이제, 다시 원래 주제로 돌아와서, 대학 수학능력 시험의 채점이 끝나기 전에 학생들의 가채점 점수로 올해 수능의 평균을 예상해 볼 것입니다. 물론, 예상은 누구나 할 수 있지만, 과연 예상된 평균은 얼마나 믿을 수 있을까요?

예를 들어, 완전히 신뢰할 수 있도록 다음과 같이 예상할 수 있습니다.

"이번 시험의 평균은 0점에서 100점 사이의 값일 것입니다."

하지만, 이런 종류의 말은 언제나 참이기 때문에, 예상했다와는 거리가 있습니다.

이것을 거꾸로 생각하면, 언제나 참이 되는 예상외에는 틀릴 가능성이 항상 포함된다는 것을 의미합니다.

게다가, 연속확률변수에서, 평균의 예상을 한 점수로 예상하지는 않습니다. 왜냐하면, 평균이 75점과 같이 자연수로 될 가능성이 매우 낮은데, 실수는 대부분 무리수로 이루어져 있기 때문입니다.

따라서, 예상이 맞을 가능성이 있으려면, 대부분의 경우에서, 예상되는 값이 속할 구간으로 표현하는 것이 바람직합니다.

예를 들어, "올해의 평균 점수는 71점에서 73점 사이일 것입니다"와 같이 예상하는 것이 일반적입니다.

앞에서 사용한 용어는 모집단의 평균이 포함될 예상되는 구간을 참이 될 가능성이 있는 구간으로 신뢰구간이라고 합니다. 그리고, 그 구간 안에 모집단의 평균이 속할 가능성을 신뢰도라고 합니다.

그리고 표본화에서 언급한 것처럼, 표본을 임의추출하지 않고, 의도적으로 뽑은 것에 의한 신뢰구간과 신뢰도는 믿기 곤란합니다.

이제 보다 구체적으로, 표본으로부터 모집단의 평균을 예상할 때, 실제로 사회에서 자주 사용하는 숫자를 통해 알아보겠습니다.

모집단의 분포 \(X\)가 정규분포 \(N\left(m,\sigma^2\right)\)을 따른다고 알려져 있고, 이 모집단에서 크기가 \(n\)인 표본을 임의로 추출했을 때, 표본평균 \(\overline{X}\)는 정규분포 \(N\left(m,\frac{\sigma^2}{n}\right)\)을 따른다고 알려져 있습니다.

보통 어떤 조사(예상)가 이루어지면, 우리의 조사가 신뢰도 \(95 \%\)를 가진다는 것은 어떤 의미일까요?

이것은 다른 말로, 예상이 맞을 확률이 \(95 \%\)라는 의미이므로, 표준정규분포에서 그의 넓이가 \(0.95\)가 되어야 함을 의미합니다.

이때, 넓이는, 가능한 예상이 맞아야 하므로, 평균을 주변으로 넓이가 잡혀야 하는데, 즉, 표준정규분포는 0을 중심으로 좌우대칭이므로, 다음의 위치에 놓이게 됩니다. 

\(\quad\)\(P(0 \le Z \le z) = 0.475\)

이 값을 표준정규분포표에서 찾으면, \(z=1.96\)입니다.

지금, 우리가 구한 평균은 표본평균 \(\overline{x}\)으로부터, 표준화한 변수 \(z\)의 값이 \(1.96\)이므로 다음과 같이 표준화한 것입니다:

\(\quad\)\(\displaystyle \frac{\overline{x}-m}{\frac{\sigma}{\sqrt{n}}}=1.96\)

그러므로, 모집단의 평균의 예상의 한쪽 끝점은 다음과 같습니다.

\(\quad\)\(\displaystyle m=\overline{x}-1.96\frac{\sigma}{\sqrt{n}}\)

물론, 다른 끝점은 그의 대칭성으로 \(z=-1.96\)이므로,

\(\quad\)\(\displaystyle m=\overline{x}+1.96\frac{\sigma}{\sqrt{n}}\)

따라서, 신뢰도 \(95 \%\)를 가지는 예상되는 모집단의 평균의 구간은 다음과 같이 쓸 수 있습니다.

\(\quad\)\(\displaystyle \overline{x}-1.96\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+1.96\frac{\sigma}{\sqrt{n}}\)

만약, 신뢰도를 \(99 \%\)로 높이면,

\(\quad\)\(P(0 \le Z \le z) = 0.495\)

의 값을 가져야 하므로, 표준정규분포표에서 \(z=2.58\)입니다.

따라서, 신뢰도 \(99 \%\)를 가지는 예상되는 모집단의 평균의 구간은 다음과 같이 쓸 수 있습니다.

\(\quad\)\(\overline{x}-2.58\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+2.58\frac{\sigma}{\sqrt{n}}\)

이를 일반화하면,

모집단의 분포 \(X\)가 정규분포 \(N\left(m, \sigma^2 \right)\)을 따른다고 알려져 있고, 이 모집단에서 크기가 \(n\)인 표본을 임의로 추출했을 때, 표본평균 \(\overline{X}\)의 값이 \(\overline{x}\)이고, 신뢰도 \(\alpha \% \)인 모평균의 신뢰구간은

  • 표준정규분포표에서, \(\displaystyle P(0 \le Z \le k) = \frac{\alpha}{100}\times \frac{1}{2}\)를 만족하는
  • 양의 실수 \(z=k\)에 대해, \(\displaystyle \overline{x}-k\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+k\frac{\sigma}{\sqrt{n}}\)

앞에서 언급한 것처럼, 같은 크기의 표본에서,

  • 신뢰도를 높이면, 즉, 맞을 가능성을 높이면 : 신뢰구간(평균이 놓일 구간)을 커져서, 양의 실수 \(k\)가 커집니다. 다르게 표현하면, (위에서 10점에서 90점 사이처럼) 평균이 놓일 구간이 커져서, 잘 맞기는 하지만 쓸모는 없어집니다.
  • 신뢰도를 낮추면, 즉, 맞을 가능성을 낮추면 : 신뢰구간이 작아져서, 양의 실수 \(k\)가 작아집니다. 다르게 표현하면, (71.2에서 71.3까지처럼) 신뢰구간이 작아져서 그렇듯해 보이지만, 적중률은 상당히 떨어져서 쓸모가 없습니다.

따라서, 신뢰도 \(95 \%, 99 \%\)를 많이 이용합니다.

예를 들어 신뢰도 \(70 \%\)는, 표준정규분포표에서, 확률 \(0.35\)에 해당하는 값 \(z=1.04\)를 찾아서, 다음과 같이 신뢰구간을 쓸 수 있습니다.

\(\quad\)\(\displaystyle \overline{x}-1.04\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+1.04\frac{\sigma}{\sqrt{n}}\)

한편, 모집단의 분포가 알려져 있지 않으면, 모표준편차 \(\sigma\)를 알 수 없으므로, 어쨌든, 표본의 크기가 충분히 크면, 표본 집단의 표본표준편차 \(s\)는 모표준편차 \(\sigma\)와 거의 같아지므로, \(\sigma\) 대신에 \(s\) 값을 사용해서 신뢰구간을 추정합니다.

신뢰구간의 길이

모평균의 추정

\(\quad\)\(\displaystyle \overline{x}-k\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+k\frac{\sigma}{\sqrt{n}}\)

으로부터, 신뢰구간의 길이 \(l\)는 다음과 같이 구해집니다.

\(\quad\)\(\displaystyle l=2k\frac{\sigma}{\sqrt{n}}\)

여기서는 \(k\)는 신뢰도에 따라 구해지는데,

  • 신뢰도 \(95 \%\)일 때, \(k=1.96\)입니다.
  • 신뢰도 \(99 \%\)일 때, \(k=2.58\)입니다.

이 상수값은 외울 필요가 없는데, 왜냐하면 시험에서는 표준정규분포표를 제공하던지, 해당되는 넓이(확률)를 표현하는 식을 반드시 제공하기 때문입니다.

 

 

댓글

이 블로그의 인기 게시물

리눅스 한글 입력기 (Wayland 편)

원문 보기: https://dawoum.duckdns.org/wiki/한글 입력기/On_Wayland 최근 소프트웨어들의 버전 업그레이드로 인해, X11에서도 님프 입력기에서 문제들이 발생하고 있습니다. 따라서 이제는 X11이든, Wayland이든 kime을 사용하는 것이 바람직해 보입니다!! 리눅스 생태계에서 X11에서 Wayland로의 전환은 여러 가지 새로운 장점과 단점을 만들어 냅니다. 일반 사용자들은 이런 전환이 가진 장점에 열광하기도 하지만 기존에 작동하는 메커니즘이 작동하지 않을 때 더욱 불만을 표출합니다. 리눅스에서 가장 큰 문제점은 한글 입력에 있습니다. 그러나, 이 문제는 거의 한국 사람들에 국한된 문제입니다. 물론, 중국과 일본도 비슷한 처지에 있어서 CJK로 묶어서 얘기가 되지만, 한글은 다른 두 언어에 비해 더 고려할 사항이 있어서 한글 입력기 개발에 어려움이 더해진다고 알려져 있습니다. 이런 상황 아래에서, kime과 nimf는 최근에 한국에서 개발된 두 개의 한글 입력기입니다. 먼저, 개인적인 경험을 기반으로 결론부터 얘기하자면, X11에서는 nimf를 추천합니다. Wayland에서는 kime을 추천합니다. 이유는 간단하게도, X11에서는 nimf가 더 많은 프로그램에서 올바르게 동작했지만, Wayland에서는 X11에서 잘 입력되던 프로그램에서 입력이 되지 않거나 잘못 입력되는 경우가 발생합니다. 반면에 kime은 Wayland에서 nimf가 입력하지 못하는 프로그램에서 입력이 되거나 잘못 입력되던 것이 제대로 입력되는 경우가 있기 때문입니다. 예를 들어, 그놈 Wayland에서 적어도 아래의 현상이 있습니다: gnome-calendar : nimf 입력기 전환 안됨. kime 정상 작동. nimf 이 문제는 gooroom에서 제공되는 gtk4 패치를 이용해 보십시오. kakaotalk (bottles: wine) : nimf 마지막 점을 찍으면 마지막 글자 앞에 찍힘. kime 정상 작동. alac...

Btrfs 압축 수준 설정

원문 보기:  https://dawoum.duckdns.org/wiki/Btrfs 보통, 마운트 옵션에서 compress=zstd를 사용할 경우에 압축 레벨 3를 사용하고, HDD와 느린 플래시 스토리지에 적합하다고 알려져 있습니다. 좀 더 빠른 SATA SSD는 압축 레벨 2가 적당하고, NVME는 압축 레벨 1이 적당하다고 합니다: Yup, this is it. On slow storage higher compression levels tend to yield higher total storage throughput because you spend less time bound by slow storage bandwidth, instead you spend CPU time compressing/decompressing that data. The rick is to pick a compression level that yields greater total throughput than storage bandwidth can accommodate on its own. This approach works well on bandwidth limited storage like HDD pools, slow flash nand, flash nand attached to the system via slow USB, etc. On the flip side you don't want to constrain high bandwidth storage by sending data through a compression algorithm that limits throughput so lower compression levels (like zstd:1 on nvme storage, or zstd:2 on fast SATA SSDs) are usually safe choices. —  seaQueue, Btrfs compress level, https://...

Installing hoffice 2022 beta on Debian

원문 보기:  https://dawoum.duckdns.org/wiki/Installing_hoffice_2022_beta_on_Debian 구름 OS 2.0에서 배포되었던 1520 버전은 hwp에서 일부 버그가 있는 것으로 보입니다. 예를 들어, 한글 입력 상태에서 키를 누르고 있으면, 입력이 되지 않다가 키를 풀면 한꺼번에 입력이 됩니다. 반면에, 한글 2020 베타 버전은 이런 현상이 없습니다. 게다가, 구름 OS 3.0이 출시되면서 해당 패키지는 누락되었고, 이전 저장소에서 더 이상 다운로드되지 않는 것으로 보입니다. 또한, 윈도우 버전에 비해 기능 자체가 많지 않아서 편집기로는 크게 쓸모가 없다는 주장이 있지만, 뷰어로서 기능은 가능한 것으로 보입니다. 보통 데비안에서 문서를 만들 때, 여러가지 좋은 도구들이 있습니다. 가장 좋은 가독성을 보이는 것은 LaTeX이겠지만, 프로그램을 설치하고 문서를 만드는 것이 쉽지 않습니다. 어쨌든, 한글과 컴퓨터에서 만든 hwp는 여러 부분에서 쓰이는 경우가 있습니다. 예를 들어, 다른 사람이 만들어 놓은 hwp 파일을 보기 위해서는 hwpviewer 또는 온라인에서 hwp2pdf 등으로 다른 문서로 바꾸어서 볼 수는 있습니다. 그러나, 편집을 하기 위해서는 전용 프로그램이 필요합니다. 물론, 가상 기계 아래에서 윈도우 시스템을 설치하고, 윈도우용 hwp를 설치해서 이 작업을 수행할 수 있습니다. 어쨌든, 가능하다면, 리눅스에서 직접 hwp를 편집하기를 희망할 것입니다. 한글과 컴퓨터에서 구름 OS 를 만들면서, 번들로 제공하는 리눅스용 한컴오피스 2022 베타는 이런 목적으로 설치해서 사용해 볼 필요가 있습니다. Download 2020 beta version 위에서 언급했듯이, 어떤 이유에서든지 서버에서 제거되었기 때문에, 개인적으로 미리 다운로드 받지 않는 분들은 해당 버전을 이용할 수 없습니다. 다행히, 버그가 적을 것으로 기대되는 이전 버전은 여전히 공식 서버에 제공되고 있고, 아...