기본 콘텐츠로 건너뛰기

GNOME Display Manager 49 (gdm-49)

원문 보기:  https://dawoum.duckdns.org/wiki/GNOME_Display_Manager   그놈 버전 49가 출시되면서, GDM-49가 같이 출시되었습니다.  몇 가지 문제에 부딪힐 수 있습니다. 버전 49.0.1을 설치 후에, 부팅 자체가 완료되지 않고 다른 tty로 접근도 되지 않습니다. 리커버리로 부팅 후에, lightdm으로는 부팅이 됩니다. 이와 관련된 버그는 다음에서 볼 수 있습니다: https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/2121017 결론적으로, 오래 전에 설치된 시스템에서 /etc/nsswitch.conf 파일에서 문제가 발생합니다.  따라서, shadow:         files systemd와 같이 수정해서 GDM 로긴 화면을 만날 수 있습니다.  다른 문제는 Xsession이 목록화되지만, 해당 세션으로 접근되지 않는다는 것입니다. 게다가, Xsession으로 접근 후에, GDM이 오동작해서 다른 Wayland 세션으로 로그인할 수도 없습니다. 이때, 다른 tty로 접근해서 GDM을 재시작하면 제대로 동작합니다. 만약 Xsession으로 로그인하고 싶을 때에는 lightdm과 같은 다른 로긴 관리기를 사용해야 합니다.    덧, 만약 GDM에서 Xsession으로 정상적으로 로긴하기 위해, GDM 패키지를 다시 컴파일해야 합니다.  데비안 패키지에서 GDM-49.0.1 파일을 받아서 debian/rules 파일에서 -Dgdm-xsession=true 구성 옵션을 추가해야 합니다.     

모평균의 추정

원문 보기: https://dawoum.duckdns.org/wiki/모평균의_추정

이제, 다시 원래 주제로 돌아와서, 대학 수학능력 시험의 채점이 끝나기 전에 학생들의 가채점 점수로 올해 수능의 평균을 예상해 볼 것입니다. 물론, 예상은 누구나 할 수 있지만, 과연 예상된 평균은 얼마나 믿을 수 있을까요?

예를 들어, 완전히 신뢰할 수 있도록 다음과 같이 예상할 수 있습니다.

"이번 시험의 평균은 0점에서 100점 사이의 값일 것입니다."

하지만, 이런 종류의 말은 언제나 참이기 때문에, 예상했다와는 거리가 있습니다.

이것을 거꾸로 생각하면, 언제나 참이 되는 예상외에는 틀릴 가능성이 항상 포함된다는 것을 의미합니다.

게다가, 연속확률변수에서, 평균의 예상을 한 점수로 예상하지는 않습니다. 왜냐하면, 평균이 75점과 같이 자연수로 될 가능성이 매우 낮은데, 실수는 대부분 무리수로 이루어져 있기 때문입니다.

따라서, 예상이 맞을 가능성이 있으려면, 대부분의 경우에서, 예상되는 값이 속할 구간으로 표현하는 것이 바람직합니다.

예를 들어, "올해의 평균 점수는 71점에서 73점 사이일 것입니다"와 같이 예상하는 것이 일반적입니다.

앞에서 사용한 용어는 모집단의 평균이 포함될 예상되는 구간을 참이 될 가능성이 있는 구간으로 신뢰구간이라고 합니다. 그리고, 그 구간 안에 모집단의 평균이 속할 가능성을 신뢰도라고 합니다.

그리고 표본화에서 언급한 것처럼, 표본을 임의추출하지 않고, 의도적으로 뽑은 것에 의한 신뢰구간과 신뢰도는 믿기 곤란합니다.

이제 보다 구체적으로, 표본으로부터 모집단의 평균을 예상할 때, 실제로 사회에서 자주 사용하는 숫자를 통해 알아보겠습니다.

모집단의 분포 \(X\)가 정규분포 \(N\left(m,\sigma^2\right)\)을 따른다고 알려져 있고, 이 모집단에서 크기가 \(n\)인 표본을 임의로 추출했을 때, 표본평균 \(\overline{X}\)는 정규분포 \(N\left(m,\frac{\sigma^2}{n}\right)\)을 따른다고 알려져 있습니다.

보통 어떤 조사(예상)가 이루어지면, 우리의 조사가 신뢰도 \(95 \%\)를 가진다는 것은 어떤 의미일까요?

이것은 다른 말로, 예상이 맞을 확률이 \(95 \%\)라는 의미이므로, 표준정규분포에서 그의 넓이가 \(0.95\)가 되어야 함을 의미합니다.

이때, 넓이는, 가능한 예상이 맞아야 하므로, 평균을 주변으로 넓이가 잡혀야 하는데, 즉, 표준정규분포는 0을 중심으로 좌우대칭이므로, 다음의 위치에 놓이게 됩니다. 

\(\quad\)\(P(0 \le Z \le z) = 0.475\)

이 값을 표준정규분포표에서 찾으면, \(z=1.96\)입니다.

지금, 우리가 구한 평균은 표본평균 \(\overline{x}\)으로부터, 표준화한 변수 \(z\)의 값이 \(1.96\)이므로 다음과 같이 표준화한 것입니다:

\(\quad\)\(\displaystyle \frac{\overline{x}-m}{\frac{\sigma}{\sqrt{n}}}=1.96\)

그러므로, 모집단의 평균의 예상의 한쪽 끝점은 다음과 같습니다.

\(\quad\)\(\displaystyle m=\overline{x}-1.96\frac{\sigma}{\sqrt{n}}\)

물론, 다른 끝점은 그의 대칭성으로 \(z=-1.96\)이므로,

\(\quad\)\(\displaystyle m=\overline{x}+1.96\frac{\sigma}{\sqrt{n}}\)

따라서, 신뢰도 \(95 \%\)를 가지는 예상되는 모집단의 평균의 구간은 다음과 같이 쓸 수 있습니다.

\(\quad\)\(\displaystyle \overline{x}-1.96\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+1.96\frac{\sigma}{\sqrt{n}}\)

만약, 신뢰도를 \(99 \%\)로 높이면,

\(\quad\)\(P(0 \le Z \le z) = 0.495\)

의 값을 가져야 하므로, 표준정규분포표에서 \(z=2.58\)입니다.

따라서, 신뢰도 \(99 \%\)를 가지는 예상되는 모집단의 평균의 구간은 다음과 같이 쓸 수 있습니다.

\(\quad\)\(\overline{x}-2.58\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+2.58\frac{\sigma}{\sqrt{n}}\)

이를 일반화하면,

모집단의 분포 \(X\)가 정규분포 \(N\left(m, \sigma^2 \right)\)을 따른다고 알려져 있고, 이 모집단에서 크기가 \(n\)인 표본을 임의로 추출했을 때, 표본평균 \(\overline{X}\)의 값이 \(\overline{x}\)이고, 신뢰도 \(\alpha \% \)인 모평균의 신뢰구간은

  • 표준정규분포표에서, \(\displaystyle P(0 \le Z \le k) = \frac{\alpha}{100}\times \frac{1}{2}\)를 만족하는
  • 양의 실수 \(z=k\)에 대해, \(\displaystyle \overline{x}-k\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+k\frac{\sigma}{\sqrt{n}}\)

앞에서 언급한 것처럼, 같은 크기의 표본에서,

  • 신뢰도를 높이면, 즉, 맞을 가능성을 높이면 : 신뢰구간(평균이 놓일 구간)을 커져서, 양의 실수 \(k\)가 커집니다. 다르게 표현하면, (위에서 10점에서 90점 사이처럼) 평균이 놓일 구간이 커져서, 잘 맞기는 하지만 쓸모는 없어집니다.
  • 신뢰도를 낮추면, 즉, 맞을 가능성을 낮추면 : 신뢰구간이 작아져서, 양의 실수 \(k\)가 작아집니다. 다르게 표현하면, (71.2에서 71.3까지처럼) 신뢰구간이 작아져서 그렇듯해 보이지만, 적중률은 상당히 떨어져서 쓸모가 없습니다.

따라서, 신뢰도 \(95 \%, 99 \%\)를 많이 이용합니다.

예를 들어 신뢰도 \(70 \%\)는, 표준정규분포표에서, 확률 \(0.35\)에 해당하는 값 \(z=1.04\)를 찾아서, 다음과 같이 신뢰구간을 쓸 수 있습니다.

\(\quad\)\(\displaystyle \overline{x}-1.04\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+1.04\frac{\sigma}{\sqrt{n}}\)

한편, 모집단의 분포가 알려져 있지 않으면, 모표준편차 \(\sigma\)를 알 수 없으므로, 어쨌든, 표본의 크기가 충분히 크면, 표본 집단의 표본표준편차 \(s\)는 모표준편차 \(\sigma\)와 거의 같아지므로, \(\sigma\) 대신에 \(s\) 값을 사용해서 신뢰구간을 추정합니다.

신뢰구간의 길이

모평균의 추정

\(\quad\)\(\displaystyle \overline{x}-k\frac{\sigma}{\sqrt{n}} \le m \le \overline{x}+k\frac{\sigma}{\sqrt{n}}\)

으로부터, 신뢰구간의 길이 \(l\)는 다음과 같이 구해집니다.

\(\quad\)\(\displaystyle l=2k\frac{\sigma}{\sqrt{n}}\)

여기서는 \(k\)는 신뢰도에 따라 구해지는데,

  • 신뢰도 \(95 \%\)일 때, \(k=1.96\)입니다.
  • 신뢰도 \(99 \%\)일 때, \(k=2.58\)입니다.

이 상수값은 외울 필요가 없는데, 왜냐하면 시험에서는 표준정규분포표를 제공하던지, 해당되는 넓이(확률)를 표현하는 식을 반드시 제공하기 때문입니다.

 

 

댓글

이 블로그의 인기 게시물

리눅스 한글 입력기 (Wayland 편)

원문 보기: https://dawoum.duckdns.org/wiki/한글 입력기/On_Wayland 최근 소프트웨어들의 버전 업그레이드로 인해, X11에서도 님프 입력기에서 문제들이 발생하고 있습니다. 따라서 이제는 X11이든, Wayland이든 kime을 사용하는 것이 바람직해 보입니다!! 리눅스 생태계에서 X11에서 Wayland로의 전환은 여러 가지 새로운 장점과 단점을 만들어 냅니다. 일반 사용자들은 이런 전환이 가진 장점에 열광하기도 하지만 기존에 작동하는 메커니즘이 작동하지 않을 때 더욱 불만을 표출합니다. 리눅스에서 가장 큰 문제점은 한글 입력에 있습니다. 그러나, 이 문제는 거의 한국 사람들에 국한된 문제입니다. 물론, 중국과 일본도 비슷한 처지에 있어서 CJK로 묶어서 얘기가 되지만, 한글은 다른 두 언어에 비해 더 고려할 사항이 있어서 한글 입력기 개발에 어려움이 더해진다고 알려져 있습니다. 이런 상황 아래에서, kime과 nimf는 최근에 한국에서 개발된 두 개의 한글 입력기입니다. 먼저, 개인적인 경험을 기반으로 결론부터 얘기하자면, X11에서는 nimf를 추천합니다. Wayland에서는 kime을 추천합니다. 이유는 간단하게도, X11에서는 nimf가 더 많은 프로그램에서 올바르게 동작했지만, Wayland에서는 X11에서 잘 입력되던 프로그램에서 입력이 되지 않거나 잘못 입력되는 경우가 발생합니다. 반면에 kime은 Wayland에서 nimf가 입력하지 못하는 프로그램에서 입력이 되거나 잘못 입력되던 것이 제대로 입력되는 경우가 있기 때문입니다. 예를 들어, 그놈 Wayland에서 적어도 아래의 현상이 있습니다: gnome-calendar : nimf 입력기 전환 안됨. kime 정상 작동. nimf 이 문제는 gooroom에서 제공되는 gtk4 패치를 이용해 보십시오. kakaotalk (bottles: wine) : nimf 마지막 점을 찍으면 마지막 글자 앞에 찍힘. kime 정상 작동. alac...

Btrfs 압축 수준 설정

원문 보기:  https://dawoum.duckdns.org/wiki/Btrfs 보통, 마운트 옵션에서 compress=zstd를 사용할 경우에 압축 레벨 3를 사용하고, HDD와 느린 플래시 스토리지에 적합하다고 알려져 있습니다. 좀 더 빠른 SATA SSD는 압축 레벨 2가 적당하고, NVME는 압축 레벨 1이 적당하다고 합니다: Yup, this is it. On slow storage higher compression levels tend to yield higher total storage throughput because you spend less time bound by slow storage bandwidth, instead you spend CPU time compressing/decompressing that data. The rick is to pick a compression level that yields greater total throughput than storage bandwidth can accommodate on its own. This approach works well on bandwidth limited storage like HDD pools, slow flash nand, flash nand attached to the system via slow USB, etc. On the flip side you don't want to constrain high bandwidth storage by sending data through a compression algorithm that limits throughput so lower compression levels (like zstd:1 on nvme storage, or zstd:2 on fast SATA SSDs) are usually safe choices. —  seaQueue, Btrfs compress level, https://...

리눅스 한글 입력기

원문 보기:  https://dawoum.duckdns.org/wiki/한글_입력기 컴퓨터에서 한글을 입력하기 위해서 한글 입력기가 필요합니다. 리눅스 배포판마다 기본으로 설치되는 입력기가 있지만, 설치 후에 바로 한글 입력이 가능한 경우는 드뭅니다. 배포판의 설치 후에, 바로 한글 입력이 가능하려면, 적어도 언어를 한국어 ( Korean )로 선택해야 합니다. 그러나, 대부분의 배포판은 설치시에 한국어 ( Korean )를 선택하더라도 별도로 설정을 해야 한글 입력이 가능합니다. 게다가, 배포판이 기본으로 제공하는 데스크탑 환경에 따라 한글 입력기 설정이 다를 수 있습니다. 아래의 입력기는 사용 당시 일부 문제점이 발견되었고, 현재 문제가 남아 있는지 확인을 하지 않았습니다. 또한, snapd와 flatpak 아래에 설치된 프로그램들도 ibus에서 한글 입력이 입력될 가능성이 있고, 나머지에서는 지원이 되지 않는 것으로 알려져 있습니다. 다른 입력기에서 입력이 되는 것처럼 보이는 것은 ibus와 해당 입력기가 동시에 동작하고 있을 가능성이 있습니다. 한글 입력기 문제들 보고 장소 한글 입력기를 사용하면서, 만날 수 있는 문제는 아래에서 볼 수 있습니다: https://github.com/korean-input/issues 이미 보고된 내용 외에도 문제가 있는 분들은 같은 장소에 내용을 기록해 둘 필요가 있습니다. kime 한글 입력기(Korean ime)를 줄여서 만든 kime은 Rust로 작성되었습니다. 아래에서 소스를 볼 수 있습니다: https://github.com/Riey/kime 개별적인 설정을 수정 또는 추가하기 위해, 패키지에서 제공된 설정 파일을 사용자 설정으로 복사할 필요가 있습니다: mkdir -p ~/.config/kime cp /usr/share/doc/kime/default_config.yaml ~/.config/kime/config.yaml 예를 들어, 한/영 전환이 기본적으로 오른쪽 Alt 로 동작하는 ...