기본 콘텐츠로 건너뛰기

GNOME Display Manager 49 (gdm-49)

원문 보기:  https://dawoum.duckdns.org/wiki/GNOME_Display_Manager   그놈 버전 49가 출시되면서, GDM-49가 같이 출시되었습니다.  몇 가지 문제에 부딪힐 수 있습니다. 버전 49.0.1을 설치 후에, 부팅 자체가 완료되지 않고 다른 tty로 접근도 되지 않습니다. 리커버리로 부팅 후에, lightdm으로는 부팅이 됩니다. 이와 관련된 버그는 다음에서 볼 수 있습니다: https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/2121017 결론적으로, 오래 전에 설치된 시스템에서 /etc/nsswitch.conf 파일에서 문제가 발생합니다.  따라서, shadow:         files systemd와 같이 수정해서 GDM 로긴 화면을 만날 수 있습니다.  다른 문제는 Xsession이 목록화되지만, 해당 세션으로 접근되지 않는다는 것입니다. 게다가, Xsession으로 접근 후에, GDM이 오동작해서 다른 Wayland 세션으로 로그인할 수도 없습니다. 이때, 다른 tty로 접근해서 GDM을 재시작하면 제대로 동작합니다. 만약 Xsession으로 로그인하고 싶을 때에는 lightdm과 같은 다른 로긴 관리기를 사용해야 합니다.    덧, 만약 GDM에서 Xsession으로 정상적으로 로긴하기 위해, GDM 패키지를 다시 컴파일해야 합니다.  데비안 패키지에서 GDM-49.0.1 파일을 받아서 debian/rules 파일에서 -Dgdm-xsession=true 구성 옵션을 추가해야 합니다.     

표준정규분포

원문 보기: https://dawoum.duckdns.org/wiki/표준정규분포

정규분포에서, 곡선은 기댓값(평균), \(m\)에 대해 대칭이고, 표준편차에 따라 그 모양이 결정됩니다.

정규분포에서 확률을 구하기 위해, \(x\)-축과 곡선 사이의 넓이를 구해야 합니다. 그런데, 기댓값과 표준편차가 변하면, 곡선의 형태가 달라지기 때문에, 항상 적분을 다시 해야 하는 문제가 생깁니다. 더구나, 적분이 개발되기 전에는 곡선과 \(x\)-축 사이의 넓이를 계산하는 것이 더욱 힘들었을 것입니다.

한편, 이전과정에서, 제곱근 테이블과 상용로그 테이블을 만들어 둔 이유는, 가장 기본이 되는 구간의 테이블을 만들어 놓고, 그 구간을 벗어나는 값은, 산술 조작과 미리 계산된 테이블의 값을 활용해서 구하기 위함이었습니다.

정규분포에서 역시 마찬가지로, 표준이 되는 정규분포에 대한 확률을 구해 놓고, 평균과 표준편차가 변하더라도, 그의 확률을 계산할 수 있기를 희망할 것입니다.

확률변수 \(X\)가 정규분포 \(N(m, \sigma^2)\)을 따를 때, 다음 일차변환

\(\quad\)\(\displaystyle Z=\frac{X-m}{\sigma}\)

을 통한 새로운 확률변수 \(Z\)의 확률밀도함수는

\(\quad\)\(\displaystyle f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}\)

이고, 기댓값 \(m=0\), 표준편차 \(\sigma=1\)입니다.

이 변환 과정을 표준화라고 부르고, 생성된 정규분포를 표준정규분포라고 하며, 간략히 다음과 같이 나타냅니다.

\(\quad\)\(N(0,1^2)\)

이제, 임의의 기댓값과 표준편차를 가진 정규분포를 표준화를 통해서, 항상 표준정규분포로 만들 수 있기 때문에, 표준정규분포에 대한 테이블로부터 원래 정규분포의 확률을 구할 수 있습니다.

정규분포의 표준화

이산확률분포의 확률변수의 성질에서, 이전 확률변수, \(X\)로부터, 일차변환으로 이루어진 새로운 확률변수, \(Y=aX+b\) (\(a, b\)는 실수)에 대하여, 그 확률과 분산은 다음과 같이 구해집니다.

\(\quad\)\(E(Y)=aE(x)+b,\;V(Y)=a^2V(X)\)

이와 마찬가지로 연속확률변수 \(X\)에 대하여, 일차변으로 이루어진 새로운 확률변수 \(Z=aX+b\)에 대하여 다음이 성립합니다.

\(\quad\)\(E(Z)=aE(x)+b,\;V(Z)=a^2V(X)\)

한편, 정규분포의 표준화는 마찬가지로 일차변환이므로, 위의 성질을 따릅니다.

연속확률변수 \(X\)가 정규분포 \(N(m,\sigma^2)\)을 따를 때, 표준화

\(\quad\)\(\displaystyle Z=\frac{X-m}{\sigma}\)

에 의해,

\(\quad\)\(\begin{align}
E(Z) & = E\left(\frac{X-m}{\sigma}\right) \\
& = \frac{1}{\sigma}\left(E(X)-m\right) = \frac{1}{\sigma}(m-m)=0 \\
\end{align}\)

\(\quad\)\(\begin{align}
V(Z) & = V\left(\frac{X-m}{\sigma}\right) \\
& = \frac{1}{\sigma^2}V(X) = \frac{\sigma^2}{\sigma^2}=1 \\
\end{align}\)

따라서, 표준화에 의한 확률변수 \(Z\)는 표준정규분포 \(N(0,1^2)\)을 따릅니다.

표준화의 또 다른 의미

표준화는 서로 같은 의미에 대한 다른 데이트를 서로 비교할 수 있는 방법을 제공합니다. 

예를 들어, 시험을 본 후에, 국어, 수학, 영어 점수를 받았을 때, 가장 잘 본 시험이 무엇인지 궁금할 수 있습니다. 이때, 각 과목의 기댓값과 표준편차가 알려져 있다고 하더라도, 서로 다른 곡선 위에 내 시험 점수가 놓이기 때문에, 어느 과목 시험을 잘 본 것인지 알기가 힘듭니다.

이때, 표준화를 통해서, 내 점수를 표준화한 값, \(z_1, z_2, z_3\)으로 바꾸면, 표준정규분포 곡선, 즉 같은 곡선 위에 내 점수가 차례로 놓이기 때문에, 가장 오른쪽, 즉 가장 큰 값을 가진 시험 점수가 가장 잘 본 과목입니다.

표준정규분포표를 이용한 확률의 계산

이제 정규분포를 따르는 확률분포를 표준화를 통해서 표준정규분포표로부터 확률을 구해보고자 합니다.

예를 들어, 확률변수 \(X\)가 정규분포 \(N(70,2^2)\)을 따를 때, 확률 \(P(68 \le X \le 74)\)은, 표준화에 의해

\(\quad\)\(\displaystyle z_1=\frac{68-70}{2}=-1\)

\(\quad\)\(\displaystyle z_2=\frac{68-74}{2}=2\)

이제 확률

\(\quad\)\(\begin{align}
P(68 \le X \le 74) & = P(-1 \le z \le 2) \\
& = P(-1\le z \le 0) + P(0 \le z \le 2) \\
& = P(0\le z \le 1) + P(0 \le z \le 2) \\
& = 0.34134 + 0.47725 = 0.81859 \\
\end{align}\)

정규분포는 기댓값에 대해 대칭이므로, 표준화를 통해, 표준정규분포로 변환했을 때, 음의 값은, \(z\)-축 대칭이동을 통해 그의 넓이(확률)를 구할 수 있습니다.

대표적으로 시험 문제에서는 다음의 세 값이 자주 이용됩니다.

\(\quad\)\(\begin{align}
P(|X-m| \le \sigma) & = P(m-\sigma \le X \le m+\sigma) \\
& = P(-1 \le z \le 1) \\
& = 2P(0 \le z \le 1) = 0.68268 \\
\end{align}\)

\(\quad\)\(\begin{align}
P(|X-m| \le 2\sigma) & = P(m-2\sigma \le X \le m+2\sigma) \\
& = P(-2 \le z \le 2) \\
& = 2P(0 \le z \le 2) = 0.95450 \\
\end{align}\)

\(\quad\)\(\begin{align}
P(|X-m| \le 3\sigma) & = P(m-3\sigma \le X \le m+3\sigma) \\
& = P(-3 \le z \le 3) \\
& = 2P(0 \le z \le 3) = 0.99730 \\
\end{align}\)

이항분포와 정규분포

이항분포#큰 숫자의 법칙에서, 확률변수 \(X\)가 이항분포 \(B(n,p)\)를 따르고 \(n\)이 충분히 크면 평균 \(m=np\), 분산 \(\sigma^2=npq\)이므로, 근사적으로 정규분포 \(N(np,npq)\)를 따른다고 알려져 있습니다.

이전 예제, 한 개의 주사위를 던졌을 때, 1의 눈이 나오는 횟수를 확률변수 \(X\)로 잡았을 때, \(n=50\) 정도에서 이항분포의 그래프가 거의 정규분포의 특징인 종 모양에 이름을 볼 수 있었습니다.

만약, 실험의 횟수가 많지 않을 때에는 정규분포로 해석할 수 없기 때문에, (이산)확률분포표를 직접 만들어서 해당하는 조건의 확률을 일일이 계산해야 합니다.

반면에, 실험의 횟수가 충분히 클 경우에는 이항분포를 정규분포로 근사화한 후, 표준화를 통해서, 표준정규분포표를 활용해서 확률을 쉽게 구할 수 있습니다.

예를 들어, 확률변수 \(X\)가 이항분포 \(\displaystyle B\left(100, \frac{1}{5}\right)\)를 따르면,

\(\quad\)\(m=np=100 \times \frac{1}{5}=20\)

\(\quad\)\(\displaystyle \sigma^2=npq=100\times \frac{1}{5}\times \frac{4}{5} = 16\)

이므로, 정규분포 \(N\left(20, 4^2\right)\)를 따릅니다.

이때, 확률 \(P(X \ge 28)\)은, 표준화를 통해,

\(\quad\)\(\displaystyle z=\frac{28-20}{4}=2\)

따라서, 확률

\(\quad\)\(\begin{align}
P(X \ge 28) & = P(Z \ge 2) \\
& = 0.5 - P(0\le z \le 2) \\
& = 0.5 - 0.47725 \\
& = 0.02275 \\
\end{align}\)

이것은, 어떤 사건이 한 번 시행에서 확률 \(\frac15\)을 갖는 이항 분포일 때, 해당 사건이 100번의 시행에서 28번 이상 발생할 확률을 구하는 과정입니다.

 

 

댓글

이 블로그의 인기 게시물

리눅스 한글 입력기 (Wayland 편)

원문 보기: https://dawoum.duckdns.org/wiki/한글 입력기/On_Wayland 최근 소프트웨어들의 버전 업그레이드로 인해, X11에서도 님프 입력기에서 문제들이 발생하고 있습니다. 따라서 이제는 X11이든, Wayland이든 kime을 사용하는 것이 바람직해 보입니다!! 리눅스 생태계에서 X11에서 Wayland로의 전환은 여러 가지 새로운 장점과 단점을 만들어 냅니다. 일반 사용자들은 이런 전환이 가진 장점에 열광하기도 하지만 기존에 작동하는 메커니즘이 작동하지 않을 때 더욱 불만을 표출합니다. 리눅스에서 가장 큰 문제점은 한글 입력에 있습니다. 그러나, 이 문제는 거의 한국 사람들에 국한된 문제입니다. 물론, 중국과 일본도 비슷한 처지에 있어서 CJK로 묶어서 얘기가 되지만, 한글은 다른 두 언어에 비해 더 고려할 사항이 있어서 한글 입력기 개발에 어려움이 더해진다고 알려져 있습니다. 이런 상황 아래에서, kime과 nimf는 최근에 한국에서 개발된 두 개의 한글 입력기입니다. 먼저, 개인적인 경험을 기반으로 결론부터 얘기하자면, X11에서는 nimf를 추천합니다. Wayland에서는 kime을 추천합니다. 이유는 간단하게도, X11에서는 nimf가 더 많은 프로그램에서 올바르게 동작했지만, Wayland에서는 X11에서 잘 입력되던 프로그램에서 입력이 되지 않거나 잘못 입력되는 경우가 발생합니다. 반면에 kime은 Wayland에서 nimf가 입력하지 못하는 프로그램에서 입력이 되거나 잘못 입력되던 것이 제대로 입력되는 경우가 있기 때문입니다. 예를 들어, 그놈 Wayland에서 적어도 아래의 현상이 있습니다: gnome-calendar : nimf 입력기 전환 안됨. kime 정상 작동. nimf 이 문제는 gooroom에서 제공되는 gtk4 패치를 이용해 보십시오. kakaotalk (bottles: wine) : nimf 마지막 점을 찍으면 마지막 글자 앞에 찍힘. kime 정상 작동. alac...

Btrfs 압축 수준 설정

원문 보기:  https://dawoum.duckdns.org/wiki/Btrfs 보통, 마운트 옵션에서 compress=zstd를 사용할 경우에 압축 레벨 3를 사용하고, HDD와 느린 플래시 스토리지에 적합하다고 알려져 있습니다. 좀 더 빠른 SATA SSD는 압축 레벨 2가 적당하고, NVME는 압축 레벨 1이 적당하다고 합니다: Yup, this is it. On slow storage higher compression levels tend to yield higher total storage throughput because you spend less time bound by slow storage bandwidth, instead you spend CPU time compressing/decompressing that data. The rick is to pick a compression level that yields greater total throughput than storage bandwidth can accommodate on its own. This approach works well on bandwidth limited storage like HDD pools, slow flash nand, flash nand attached to the system via slow USB, etc. On the flip side you don't want to constrain high bandwidth storage by sending data through a compression algorithm that limits throughput so lower compression levels (like zstd:1 on nvme storage, or zstd:2 on fast SATA SSDs) are usually safe choices. —  seaQueue, Btrfs compress level, https://...

리눅스 한글 입력기

원문 보기:  https://dawoum.duckdns.org/wiki/한글_입력기 컴퓨터에서 한글을 입력하기 위해서 한글 입력기가 필요합니다. 리눅스 배포판마다 기본으로 설치되는 입력기가 있지만, 설치 후에 바로 한글 입력이 가능한 경우는 드뭅니다. 배포판의 설치 후에, 바로 한글 입력이 가능하려면, 적어도 언어를 한국어 ( Korean )로 선택해야 합니다. 그러나, 대부분의 배포판은 설치시에 한국어 ( Korean )를 선택하더라도 별도로 설정을 해야 한글 입력이 가능합니다. 게다가, 배포판이 기본으로 제공하는 데스크탑 환경에 따라 한글 입력기 설정이 다를 수 있습니다. 아래의 입력기는 사용 당시 일부 문제점이 발견되었고, 현재 문제가 남아 있는지 확인을 하지 않았습니다. 또한, snapd와 flatpak 아래에 설치된 프로그램들도 ibus에서 한글 입력이 입력될 가능성이 있고, 나머지에서는 지원이 되지 않는 것으로 알려져 있습니다. 다른 입력기에서 입력이 되는 것처럼 보이는 것은 ibus와 해당 입력기가 동시에 동작하고 있을 가능성이 있습니다. 한글 입력기 문제들 보고 장소 한글 입력기를 사용하면서, 만날 수 있는 문제는 아래에서 볼 수 있습니다: https://github.com/korean-input/issues 이미 보고된 내용 외에도 문제가 있는 분들은 같은 장소에 내용을 기록해 둘 필요가 있습니다. kime 한글 입력기(Korean ime)를 줄여서 만든 kime은 Rust로 작성되었습니다. 아래에서 소스를 볼 수 있습니다: https://github.com/Riey/kime 개별적인 설정을 수정 또는 추가하기 위해, 패키지에서 제공된 설정 파일을 사용자 설정으로 복사할 필요가 있습니다: mkdir -p ~/.config/kime cp /usr/share/doc/kime/default_config.yaml ~/.config/kime/config.yaml 예를 들어, 한/영 전환이 기본적으로 오른쪽 Alt 로 동작하는 ...