기본 콘텐츠로 건너뛰기

GNOME Display Manager 49 (gdm-49)

원문 보기:  https://dawoum.duckdns.org/wiki/GNOME_Display_Manager   그놈 버전 49가 출시되면서, GDM-49가 같이 출시되었습니다.  몇 가지 문제에 부딪힐 수 있습니다. 버전 49.0.1을 설치 후에, 부팅 자체가 완료되지 않고 다른 tty로 접근도 되지 않습니다. 리커버리로 부팅 후에, lightdm으로는 부팅이 됩니다. 이와 관련된 버그는 다음에서 볼 수 있습니다: https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/2121017 결론적으로, 오래 전에 설치된 시스템에서 /etc/nsswitch.conf 파일에서 문제가 발생합니다.  따라서, shadow:         files systemd와 같이 수정해서 GDM 로긴 화면을 만날 수 있습니다.  다른 문제는 Xsession이 목록화되지만, 해당 세션으로 접근되지 않는다는 것입니다. 게다가, Xsession으로 접근 후에, GDM이 오동작해서 다른 Wayland 세션으로 로그인할 수도 없습니다. 이때, 다른 tty로 접근해서 GDM을 재시작하면 제대로 동작합니다. 만약 Xsession으로 로그인하고 싶을 때에는 lightdm과 같은 다른 로긴 관리기를 사용해야 합니다.    덧, 만약 GDM에서 Xsession으로 정상적으로 로긴하기 위해, GDM 패키지를 다시 컴파일해야 합니다.  데비안 패키지에서 GDM-49.0.1 파일을 받아서 debian/rules 파일에서 -Dgdm-xsession=true 구성 옵션을 추가해야 합니다.     

표준정규분포

원문 보기: https://dawoum.duckdns.org/wiki/표준정규분포

정규분포에서, 곡선은 기댓값(평균), \(m\)에 대해 대칭이고, 표준편차에 따라 그 모양이 결정됩니다.

정규분포에서 확률을 구하기 위해, \(x\)-축과 곡선 사이의 넓이를 구해야 합니다. 그런데, 기댓값과 표준편차가 변하면, 곡선의 형태가 달라지기 때문에, 항상 적분을 다시 해야 하는 문제가 생깁니다. 더구나, 적분이 개발되기 전에는 곡선과 \(x\)-축 사이의 넓이를 계산하는 것이 더욱 힘들었을 것입니다.

한편, 이전과정에서, 제곱근 테이블과 상용로그 테이블을 만들어 둔 이유는, 가장 기본이 되는 구간의 테이블을 만들어 놓고, 그 구간을 벗어나는 값은, 산술 조작과 미리 계산된 테이블의 값을 활용해서 구하기 위함이었습니다.

정규분포에서 역시 마찬가지로, 표준이 되는 정규분포에 대한 확률을 구해 놓고, 평균과 표준편차가 변하더라도, 그의 확률을 계산할 수 있기를 희망할 것입니다.

확률변수 \(X\)가 정규분포 \(N(m, \sigma^2)\)을 따를 때, 다음 일차변환

\(\quad\)\(\displaystyle Z=\frac{X-m}{\sigma}\)

을 통한 새로운 확률변수 \(Z\)의 확률밀도함수는

\(\quad\)\(\displaystyle f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}\)

이고, 기댓값 \(m=0\), 표준편차 \(\sigma=1\)입니다.

이 변환 과정을 표준화라고 부르고, 생성된 정규분포를 표준정규분포라고 하며, 간략히 다음과 같이 나타냅니다.

\(\quad\)\(N(0,1^2)\)

이제, 임의의 기댓값과 표준편차를 가진 정규분포를 표준화를 통해서, 항상 표준정규분포로 만들 수 있기 때문에, 표준정규분포에 대한 테이블로부터 원래 정규분포의 확률을 구할 수 있습니다.

정규분포의 표준화

이산확률분포의 확률변수의 성질에서, 이전 확률변수, \(X\)로부터, 일차변환으로 이루어진 새로운 확률변수, \(Y=aX+b\) (\(a, b\)는 실수)에 대하여, 그 확률과 분산은 다음과 같이 구해집니다.

\(\quad\)\(E(Y)=aE(x)+b,\;V(Y)=a^2V(X)\)

이와 마찬가지로 연속확률변수 \(X\)에 대하여, 일차변으로 이루어진 새로운 확률변수 \(Z=aX+b\)에 대하여 다음이 성립합니다.

\(\quad\)\(E(Z)=aE(x)+b,\;V(Z)=a^2V(X)\)

한편, 정규분포의 표준화는 마찬가지로 일차변환이므로, 위의 성질을 따릅니다.

연속확률변수 \(X\)가 정규분포 \(N(m,\sigma^2)\)을 따를 때, 표준화

\(\quad\)\(\displaystyle Z=\frac{X-m}{\sigma}\)

에 의해,

\(\quad\)\(\begin{align}
E(Z) & = E\left(\frac{X-m}{\sigma}\right) \\
& = \frac{1}{\sigma}\left(E(X)-m\right) = \frac{1}{\sigma}(m-m)=0 \\
\end{align}\)

\(\quad\)\(\begin{align}
V(Z) & = V\left(\frac{X-m}{\sigma}\right) \\
& = \frac{1}{\sigma^2}V(X) = \frac{\sigma^2}{\sigma^2}=1 \\
\end{align}\)

따라서, 표준화에 의한 확률변수 \(Z\)는 표준정규분포 \(N(0,1^2)\)을 따릅니다.

표준화의 또 다른 의미

표준화는 서로 같은 의미에 대한 다른 데이트를 서로 비교할 수 있는 방법을 제공합니다. 

예를 들어, 시험을 본 후에, 국어, 수학, 영어 점수를 받았을 때, 가장 잘 본 시험이 무엇인지 궁금할 수 있습니다. 이때, 각 과목의 기댓값과 표준편차가 알려져 있다고 하더라도, 서로 다른 곡선 위에 내 시험 점수가 놓이기 때문에, 어느 과목 시험을 잘 본 것인지 알기가 힘듭니다.

이때, 표준화를 통해서, 내 점수를 표준화한 값, \(z_1, z_2, z_3\)으로 바꾸면, 표준정규분포 곡선, 즉 같은 곡선 위에 내 점수가 차례로 놓이기 때문에, 가장 오른쪽, 즉 가장 큰 값을 가진 시험 점수가 가장 잘 본 과목입니다.

표준정규분포표를 이용한 확률의 계산

이제 정규분포를 따르는 확률분포를 표준화를 통해서 표준정규분포표로부터 확률을 구해보고자 합니다.

예를 들어, 확률변수 \(X\)가 정규분포 \(N(70,2^2)\)을 따를 때, 확률 \(P(68 \le X \le 74)\)은, 표준화에 의해

\(\quad\)\(\displaystyle z_1=\frac{68-70}{2}=-1\)

\(\quad\)\(\displaystyle z_2=\frac{68-74}{2}=2\)

이제 확률

\(\quad\)\(\begin{align}
P(68 \le X \le 74) & = P(-1 \le z \le 2) \\
& = P(-1\le z \le 0) + P(0 \le z \le 2) \\
& = P(0\le z \le 1) + P(0 \le z \le 2) \\
& = 0.34134 + 0.47725 = 0.81859 \\
\end{align}\)

정규분포는 기댓값에 대해 대칭이므로, 표준화를 통해, 표준정규분포로 변환했을 때, 음의 값은, \(z\)-축 대칭이동을 통해 그의 넓이(확률)를 구할 수 있습니다.

대표적으로 시험 문제에서는 다음의 세 값이 자주 이용됩니다.

\(\quad\)\(\begin{align}
P(|X-m| \le \sigma) & = P(m-\sigma \le X \le m+\sigma) \\
& = P(-1 \le z \le 1) \\
& = 2P(0 \le z \le 1) = 0.68268 \\
\end{align}\)

\(\quad\)\(\begin{align}
P(|X-m| \le 2\sigma) & = P(m-2\sigma \le X \le m+2\sigma) \\
& = P(-2 \le z \le 2) \\
& = 2P(0 \le z \le 2) = 0.95450 \\
\end{align}\)

\(\quad\)\(\begin{align}
P(|X-m| \le 3\sigma) & = P(m-3\sigma \le X \le m+3\sigma) \\
& = P(-3 \le z \le 3) \\
& = 2P(0 \le z \le 3) = 0.99730 \\
\end{align}\)

이항분포와 정규분포

이항분포#큰 숫자의 법칙에서, 확률변수 \(X\)가 이항분포 \(B(n,p)\)를 따르고 \(n\)이 충분히 크면 평균 \(m=np\), 분산 \(\sigma^2=npq\)이므로, 근사적으로 정규분포 \(N(np,npq)\)를 따른다고 알려져 있습니다.

이전 예제, 한 개의 주사위를 던졌을 때, 1의 눈이 나오는 횟수를 확률변수 \(X\)로 잡았을 때, \(n=50\) 정도에서 이항분포의 그래프가 거의 정규분포의 특징인 종 모양에 이름을 볼 수 있었습니다.

만약, 실험의 횟수가 많지 않을 때에는 정규분포로 해석할 수 없기 때문에, (이산)확률분포표를 직접 만들어서 해당하는 조건의 확률을 일일이 계산해야 합니다.

반면에, 실험의 횟수가 충분히 클 경우에는 이항분포를 정규분포로 근사화한 후, 표준화를 통해서, 표준정규분포표를 활용해서 확률을 쉽게 구할 수 있습니다.

예를 들어, 확률변수 \(X\)가 이항분포 \(\displaystyle B\left(100, \frac{1}{5}\right)\)를 따르면,

\(\quad\)\(m=np=100 \times \frac{1}{5}=20\)

\(\quad\)\(\displaystyle \sigma^2=npq=100\times \frac{1}{5}\times \frac{4}{5} = 16\)

이므로, 정규분포 \(N\left(20, 4^2\right)\)를 따릅니다.

이때, 확률 \(P(X \ge 28)\)은, 표준화를 통해,

\(\quad\)\(\displaystyle z=\frac{28-20}{4}=2\)

따라서, 확률

\(\quad\)\(\begin{align}
P(X \ge 28) & = P(Z \ge 2) \\
& = 0.5 - P(0\le z \le 2) \\
& = 0.5 - 0.47725 \\
& = 0.02275 \\
\end{align}\)

이것은, 어떤 사건이 한 번 시행에서 확률 \(\frac15\)을 갖는 이항 분포일 때, 해당 사건이 100번의 시행에서 28번 이상 발생할 확률을 구하는 과정입니다.

 

 

댓글

이 블로그의 인기 게시물

리눅스 한글 입력기 (Wayland 편)

원문 보기: https://dawoum.duckdns.org/wiki/한글 입력기/On_Wayland 최근 소프트웨어들의 버전 업그레이드로 인해, X11에서도 님프 입력기에서 문제들이 발생하고 있습니다. 따라서 이제는 X11이든, Wayland이든 kime을 사용하는 것이 바람직해 보입니다!! 리눅스 생태계에서 X11에서 Wayland로의 전환은 여러 가지 새로운 장점과 단점을 만들어 냅니다. 일반 사용자들은 이런 전환이 가진 장점에 열광하기도 하지만 기존에 작동하는 메커니즘이 작동하지 않을 때 더욱 불만을 표출합니다. 리눅스에서 가장 큰 문제점은 한글 입력에 있습니다. 그러나, 이 문제는 거의 한국 사람들에 국한된 문제입니다. 물론, 중국과 일본도 비슷한 처지에 있어서 CJK로 묶어서 얘기가 되지만, 한글은 다른 두 언어에 비해 더 고려할 사항이 있어서 한글 입력기 개발에 어려움이 더해진다고 알려져 있습니다. 이런 상황 아래에서, kime과 nimf는 최근에 한국에서 개발된 두 개의 한글 입력기입니다. 먼저, 개인적인 경험을 기반으로 결론부터 얘기하자면, X11에서는 nimf를 추천합니다. Wayland에서는 kime을 추천합니다. 이유는 간단하게도, X11에서는 nimf가 더 많은 프로그램에서 올바르게 동작했지만, Wayland에서는 X11에서 잘 입력되던 프로그램에서 입력이 되지 않거나 잘못 입력되는 경우가 발생합니다. 반면에 kime은 Wayland에서 nimf가 입력하지 못하는 프로그램에서 입력이 되거나 잘못 입력되던 것이 제대로 입력되는 경우가 있기 때문입니다. 예를 들어, 그놈 Wayland에서 적어도 아래의 현상이 있습니다: gnome-calendar : nimf 입력기 전환 안됨. kime 정상 작동. nimf 이 문제는 gooroom에서 제공되는 gtk4 패치를 이용해 보십시오. kakaotalk (bottles: wine) : nimf 마지막 점을 찍으면 마지막 글자 앞에 찍힘. kime 정상 작동. alac...

Btrfs 압축 수준 설정

원문 보기:  https://dawoum.duckdns.org/wiki/Btrfs 보통, 마운트 옵션에서 compress=zstd를 사용할 경우에 압축 레벨 3를 사용하고, HDD와 느린 플래시 스토리지에 적합하다고 알려져 있습니다. 좀 더 빠른 SATA SSD는 압축 레벨 2가 적당하고, NVME는 압축 레벨 1이 적당하다고 합니다: Yup, this is it. On slow storage higher compression levels tend to yield higher total storage throughput because you spend less time bound by slow storage bandwidth, instead you spend CPU time compressing/decompressing that data. The rick is to pick a compression level that yields greater total throughput than storage bandwidth can accommodate on its own. This approach works well on bandwidth limited storage like HDD pools, slow flash nand, flash nand attached to the system via slow USB, etc. On the flip side you don't want to constrain high bandwidth storage by sending data through a compression algorithm that limits throughput so lower compression levels (like zstd:1 on nvme storage, or zstd:2 on fast SATA SSDs) are usually safe choices. —  seaQueue, Btrfs compress level, https://...

Installing hoffice 2022 beta on Debian

원문 보기:  https://dawoum.duckdns.org/wiki/Installing_hoffice_2022_beta_on_Debian 구름 OS 2.0에서 배포되었던 1520 버전은 hwp에서 일부 버그가 있는 것으로 보입니다. 예를 들어, 한글 입력 상태에서 키를 누르고 있으면, 입력이 되지 않다가 키를 풀면 한꺼번에 입력이 됩니다. 반면에, 한글 2020 베타 버전은 이런 현상이 없습니다. 게다가, 구름 OS 3.0이 출시되면서 해당 패키지는 누락되었고, 이전 저장소에서 더 이상 다운로드되지 않는 것으로 보입니다. 또한, 윈도우 버전에 비해 기능 자체가 많지 않아서 편집기로는 크게 쓸모가 없다는 주장이 있지만, 뷰어로서 기능은 가능한 것으로 보입니다. 보통 데비안에서 문서를 만들 때, 여러가지 좋은 도구들이 있습니다. 가장 좋은 가독성을 보이는 것은 LaTeX이겠지만, 프로그램을 설치하고 문서를 만드는 것이 쉽지 않습니다. 어쨌든, 한글과 컴퓨터에서 만든 hwp는 여러 부분에서 쓰이는 경우가 있습니다. 예를 들어, 다른 사람이 만들어 놓은 hwp 파일을 보기 위해서는 hwpviewer 또는 온라인에서 hwp2pdf 등으로 다른 문서로 바꾸어서 볼 수는 있습니다. 그러나, 편집을 하기 위해서는 전용 프로그램이 필요합니다. 물론, 가상 기계 아래에서 윈도우 시스템을 설치하고, 윈도우용 hwp를 설치해서 이 작업을 수행할 수 있습니다. 어쨌든, 가능하다면, 리눅스에서 직접 hwp를 편집하기를 희망할 것입니다. 한글과 컴퓨터에서 구름 OS 를 만들면서, 번들로 제공하는 리눅스용 한컴오피스 2022 베타는 이런 목적으로 설치해서 사용해 볼 필요가 있습니다. Download 2020 beta version 위에서 언급했듯이, 어떤 이유에서든지 서버에서 제거되었기 때문에, 개인적으로 미리 다운로드 받지 않는 분들은 해당 버전을 이용할 수 없습니다. 다행히, 버그가 적을 것으로 기대되는 이전 버전은 여전히 공식 서버에 제공되고 있고, 아...