2.3 · Random Variables Discrete

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶

Part 2.1-এ আমরা probability-কে একটা set (sample space $\Omega$)-এর উপর সংজ্ঞায়িত করেছি, আর event-কে দেখেছি $\Omega$-এর একটা subset হিসেবে। কিন্তু বাস্তবে আমরা প্রায় সময়ই পুরো outcome-টা নিয়ে মাথা ঘামাই না — আমরা চাই একটা number (সংখ্যা)। ১০ বার coin ছুড়লে কতগুলো head পড়ল? একটা call center-এ ঘণ্টায় কয়টা call এল? একটা machine-এর প্রথম failure পেতে কতবার চালাতে হলো? প্রতিটি প্রশ্নই একটা random outcome-কে একটা সংখ্যায় রূপান্তর করছে।

এই "outcome → সংখ্যা" রূপান্তরই হলো random variable (দৈব চলক)। আর এখানেই Part 0-এর সবচেয়ে সুন্দর সেতুটা স্পষ্ট হয়: ০.১-এ আমরা শিখেছিলাম একটা function হলো এমন একটা নিয়ম যা এক set-এর প্রতিটি উপাদানকে আরেক set-এর ঠিক একটা উপাদানে পাঠায়। Random variable ঠিক তাই — sample space $\Omega$ থেকে বাস্তব সংখ্যা $\mathbb{R}$-তে একটা function:

\[ X : \Omega \to \mathbb{R}. \]

💡 এক বাক্যে মূল কথা: sample space একটা set, event একটা subset, আর random variable একটা function। ০.১-এর এই তিন-শব্দের ছকটাই Part II-এর গোটা ব্যাকরণ।

একটা ছোট উদাহরণ (০.১-এর সাথে হুবহু মিল)। দুবার fair coin ছুড়লে $\Omega = \{HH, HT, TH, TT\}$। ধরা যাক $X(\omega) = $ (head-এর সংখ্যা)। তাহলে $X(HH)=2$, $X(HT)=X(TH)=1$, $X(TT)=0$ — অর্থাৎ $X:\Omega\to\{0,1,2\}\subset\mathbb{R}$। লক্ষ করো $X$ injective নয় ($HT$ ও $TH$ দুটোই $1$-এ যায়), আর সেটাই স্বাভাবিক — random variable-কে injective হতে হয় না।

এবার মজার ব্যাপারটা: "$X=1$" লিখলে আমরা আসলে একটা event বোঝাই — $\{\omega \mid X(\omega)=1\} = \{HT, TH\}$, যা $\Omega$-এর একটা subset। তাই

\[ P(X=1) = P(\{HT,TH\}) = \frac{\lvert\{HT,TH\}\rvert}{\lvert\Omega\rvert} = \frac{2}{4} = 0.5. \]

এই $k\mapsto P(X=k)$ নিয়মটাই random variable-এর probability mass function (PMF), আর এটাই হবে এই অধ্যায়ের কেন্দ্র।

Statistics-এ এর ভূমিকা। এই অধ্যায় Part II-এর মেরুদণ্ড, কারণ যত data আমরা পরে modeling করব তার বেশিরভাগই কোনো-না-কোনো distribution থেকে আসা random variable হিসেবে ধরা হয়:

একটা A/B test-এ "conversion হলো কি না" — Bernoulli; $n$ জন user-এর মধ্যে কতজন convert করল — Binomial।
ঘণ্টায় website hit-সংখ্যা, দিনে দুর্ঘটনা-সংখ্যা, পৃষ্ঠায় typo-সংখ্যা — Poisson।
সফলতা পেতে কতবার চেষ্টা — Geometric।

আর Part IV-এ যখন likelihood ও estimation আসবে, তখন এই PMF-গুলোই হবে কাঁচামাল: data দেখে আমরা জিজ্ঞেস করব "কোন parameter এই data-কে সবচেয়ে সম্ভাব্য করে তোলে?" — সেই প্রশ্নের ভিত্তি এখানেই বসছে। বিশেষ করে binomial distribution সরাসরি ০.২-এর $\binom{n}{k}$-এর উপর দাঁড়িয়ে — counting থেকে probability-তে এটাই সরাসরি সেতু।

২ · মূল ধারণা ও সংজ্ঞা¶

২.১ Random variable ও তার দুই ধরন¶

Random variable (দৈব চলক) হলো একটা function $X:\Omega\to\mathbb{R}$ যা sample space-এর প্রতিটি outcome $\omega$-কে একটা বাস্তব সংখ্যা $X(\omega)$-তে পাঠায়।

দুই বড় শ্রেণি:

Discrete (বিচ্ছিন্ন): $X$-এর সম্ভাব্য মানগুলো গণনাযোগ্য (countable) — হয় সসীম $\{0,1,\dots,n\}$, নয়তো গণনাযোগ্য-অসীম $\{0,1,2,\dots\}$। যেমন head-সংখ্যা, call-সংখ্যা। এই অধ্যায় শুধু discrete নিয়ে।
Continuous (অবিচ্ছিন্ন): $X$ একটা ব্যবধির (interval) সব মান নিতে পারে, যেমন উচ্চতা, সময়। এদের নিয়ে 2.4-এ।

Random variable-এর সম্ভাব্য মানগুলোর set-কে তার support (সমর্থন) বলে, লেখা হয় $\mathcal{X}$ বা $\mathrm{supp}(X)$।

Notation convention (পুরো Part II জুড়ে): বড় হাতের অক্ষর ($X, Y$) random variable বোঝায়; ছোট হাতের অক্ষর ($x, k$) তার একটা নির্দিষ্ট মান বোঝায়। তাই "$P(X=k)$" পড়ো "random variable $X$-এর মান $k$ হওয়ার probability"।

২.২ Probability mass function (PMF)¶

Discrete random variable $X$-এর probability mass function (সম্ভাব্যতা ভর-অপেক্ষক) হলো function $$ p_X(k) = P(X = k), \qquad k \in \mathbb{R}. $$ এখানে $P(X=k)$ মানে event $\{\omega\in\Omega \mid X(\omega)=k\}$-এর probability।

PMF-এর দুটো অপরিহার্য ধর্ম (axioms থেকে সরাসরি, §৪.১):

অঋণাত্মকতা: $p_X(k) \ge 0$ সব $k$-এর জন্য।
মোট ভর $1$: $\displaystyle\sum_{k \in \mathcal{X}} p_X(k) = 1$ — অর্থাৎ সব সম্ভাব্য মানের probability যোগ করলে ঠিক $1$।

"Mass" (ভর) শব্দটা স্বজ্ঞাময়: কল্পনা করো মোট $1$ একক ভরকে সংখ্যারেখার কতগুলো বিন্দুতে টুকরো টুকরো করে বসানো হয়েছে; প্রতিটি বিন্দুতে কতটুকু ভর বসল, সেটাই $p_X(k)$। (Continuous ক্ষেত্রে ভর ছড়িয়ে যায় density-তে — 2.4।)

যেকোনো event $A\subseteq\mathbb{R}$-এর probability পেতে শুধু সংশ্লিষ্ট মানগুলোর ভর যোগ করো:

\[ P(X \in A) = \sum_{k \in A} p_X(k). \]

২.৩ Cumulative distribution function (CDF)¶

$X$-এর cumulative distribution function (ক্রমযোজিত বণ্টন-অপেক্ষক) হলো $$ F_X(x) = P(X \le x), \qquad x \in \mathbb{R}. $$

CDF "এ পর্যন্ত জমা হওয়া মোট probability" মাপে। Discrete ক্ষেত্রে এটা পাওয়া যায় ভর জমিয়ে:

\[ F_X(x) = \sum_{k \le x} p_X(k). \]

ফলে discrete CDF একটা step function (ধাপ-অপেক্ষক): সমর্থনের প্রতিটি মান $k$-এ এটা ঠিক $p_X(k)$ পরিমাণ লাফ দেয়, আর দুই মানের মাঝে সমতল থাকে (§৬-এর চিত্র দেখো)। যেকোনো CDF-এর সর্বজনীন ধর্ম:

অ-হ্রাসমান (non-decreasing): $x_1 \le x_2 \Rightarrow F_X(x_1) \le F_X(x_2)$।
সীমা: $\displaystyle\lim_{x\to-\infty}F_X(x)=0$ এবং $\displaystyle\lim_{x\to+\infty}F_X(x)=1$।
ডান-অবিচ্ছিন্ন (right-continuous): $\le$ চিহ্নের কারণে প্রতিটি লাফে উপরের মানটাই ধরা হয়।

PMF ↔ CDF সম্পর্ক। Discrete ক্ষেত্রে PMF-কে CDF-এর "লাফের উচ্চতা" থেকে পুনরুদ্ধার করা যায়:

\[ p_X(k) = F_X(k) - F_X(k^-) = P(X\le k) - P(X < k), \]

যেখানে $F_X(k^-)$ মানে বাঁদিক থেকে সীমা। আরেকটা খুব দরকারি সূত্র — দুই মানের মধ্যবর্তী probability:

\[ P(a < X \le b) = F_X(b) - F_X(a). \]

২.৪ Expectation (প্রত্যাশা) ও variance (ভেদাঙ্ক)¶

Discrete random variable $X$-এর expectation বা mean (প্রত্যাশিত মান) হলো ভর দিয়ে ভারিত গড়: $$ \mathbb{E}[X] = \mu = \sum_{k\in\mathcal{X}} k\, p_X(k). $$

স্বজ্ঞা: যদি একই experiment (পরীক্ষা) বহুবার করো, $X$-এর মানগুলোর গড় দীর্ঘমেয়াদে $\mathbb{E}[X]$-এর দিকে যায় (এটাই law of large numbers, Part III; §৬-এ চাক্ষুষ)। ছক্কার ক্ষেত্রে $\mathbb{E}[X]=(1+2+\cdots+6)/6=3.5$ — খেয়াল করো mean নিজে support-এর মান নাও হতে পারে।

যেকোনো function $g$-এর জন্য (law of the unconscious statistician, §৪.২):

\[ \mathbb{E}[g(X)] = \sum_{k\in\mathcal{X}} g(k)\, p_X(k). \]

Linearity (রৈখিকতা) — অসম্ভব দরকারি, যেকোনো $X,Y$ ও constant (ধ্রুবক) $a,b$-এর জন্য (independence লাগে না):

\[ \mathbb{E}[aX + bY + c] = a\,\mathbb{E}[X] + b\,\mathbb{E}[Y] + c. \]

$X$-এর variance (ভেদাঙ্ক) হলো mean থেকে গড় squared deviation (বর্গ-বিচ্যুতি): $$ \mathrm{Var}(X) = \sigma^2 = \mathbb{E}\big[(X-\mu)^2\big] = \sum_{k} (k-\mu)^2\, p_X(k). $$

Variance হলো spread (ছড়ানো)-এর পরিমাপ; এর বর্গমূল $\sigma = \sqrt{\mathrm{Var}(X)}$ হলো standard deviation (পরিমিত ব্যবধান)। হিসাবের জন্য একটা সহজ formula (সূত্র) (§৪.৩-এ প্রমাণ):

\[ \boxed{\;\mathrm{Var}(X) = \mathbb{E}[X^2] - \big(\mathbb{E}[X]\big)^2\;} \]

স্কেলিং-এর নিয়ম: $\mathrm{Var}(aX+b) = a^2\,\mathrm{Var}(X)$ (ধ্রুবক $b$ ছড়ানো বদলায় না)।

২.৫ চারটি core discrete distribution¶

নিচের চারটি distribution (বণ্টন) statistics-এ সবচেয়ে বেশি আসে। প্রতিটির একটা সৃষ্টিগল্প (generative story) আছে — সেটা মনে রাখলে সূত্র মুখস্থ করতে হয় না।

(ক) Bernoulli$(p)$ — একটামাত্র "হ্যাঁ/না" পরীক্ষা (যেমন একবার coin toss, success চিহ্ন $1$, ব্যর্থতা $0$):

\[ p_X(1)=p,\quad p_X(0)=1-p; \qquad \mathbb{E}[X]=p,\quad \mathrm{Var}(X)=p(1-p). \]

এটাই সব discrete distribution-এর মৌলিক ইট — Binomial, Geometric সব এর উপর গড়া।

(খ) Binomial$(n,p)$ — $n$টি independent (স্বাধীন) Bernoulli$(p)$ trial-এ মোট success-সংখ্যা। সমর্থন $\{0,1,\dots,n\}$:

\[ p_X(k) = \binom{n}{k} p^k (1-p)^{n-k}, \qquad k=0,1,\dots,n. $$ $$ \mathbb{E}[X] = np, \qquad \mathrm{Var}(X) = np(1-p). \]

এখানে $\binom{n}{k}$ ঠিক ০.২-এ শেখা — "$n$ trial-এর মধ্যে কোন $k$টিতে success" তার গণনা। $p^k(1-p)^{n-k}$ অংশটা একটা নির্দিষ্ট ক্রমের probability (independence), আর $\binom{n}{k}$ সব সমান-সম্ভাব্য ক্রম গোনে। (Bernoulli আসলে $n=1$-এর Binomial।)

(গ) Poisson$(\lambda)$ — একটা স্থির ব্যবধি (সময়/স্থান)-তে বিরল, independent event (ঘটনা)-এর সংখ্যা; $\lambda>0$ হলো গড় হার। সমর্থন $\{0,1,2,\dots\}$:

\[ p_X(k) = \frac{\lambda^k e^{-\lambda}}{k!}, \qquad k=0,1,2,\dots $$ $$ \mathbb{E}[X] = \lambda, \qquad \mathrm{Var}(X) = \lambda. \]

Poisson-এর স্বাক্ষর ধর্ম: mean ও variance সমান ($=\lambda$)। উদাহরণ: ঘণ্টায় গড়ে $\lambda$টা call এলে, কোনো ঘণ্টায় ঠিক $k$টা call আসার probability।

(ঘ) Geometric$(p)$ — independent Bernoulli$(p)$ trial-এ প্রথম success পেতে কত trial লাগল। সমর্থন $\{1,2,3,\dots\}$ (এই কনভেনশনে $k$ = trial-সংখ্যা):

\[ p_X(k) = (1-p)^{k-1}\,p, \qquad k=1,2,3,\dots $$ $$ \mathbb{E}[X] = \frac{1}{p}, \qquad \mathrm{Var}(X) = \frac{1-p}{p^2}. \]

স্বজ্ঞা: প্রথম $k-1$টা trial ব্যর্থ (প্রতিটির probability $1-p$, independent), $k$-তম trial success (probability $p$)। Geometric-এর বিখ্যাত memoryless (স্মৃতিহীন) ধর্ম: ইতিমধ্যে যতগুলো ব্যর্থতা হোক, পরবর্তী success-এর জন্য অপেক্ষা একইরকম থাকে (§৪.৫)।

⚠️ কনভেনশন সতর্কতা: কিছু বই Geometric-কে "প্রথম success-এর আগে কতগুলো ব্যর্থতা" হিসেবে নেয়, তখন support $\{0,1,2,\dots\}$ ও $\mathbb{E}[X]=(1-p)/p$। scipy.stats.geom আমাদের মতোই trial-সংখ্যা ($k\ge1$) ব্যবহার করে। সবসময় কোন কনভেনশন তা মিলিয়ে নিও।

২.৬ সংক্ষেপে আরও দুটি: Negative Binomial ও Hypergeometric¶

Negative Binomial$(r,p)$ — Geometric-এর সাধারণীকরণ: $r$-তম success পেতে কত trial লাগল (সমর্থন $k=r, r+1,\dots$):

\[ p_X(k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}, \qquad \mathbb{E}[X]=\frac{r}{p},\quad \mathrm{Var}(X)=\frac{r(1-p)}{p^2}. \]

$r=1$ হলে এটা ঠিক Geometric। Data science-এ এটা overdispersed count data (যেখানে variance > mean, তাই Poisson খাটে না) modeling-এ লাগে।

Hypergeometric$(N,K,n)$ — $N$টা জিনিসের মধ্যে $K$টা "success" আছে; প্রতিস্থাপন ছাড়া (without replacement) $n$টা টানলে কতগুলো success পাওয়া যায়:

\[ p_X(k) = \frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}, \qquad \mathbb{E}[X]=n\frac{K}{N}. \]

Binomial-এর সাথে পার্থক্য: Binomial-এ প্রতি trial independent (স্বাধীন) (with replacement / অসীম population), Hypergeometric-এ টান নির্ভরশীল (finite population, যেমন তাস বা গুণমান-পরীক্ষায় lot থেকে sample (নমুনা) নেওয়া)। $N$ অনেক বড় হলে দুটো প্রায় মিলে যায়।

এই দুটি এখন শুধু চিনে রাখো; এরা মূলত Part IV–V (modeling)-এ ফিরবে।

৩ · পূর্ণাঙ্গ উদাহরণ¶

উদাহরণ ৩.১ — PMF ও CDF হাতে গড়া: তিন coin toss¶

তিনবার fair coin ($p=0.5$) ছুড়ছি; $X=$ head-সংখ্যা। এটা Binomial$(3, 0.5)$। ০.২-এ শেখা $\binom{n}{k}$ দিয়ে PMF:

\[ p_X(k) = \binom{3}{k}(0.5)^k(0.5)^{3-k} = \frac{\binom{3}{k}}{8}. \]

$k$	$\binom{3}{k}$	$p_X(k)$	$F_X(k)=P(X\le k)$
$0$	$1$	$1/8 = 0.125$	$0.125$
$1$	$3$	$3/8 = 0.375$	$0.500$
$2$	$3$	$3/8 = 0.375$	$0.875$
$3$	$1$	$1/8 = 0.125$	$1.000$

যাচাই: $\sum p_X(k) = (1+3+3+1)/8 = 1$ ✓ (মোট ভর $1$)। আর $F_X(3)=1$ ✓।

একটা event-এর হিসাব: "অন্তত $2$ head" মানে $P(X\ge2) = p_X(2)+p_X(3) = 0.375+0.125 = 0.5$। অথবা CDF দিয়ে: $P(X\ge2)=1-F_X(1)=1-0.5=0.5$ ✓।

উদাহরণ ৩.২ — Binomial: A/B test-এ conversion¶

একটা website-এ নতুন button-এর conversion rate $p=0.2$। $n=10$ জন independent (স্বাধীন) visitor এলে, ঠিক $3$ জন convert করার probability?

\[ P(X=3) = \binom{10}{3}(0.2)^3(0.8)^7 = 120 \cdot 0.008 \cdot 0.2097152 \approx 0.2013. \]

expected (প্রত্যাশিত) conversion: $\mathbb{E}[X]=np = 10\times0.2 = 2$ জন; spread (ছড়ানো) $\mathrm{Var}(X)=np(1-p)=10(0.2)(0.8)=1.6$, তাই $\sigma=\sqrt{1.6}\approx1.26$। "অন্তত একজন convert করবে" এর probability হিসাব করা সহজ পরিপূরক দিয়ে: $P(X\ge1)=1-P(X=0)=1-(0.8)^{10}\approx1-0.107=0.893$।

উদাহরণ ৩.৩ — Poisson: call center¶

একটা call center-এ গড়ে ঘণ্টায় $\lambda=4$টা call আসে। একটা নির্দিষ্ট ঘণ্টায় ঠিক $2$টা call আসার probability?

\[ P(X=2) = \frac{4^2 e^{-4}}{2!} = \frac{16 \cdot 0.0183}{2} \approx 0.1465. \]

কোনো call না আসার probability $P(X=0)=e^{-4}\approx0.0183$। এখানে mean $=$ variance $=4$, তাই $\sigma=2$ — মোটামুটি $4\pm2$ call প্রত্যাশিত। (পরে §৭ Q5-এ দেখবে এই same hour-rate দিয়ে অন্য ব্যবধি, যেমন আধ ঘণ্টার, hisab কীভাবে scaling করে।)

উদাহরণ ৩.৪ — Geometric: প্রথম সফলতা¶

একটা পাশা ছুড়ছি; "$6$ পড়া" = success, তাই $p=1/6$। প্রথম $6$ পেতে ঠিক $4$ বার ছুড়তে হওয়ার probability (অর্থাৎ প্রথম তিনবার $6$ নয়, চতুর্থবার $6$)?

\[ P(X=4) = (1-p)^{3}\,p = \left(\tfrac{5}{6}\right)^3 \cdot \tfrac{1}{6} = \frac{125}{1296} \approx 0.0965. \]

average (গড়)-এ কতবার লাগবে? $\mathbb{E}[X]=1/p = 6$ বার — স্বজ্ঞাময়, $1/6$ probability-র জন্য গড়ে $6$ চেষ্টা। "$3$ বারের মধ্যেই $6$ পড়বে" এর probability CDF দিয়ে: $P(X\le3)=1-(5/6)^3 = 1-0.5787 = 0.4213$ (এটাই Geometric-এর CDF-এর বদ্ধ রূপ, §৪.৪)।

উদাহরণ ৩.৫ — Variance দুই উপায়ে: Bernoulli দিয়ে যাচাই¶

Bernoulli$(p)$-এর variance §২.৫-এ লেখা সূত্র $\mathrm{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2$ দিয়ে যাচাই করি। সমর্থন $\{0,1\}$, তাই $X^2=X$ (কারণ $0^2=0,1^2=1$):

\[ \mathbb{E}[X]=p, \qquad \mathbb{E}[X^2]=0^2(1-p)+1^2\cdot p = p. $$ $$ \mathrm{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2 = p - p^2 = p(1-p). \checkmark \]

§২.৫-এর Bernoulli variance-এর সাথে হুবহু মিলল।

৪ · প্রমাণ ও উৎপাদন¶

Intro-probability স্তরের প্রমাণ — যেখানে measure theory লাগে (যেমন CDF-এর সাধারণ গঠন) তা Part VII-এ। তারা চিহ্ন: ★ সহজ, ★★ মাঝারি, ★★★ গভীর।

৪.১ PMF axioms সন্তুষ্ট করে ★¶

দাবি: $p_X(k)=P(X=k)$ অঋণাত্মক এবং $\sum_k p_X(k)=1$।

প্রমাণ: probability axiom থেকে যেকোনো event-এর probability $\ge0$, তাই $p_X(k)=P(\{X=k\})\ge0$। আবার event-গুলো $\{X=k\}$ (ভিন্ন $k$-এর জন্য) পরস্পর-বিচ্ছিন্ন (একটা outcome $\omega$ ঠিক একটাই মান $X(\omega)$ দেয়, কারণ $X$ একটা function — ০.১), এবং তাদের সংযোগ পুরো $\Omega$। তাই countable additivity axiom দিয়ে

\[ \sum_{k\in\mathcal{X}} p_X(k) = P\Big(\bigcup_{k}\{X=k\}\Big) = P(\Omega) = 1. \qquad\blacksquare \]

লক্ষ করো: "$X$ একটা function" এই একটামাত্র ধর্মই নিশ্চিত করছে event-গুলো বিচ্ছিন্ন — ০.১-এর function-সংজ্ঞা সরাসরি কাজে লাগল।

৪.২ Binomial PMF যোগফল $1$ ★★¶

দাবি: $\displaystyle\sum_{k=0}^{n}\binom{n}{k}p^k(1-p)^{n-k}=1$।

প্রমাণ: ০.২-এর binomial theorem $(x+y)^n=\sum_{k=0}^n\binom{n}{k}x^k y^{n-k}$-তে $x=p,\;y=1-p$ বসাও:

\[ \sum_{k=0}^{n}\binom{n}{k}p^k(1-p)^{n-k} = \big(p+(1-p)\big)^n = 1^n = 1. \qquad\blacksquare \]

এই একটা লাইন দেখায় কেন binomial distribution নামটা সার্থক — এর PMF-গুলো ঠিক binomial theorem-এর পদ। ০.২ আর ২.৩-এর সেতু এখানে দৃশ্যমান।

৪.৩ Variance-এর সংক্ষিপ্ত সূত্র ★¶

দাবি: $\mathrm{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2$।

প্রমাণ: সংজ্ঞা থেকে শুরু করে বর্গ খুলি, তারপর expectation-এর linearity (§২.৪) প্রয়োগ করি (ধরা যাক $\mu=\mathbb{E}[X]$ একটা ধ্রুবক):

\[ \begin{aligned} \mathrm{Var}(X) &= \mathbb{E}\big[(X-\mu)^2\big] = \mathbb{E}\big[X^2 - 2\mu X + \mu^2\big] \\ &= \mathbb{E}[X^2] - 2\mu\,\mathbb{E}[X] + \mu^2 = \mathbb{E}[X^2] - 2\mu^2 + \mu^2 = \mathbb{E}[X^2]-\mu^2. \qquad\blacksquare \end{aligned} \]

৪.৪ Binomial mean ও Poisson PMF যোগফল ★★¶

(ক) Binomial mean $\mathbb{E}[X]=np$ (linearity-র সুন্দর প্রয়োগ): Binomial$(n,p)$ হলো $n$টা স্বাধীন Bernoulli$(p)$-র যোগফল, $X=\sum_{i=1}^n Y_i$, প্রতিটি $\mathbb{E}[Y_i]=p$। তাই linearity (§২.৪, independence লাগে না) দিয়ে:

\[ \mathbb{E}[X]=\mathbb{E}\Big[\sum_{i=1}^n Y_i\Big]=\sum_{i=1}^n\mathbb{E}[Y_i]=\sum_{i=1}^n p = np. \qquad\blacksquare \]

(এই Bernoulli-যোগ কৌশলেই variance-ও $np(1-p)$ পাওয়া যায়, তবে তাতে independence ও variance-এর additivity লাগে — Part 2.5।)

(খ) Poisson PMF যোগফল $1$: পরিচিত exponential series $\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}=e^{\lambda}$ ব্যবহার করে (০.৩-০.৪-এ Taylor series দেখা):

\[ \sum_{k=0}^{\infty}\frac{\lambda^k e^{-\lambda}}{k!} = e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^k}{k!} = e^{-\lambda}\cdot e^{\lambda} = 1. \qquad\blacksquare \]

৪.৫ Geometric CDF ও memoryless ধর্ম ★★¶

(ক) CDF-এর বদ্ধ রূপ: $P(X>k)$ মানে প্রথম $k$টা trial-ই ব্যর্থ, যার probability (independence) $(1-p)^k$। তাই

\[ P(X>k)=(1-p)^k \;\Rightarrow\; F_X(k)=P(X\le k)=1-(1-p)^k, \quad k=1,2,\dots \]

(এটা geometric series-এর যোগফল হিসেবেও পাওয়া যায়, তাই নাম "Geometric"।)

(খ) Memoryless ধর্ম ★★★: দাবি — যেকোনো $s,t\ge0$-এর জন্য $P(X>s+t \mid X>s)=P(X>t)$। প্রমাণ conditional probability (2.2)-এর সংজ্ঞা দিয়ে:

\[ P(X>s+t \mid X>s) = \frac{P(X>s+t,\;X>s)}{P(X>s)} = \frac{P(X>s+t)}{P(X>s)} = \frac{(1-p)^{s+t}}{(1-p)^s} = (1-p)^t = P(X>t). \]

(এখানে $\{X>s+t\}\subseteq\{X>s\}$, তাই joint (যৌথ) event ঠিক $\{X>s+t\}$।) $\blacksquare$ অর্থ: এতবার ব্যর্থ হয়েছ — তাতে "এবার নিশ্চয় হবে" নয়; পরবর্তী সফলতার অপেক্ষা একদম নতুন করে শুরুর মতোই। Geometric হলো একমাত্র discrete distribution যার এই ধর্ম আছে।

৪.৬ Binomial → Poisson approximation ★★★¶

দাবি (Poisson limit theorem): যদি $n\to\infty$ এবং $p\to0$ এমনভাবে যে $np\to\lambda$ স্থির থাকে, তবে Binomial$(n,p)$-এর PMF Poisson$(\lambda)$-এর PMF-এ convergent (অভিসারী) হয়।

প্রমাণ-রূপরেখা: $p=\lambda/n$ বসিয়ে Binomial PMF লিখি ও $n\to\infty$ নিই:

\[ \binom{n}{k}p^k(1-p)^{n-k} = \underbrace{\frac{n(n-1)\cdots(n-k+1)}{n^k}}_{\to\,1}\cdot\frac{\lambda^k}{k!}\cdot\underbrace{\Big(1-\frac{\lambda}{n}\Big)^{n}}_{\to\,e^{-\lambda}}\cdot\underbrace{\Big(1-\frac{\lambda}{n}\Big)^{-k}}_{\to\,1}. \]

তিনটি সীমা: (১) প্রথম গুণনীয়কে $k$টি পদ, প্রতিটি $\to1$; (২) বিখ্যাত সীমা $(1-\lambda/n)^n\to e^{-\lambda}$ (০.৩); (৩) শেষেরটি $\to1$ যেহেতু $k$ স্থির। গুণফল:

\[ \binom{n}{k}p^k(1-p)^{n-k} \;\longrightarrow\; \frac{\lambda^k e^{-\lambda}}{k!}. \qquad\blacksquare \]

ব্যবহারিক নিয়ম: $n\ge20,\;p\le0.05$ (বা $n\ge100,\;np\le10$) হলে Poisson একটা চমৎকার আসন্ন মান দেয়। এজন্যই Poisson-কে বলা হয় "law of rare events (বিরল ঘটনার নিয়ম)" — অনেক trial, প্রতিটিতে সামান্য success-probability। §৬-এর overlay চিত্রে এই convergence চোখে দেখা যায়।

৫ · কোড ল্যাব (Python)¶

প্রথমে from-scratch PMF/CDF, তারপর scipy.stats দিয়ে যাচাই, শেষে reproducible simulation। সব seed স্থির (default_rng(2025))।

৫.১ From scratch — PMF, CDF, mean, variance¶

import numpy as np
from math import comb, factorial, exp

# --- PMF গুলো সরাসরি সংজ্ঞা থেকে ---
def binom_pmf(k, n, p):
    return comb(n, k) * p**k * (1 - p)**(n - k)

def poisson_pmf(k, lam):
    return lam**k * exp(-lam) / factorial(k)

def geom_pmf(k, p):          # k = trial-সংখ্যা, k >= 1
    return (1 - p)**(k - 1) * p

# --- support-এর উপর PMF থেকে CDF, mean, variance ---
def summarize(pmf_func, support):
    ks  = np.array(support, dtype=float)
    pmf = np.array([pmf_func(int(k)) for k in ks])
    cdf = np.cumsum(pmf)
    mean = np.sum(ks * pmf)
    ex2  = np.sum(ks**2 * pmf)
    var  = ex2 - mean**2                 # §৪.৩ সূত্র
    return pmf, cdf, mean, var

# Binomial(10, 0.4)
pmf, cdf, mean, var = summarize(lambda k: binom_pmf(k, 10, 0.4), range(0, 11))
print("Binomial(10,0.4):")
print("  sum(pmf) =", round(pmf.sum(), 10))      # 1.0
print("  mean =", round(mean, 4), " (np = 4.0)")
print("  var  =", round(var, 4), " (np(1-p) = 2.4)")
print("  P(X<=3) =", round(cdf[3], 4))

আউটপুট:

Binomial(10,0.4):
  sum(pmf) = 1.0
  mean = 4.0  (np = 4.0)
  var  = 2.4  (np(1-p) = 2.4)
  P(X<=3) = 0.3823

theory-র সাথে হুবহু মিলল: $\mathbb{E}[X]=np=4$, $\mathrm{Var}(X)=np(1-p)=2.4$।

৫.২ scipy.stats দিয়ে যাচাই¶

scipy.stats-এ প্রতিটা distribution একটা object; .pmf, .cdf, .mean, .var, .rvs সব আছে।

from scipy import stats
import numpy as np

# Binomial
b = stats.binom(n=10, p=0.4)
print("scipy Binomial pmf(3) =", round(b.pmf(3), 6), "| scratch =", round(binom_pmf(3, 10, 0.4), 6))
print("scipy mean, var       =", b.mean(), b.var())

# Poisson(4): mean == var == 4
po = stats.poisson(mu=4)
print("Poisson(4) mean, var  =", po.mean(), po.var())     # 4.0 4.0
print("Poisson P(X=2)        =", round(po.pmf(2), 6), "| scratch =", round(poisson_pmf(2, 4), 6))

# Geometric(1/6): scipy-ও trial-সংখ্যা (k>=1) ব্যবহার করে
g = stats.geom(p=1/6)
print("Geometric mean        =", round(g.mean(), 4), " (1/p = 6)")
print("Geometric P(X=4)      =", round(g.pmf(4), 6), "| scratch =", round(geom_pmf(4, 1/6), 6))

# from-scratch ও scipy একমত কিনা assert দিয়ে নিশ্চিত
assert np.isclose(b.pmf(3), binom_pmf(3, 10, 0.4))
assert np.isclose(po.pmf(2), poisson_pmf(2, 4))
assert np.isclose(g.pmf(4), geom_pmf(4, 1/6))
print("✓ from-scratch ও scipy একমত")

আউটপুট:

scipy Binomial pmf(3) = 0.214991 | scratch = 0.214991
scipy mean, var       = 4.0 2.4
Poisson(4) mean, var  = 4.0 4.0
Poisson P(X=2)        = 0.146525 | scratch = 0.146525
Geometric mean        = 6.0  (1/p = 6)
Geometric P(X=4)      = 0.096451 | scratch = 0.096451
✓ from-scratch ও scipy একমত

৫.৩ Reproducible simulation — empirical বনাম theoretical¶

বড় সংখ্যক draw নিয়ে দেখি empirical relative frequency theory-র PMF-এর কাছে যায় কিনা (law of large numbers-এর ঝলক)।

import numpy as np
from scipy import stats

rng = np.random.default_rng(2025)        # স্থির seed → পুনরুৎপাদনযোগ্য
N = 100_000
n, p = 12, 0.35

samples = rng.binomial(n, p, size=N)     # N বার Binomial(12,0.35) draw
ks = np.arange(0, n + 1)
emp  = np.array([(samples == k).mean() for k in ks])   # empirical P(X=k)
theo = stats.binom.pmf(ks, n, p)                        # theoretical

print(f"{'k':>2} {'empirical':>11} {'theory':>10} {'|diff|':>9}")
for k in ks:
    print(f"{k:>2} {emp[k]:>11.4f} {theo[k]:>10.4f} {abs(emp[k]-theo[k]):>9.4f}")

print("\nempirical mean =", round(samples.mean(), 3), " theory np =", n * p)
print("empirical var  =", round(samples.var(),  3), " theory np(1-p) =", round(n*p*(1-p), 3))
print("max |emp - theory| =", round(np.max(np.abs(emp - theo)), 4))

আউটপুট (সংক্ষেপিত):

 k   empirical     theory    |diff|
 0      0.0057     0.0057    0.0001
 1      0.0375     0.0368    0.0007
 2      0.1101     0.1088    0.0013
 3      0.1951     0.1954    0.0002
 4      0.2387     0.2367    0.0020
 5      0.2022     0.2039    0.0017
 ...
empirical mean = 4.189  theory np = 4.2
empirical var  = 2.733  theory np(1-p) = 2.73
max |emp - theory| = 0.0020

$100{,}000$ draw-তে empirical ও theoretical PMF সর্বত্র $0.002$-এর মধ্যে মিলছে — এটাই §৬-এর শেষ চিত্রের সংখ্যাগত রূপ। seed স্থির থাকায় এই আউটপুট প্রতিবার একই।

৫.৪ Binomial → Poisson approximation সংখ্যায়¶

import numpy as np
from scipy import stats

lam = 4.0
ks = np.arange(0, 11)
pois = stats.poisson.pmf(ks, lam)
print(f"{'k':>2} {'Poisson':>9} {'Bin n=10':>9} {'Bin n=100':>10} {'Bin n=1000':>11}")
for k in ks:
    row = [stats.binom.pmf(k, n, lam / n) for n in (10, 100, 1000)]
    print(f"{k:>2} {pois[k]:>9.4f} {row[0]:>9.4f} {row[1]:>10.4f} {row[2]:>11.4f}")

# মোট পরম পার্থক্য n বাড়লে কমছে কিনা
for n in (10, 100, 1000):
    b = stats.binom.pmf(ks, n, lam / n)
    print(f"n={n:>4}:  sum|Binom - Poisson| = {np.sum(np.abs(b - pois)):.5f}")

আউটপুট (সংক্ষেপিত):

 k   Poisson  Bin n=10  Bin n=100  Bin n=1000
 0    0.0183    0.0060     0.0169      0.0182
 1    0.0733    0.0403     0.0703      0.0730
 2    0.1465    0.1209     0.1450      0.1464
 ...
n=  10:  sum|Binom - Poisson| = 0.25061
n= 100:  sum|Binom - Poisson| = 0.01988
n=1000:  sum|Binom - Poisson| = 0.00195

$n$ দশগুণ বাড়লে মোট পার্থক্যও মোটামুটি দশগুণ কমছে — §৪.৬-এর limit theorem সংখ্যায় নিশ্চিত।

৬ · ভিজ্যুয়ালাইজেশন¶

চিত্র ১ — চারটি core distribution-এর PMF¶

নিচে Bernoulli, Binomial, Poisson, Geometric-এর PMF bar chart। লক্ষ করো আকৃতি: Bernoulli-তে মাত্র দুটো bar; Binomial প্রায় symmetric (প্রতিসম) শিখর ($np$-এর কাছে); Poisson ডানদিকে লেজ-টানা; Geometric একঘেয়ে কমছে (সবচেয়ে বড় ভর $k=1$-এ)। প্রতিটিতে লাল ছেদরেখা mean দেখাচ্ছে।

import matplotlib
matplotlib.use("Agg")
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

fig, axes = plt.subplots(2, 2, figsize=(11, 7.4))
# (a) Bernoulli(0.3)
ax = axes[0, 0]; xs = np.array([0, 1]); pmf = stats.bernoulli.pmf(xs, 0.3)
ax.bar(xs, pmf, width=0.35, color="#2c6fbb", edgecolor="black", alpha=0.9)
ax.set_title("Bernoulli(p = 0.3)"); ax.set_xticks([0, 1]); ax.set_xlabel("k"); ax.set_ylabel("P(X = k)")
# (b) Binomial(10, 0.4)
ax = axes[0, 1]; xs = np.arange(0, 11); pmf = stats.binom.pmf(xs, 10, 0.4)
ax.bar(xs, pmf, color="#e07b39", edgecolor="black", alpha=0.9)
ax.axvline(4, color="#c0392b", ls="--", label="mean = np = 4")
ax.set_title("Binomial(n = 10, p = 0.4)"); ax.legend(fontsize=9); ax.set_xlabel("k"); ax.set_ylabel("P(X = k)")
# (c) Poisson(3)
ax = axes[1, 0]; xs = np.arange(0, 13); pmf = stats.poisson.pmf(xs, 3.0)
ax.bar(xs, pmf, color="#3a9d6e", edgecolor="black", alpha=0.9)
ax.axvline(3, color="#c0392b", ls="--", label=r"mean = $\lambda$ = 3")
ax.set_title(r"Poisson($\lambda$ = 3)"); ax.legend(fontsize=9); ax.set_xlabel("k"); ax.set_ylabel("P(X = k)")
# (d) Geometric(0.3)
ax = axes[1, 1]; xs = np.arange(1, 16); pmf = stats.geom.pmf(xs, 0.3)
ax.bar(xs, pmf, color="#7d5ba6", edgecolor="black", alpha=0.9)
ax.axvline(1/0.3, color="#c0392b", ls="--", label="mean = 1/p = 3.33")
ax.set_title("Geometric(p = 0.3)"); ax.legend(fontsize=9); ax.set_xlabel("k"); ax.set_ylabel("P(X = k)")
fig.suptitle("PMFs of four core discrete distributions", fontweight="bold")
fig.tight_layout(rect=[0, 0, 1, 0.97])
fig.savefig("../_assets/2-3-pmf-grid.png", dpi=150)

চারটি core discrete distribution-এর PMF bar chart: Bernoulli, Binomial, Poisson ও Geometric, প্রতিটিতে mean চিহ্নিত।

চিত্র ২ — PMF বনাম CDF: একটা step function¶

একই Binomial$(6,0.5)$-এর PMF (নীল দণ্ড) ও CDF (লাল ধাপ) একসাথে। CDF প্রতিটি পূর্ণসংখ্যা $k$-এ ঠিক $p_X(k)$ পরিমাণ লাফ দেয় — ভরা বিন্দু (•) লাফের পরের মান (attained, কারণ ডান-অবিচ্ছিন্ন), ফাঁকা বিন্দু (○) আগের মান। CDF $0$ থেকে শুরু হয়ে $1$-এ পৌঁছায়, কখনো কমে না — §২.৩-এর সব ধর্মের চাক্ষুষ রূপ।

import matplotlib
matplotlib.use("Agg")
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

n, p = 6, 0.5
xs = np.arange(0, n + 1)
pmf = stats.binom.pmf(xs, n, p); cdf = stats.binom.cdf(xs, n, p)
fig, ax = plt.subplots(figsize=(8.6, 4.8))
ax.vlines(xs, 0, pmf, color="#2c6fbb", lw=2.2, alpha=0.55, label="PMF  p(k) = P(X = k)")
ax.plot(xs, pmf, "o", color="#2c6fbb", ms=6, alpha=0.7)
x_ext = np.concatenate(([-1], xs, [n + 1])); F_ext = np.concatenate(([0.], cdf, [1.]))
ax.step(x_ext, F_ext, where="post", color="#c0392b", lw=2.0, label=r"CDF  F(x) = P(X $\leq$ x)")
ax.plot(xs, cdf, "o", color="#c0392b", ms=6)
ax.plot(xs, np.concatenate(([0.], cdf[:-1])), "o", mfc="white", mec="#c0392b", ms=6)
ax.set_xticks(xs); ax.set_xlabel("x"); ax.set_ylabel("probability")
ax.set_title("PMF vs CDF — Binomial(n = 6, p = 0.5)")
ax.legend(loc="center right", fontsize=9.5)
fig.tight_layout(); fig.savefig("../_assets/2-3-cdf-step.png", dpi=150)

$Binomial(6, 0.5)-এর PMF দণ্ড ও CDF step function একসাথে; প্রতিটি লাফের উচ্চতা সংশ্লিষ্ট PMF-এর মান, CDF ডান-অবিচ্ছিন্ন ও $1$-এ শেষ।$

চিত্র ৩ — Binomial → Poisson approximation¶

$\lambda=np=4$ স্থির রেখে $n$ বাড়ালে ($n=10,25,100$) Binomial-এর bar ক্রমশ Poisson$(4)$-এর সবুজ বক্ররেখার সাথে মিশে যায়। $n=100$-এ পার্থক্য প্রায় অদৃশ্য — §৪.৬-এর limit theorem-এর চাক্ষুষ প্রমাণ। এটাই কেন বিরল-ঘটনা (large $n$, small $p$) Binomial-কে Poisson দিয়ে আসন্ন করা যায়।

import matplotlib
matplotlib.use("Agg")
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

fig, axes = plt.subplots(1, 3, figsize=(13.5, 4.4), sharey=True)
lam = 4.0; xs = np.arange(0, 14); pois = stats.poisson.pmf(xs, lam)
for ax, (n, p) in zip(axes, [(10, lam/10), (25, lam/25), (100, lam/100)]):
    ax.bar(xs, stats.binom.pmf(xs, n, p), color="#e07b39", edgecolor="black",
           alpha=0.75, label=f"Binomial(n={n}, p={p:.3g})")
    ax.plot(xs, pois, "o-", color="#3a9d6e", lw=1.8, ms=5, label=r"Poisson($\lambda$ = 4)")
    ax.set_title(f"n = {n},  p = {p:.3g}   (np = 4)"); ax.set_xlabel("k"); ax.legend(fontsize=8.5)
axes[0].set_ylabel("P(X = k)")
fig.suptitle("Binomial to Poisson: n grows with np fixed", fontweight="bold")
fig.tight_layout(rect=[0, 0, 1, 0.95]); fig.savefig("../_assets/2-3-binom-poisson.png", dpi=150)

তিনটি প্যানেলে Binomial(n, λ/n)-এর bar ও Poisson(4)-এর বক্ররেখা; n=10, 25, 100 — n বাড়লে Binomial Poisson-এর দিকে অভিসারী।

চিত্র ৪ — Simulation বনাম theoretical PMF¶

বাঁদিকে Binomial$(12,0.35)$, ডানে Poisson$(5)$ — প্রতিটিতে $50{,}000$ বার simulation-এর empirical frequency (নীল/সবুজ) আর theoretical PMF (কমলা/বেগুনি) পাশাপাশি। দুটো প্রায় অভিন্ন: যথেষ্ট নমুনায় empirical frequency theoretical probability-র দিকে যায় (law of large numbers, Part III)। এটাই §৫.৩-এর সংখ্যাগত ফলের ছবি।

import matplotlib
matplotlib.use("Agg")
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

rng = np.random.default_rng(2025); N = 50_000; w = 0.42
fig, axes = plt.subplots(1, 2, figsize=(12, 4.6))
# Binomial
ax = axes[0]; n, p = 12, 0.35; s = rng.binomial(n, p, N); xs = np.arange(0, n + 1)
emp = np.array([(s == k).mean() for k in xs]); theo = stats.binom.pmf(xs, n, p)
ax.bar(xs - w/2, emp,  width=w, color="#2c6fbb", alpha=0.85, label=f"simulation ({N:,})")
ax.bar(xs + w/2, theo, width=w, color="#e07b39", alpha=0.9,  label="theoretical PMF")
ax.set_title(f"Binomial(n={n}, p={p}) — sim vs theory"); ax.set_xticks(xs); ax.legend(fontsize=9)
ax.set_xlabel("k"); ax.set_ylabel("relative frequency / P(X = k)")
# Poisson
ax = axes[1]; lam = 5.0; s = rng.poisson(lam, N); xs = np.arange(0, 16)
emp = np.array([(s == k).mean() for k in xs]); theo = stats.poisson.pmf(xs, lam)
ax.bar(xs - w/2, emp,  width=w, color="#3a9d6e", alpha=0.85, label=f"simulation ({N:,})")
ax.bar(xs + w/2, theo, width=w, color="#7d5ba6", alpha=0.9,  label="theoretical PMF")
ax.set_title(r"Poisson($\lambda$ = 5) — sim vs theory"); ax.legend(fontsize=9)
ax.set_xlabel("k"); ax.set_ylabel("relative frequency / P(X = k)")
fig.suptitle("Empirical frequencies track the PMF", fontweight="bold")
fig.tight_layout(rect=[0, 0, 1, 0.95]); fig.savefig("../_assets/2-3-sim-vs-theory.png", dpi=150)

Binomial(12,0.35) ও Poisson(5)-এর জন্য 50,000-draw simulation-এর empirical frequency বনাম theoretical PMF; দুটো প্রায় অভিন্ন।

৭ · অনুশীলনী¶

প্রতিটি প্রশ্নে difficulty: ★ সহজ, ★★ মাঝারি, ★★★ কঠিন। পূর্ণ সমাধান: _solutions/02-03-random-variables-discrete-solutions.md।

৭.১ Conceptual (ধারণাগত)¶

Q1 (★) নিচের কোনগুলো discrete random variable, ব্যাখ্যা করো: (ক) একটা দিনে কোনো দোকানে আসা ক্রেতার সংখ্যা; (খ) একজন মানুষের ঠিক উচ্চতা; (গ) ১০ বার coin toss-এ head-সংখ্যা; (ঘ) একটা bus আসতে অপেক্ষার সময় (মিনিটে)। Hint: সম্ভাব্য মানগুলো গণনাযোগ্য (countable) কিনা দেখো।

Q2 (★) $X:\Omega\to\mathbb{R}$ random variable-কে কেন একটা function বলা হয়, ০.১-এর সংজ্ঞার সাথে মিলিয়ে এক-দুই বাক্যে লেখো। "$X=2$" আসলে কোন গাণিতিক বস্তু (object) বোঝায়? Hint: function = এক set-এর প্রতিটি উপাদানের জন্য আরেক set-এ ঠিক একটা মান; "$X=2$" একটা subset।

Q3 (★★) একটা বন্ধু বলল "যেহেতু Poisson distribution-এ mean $=$ variance, তাই সব count data Poisson দিয়ে model করা যায়।" এই যুক্তির ভুল কোথায়? কোন distribution তখন বেশি উপযুক্ত? Hint: §২.৬ Negative Binomial; overdispersion (variance > mean)।

৭.২ Computational (গণনামূলক)¶

Q4 (★) একটা biased coin-এ $P(\text{head})=0.7$, একবার ছোড়া হচ্ছে; $X=1$ যদি head, নাহলে $0$। (ক) PMF লেখো, (খ) $\mathbb{E}[X]$ ও $\mathrm{Var}(X)$ বের করো। Hint: Bernoulli$(0.7)$; §২.৫।

Q5 (★★) §৩.৩-এর call center-এ ঘণ্টায় গড়ে $\lambda=4$ call। (ক) ঠিক $5$টা call আসার probability? (খ) $2$টার বেশি call আসার probability? (গ) যদি এখন আধ ঘণ্টা ধরো, সেই ব্যবধির জন্য $\lambda'$ কত, এবং সেই আধ ঘণ্টায় কোনো call না আসার probability কত? Hint: (খ) $P(X>2)=1-P(X\le2)$; (গ) Poisson rate সময়ের সাথে সমানুপাতিক, $\lambda'=2$।

Q6 (★★) একটা পরীক্ষায় প্রতিটা প্রশ্নের সঠিক উত্তরের probability স্বাধীনভাবে $p=0.6$। (ক) $8$টা প্রশ্নের মধ্যে ঠিক $5$টা সঠিক হওয়ার probability? (খ) গড়ে কয়টা সঠিক হবে ও তার standard deviation কত? (গ) প্রথম ভুল উত্তর $4$নং প্রশ্নে হওয়ার probability? Hint: (ক)(খ) Binomial$(8,0.6)$; (গ) Geometric — "ভুল" কে success ধরো, $p_{\text{fail}}=0.4$।

৭.৩ Proof-based (প্রমাণভিত্তিক)¶

Q7 (★★) Geometric$(p)$-এর জন্য §৪.৪-এর exponential-series কৌশলের অনুরূপ পথে দেখাও যে $\sum_{k=1}^{\infty}(1-p)^{k-1}p = 1$। Hint: geometric series $\sum_{j=0}^{\infty}r^j = 1/(1-r)$ যেখানে $r=1-p$।

Q8 (★★★) Linearity of expectation (§২.৪) ধরে নিয়ে, $X\sim$ Binomial$(n,p)$-কে $n$টা স্বাধীন Bernoulli$(p)$-র যোগফল $X=\sum_{i=1}^n Y_i$ হিসেবে লিখে প্রমাণ করো $\mathbb{E}[X]=np$ (§৪.৪ক)। তারপর ব্যাখ্যা করো কেন $\mathrm{Var}(X)=np(1-p)$ পেতে অতিরিক্ত একটা ধর্ম (independence) লাগে যেটা mean-এর জন্য লাগেনি। Hint: mean-এ linearity যথেষ্ট; variance-এর additivity শুধু independent হলে খাটে (Part 2.5)।

৭.৪ Coding (কোডিং)¶

Q9 (★★) একটা function discrete_summary(pmf_dict) লেখো যা একটা dict (key = মান $k$, value = $p_X(k)$) নিয়ে ফেরত দেয় $(\text{sum}, \mathbb{E}[X], \mathrm{Var}(X))$। প্রথমে assert করো যোগফল $\approx1$। ছক্কার uniform PMF ({1:1/6, ..., 6:1/6})-তে চালিয়ে $\mathbb{E}[X]=3.5$, $\mathrm{Var}(X)=35/12\approx2.9167$ পাও কিনা দেখো। Hint: $\mathrm{Var}=\sum k^2 p_X(k) - (\sum k\,p_X(k))^2$ (§৪.৩)।

Q10 (★★★) numpy-র default_rng(0) দিয়ে Geometric$(p=0.2)$ থেকে $100{,}000$টা নমুনা টানো (rng.geometric(0.2, size=...))। (ক) empirical mean ও variance বের করে theory ($1/p=5$, $(1-p)/p^2=20$)-র সাথে মেলাও। (খ) memoryless ধর্ম যাচাই করো: নমুনা থেকে empirical-ভাবে $P(X>5+3 \mid X>5)$ আর $P(X>3)$ হিসাব করে দেখো প্রায় সমান কিনা। Hint: (খ) s[s>5] থেকে কতগুলো >8 তা গোনো; আলাদাভাবে সব নমুনায় >3-এর অনুপাত।

৮ · সারসংক্ষেপ ও সংযোগ¶

যা শিখলাম (recap):

Random variable $X:\Omega\to\mathbb{R}$ একটা function (০.১) — outcome-কে সংখ্যায় পাঠায়; "$X=k$" আসলে একটা event।
PMF $p_X(k)=P(X=k)$: অঋণাত্মক, যোগফল $1$। CDF $F_X(x)=P(X\le x)$: অ-হ্রাসমান step function, $0\to1$, ডান-অবিচ্ছিন্ন। সম্পর্ক: $p_X(k)=F_X(k)-F_X(k^-)$।
Expectation $\mathbb{E}[X]=\sum k\,p_X(k)$ (রৈখিক); Variance $\mathrm{Var}(X)=\mathbb{E}[X^2]-(\mathbb{E}[X])^2$।

চারটি core distribution (মুখস্থ-যোগ্য ছক):

Distribution	সৃষ্টিগল্প	PMF	Mean	Variance
Bernoulli$(p)$	একটা হ্যাঁ/না	$p^k(1-p)^{1-k},\;k\in\{0,1\}$	$p$	$p(1-p)$
Binomial$(n,p)$	$n$ স্বাধীন trial-এ success	$\binom{n}{k}p^k(1-p)^{n-k}$	$np$	$np(1-p)$
Poisson$(\lambda)$	ব্যবধিতে বিরল ঘটনা	$\dfrac{\lambda^k e^{-\lambda}}{k!}$	$\lambda$	$\lambda$
Geometric$(p)$	প্রথম success-এর trial	$(1-p)^{k-1}p,\;k\ge1$	$1/p$	$(1-p)/p^2$

আরও: Negative Binomial$(r,p)$ ($r$-তম success, mean $r/p$); Hypergeometric (without-replacement sampling)।

মূল সম্পর্কগুলো: Bernoulli $=$ Binomial$(1,p)$; Geometric $=$ Negative Binomial$(1,p)$; Binomial$(n,p)\xrightarrow{n\to\infty,\,np\to\lambda}$ Poisson$(\lambda)$ (§৪.৬)। Poisson-এর স্বাক্ষর: mean $=$ variance। Geometric-এর স্বাক্ষর: memoryless।

পূর্ববর্তী সংযোগ: ০.১-এর function ধারণাই random variable-এর সংজ্ঞা; ০.২-এর $\binom{n}{k}$ ও binomial theorem সরাসরি Binomial distribution গড়ে ও তার PMF-যোগফল $1$ প্রমাণ করে (§৪.২)। ০.৩-০.৪-এর Taylor series ($e^\lambda$, $(1-\lambda/n)^n\to e^{-\lambda}$) Poisson-এর ভিত্তি। 2.1-এর axioms থেকেই PMF-এর দুই ধর্ম আসে (§৪.১), আর 2.2-এর conditional probability দিয়ে memoryless প্রমাণ হয় (§৪.৫)।

পরবর্তী সংযোগ (2.4 Continuous Distributions): পরের অধ্যায়ে support একটা interval হয়ে যাবে; PMF-এর জায়গায় আসবে probability density function (PDF), আর যোগফল $\sum$-এর জায়গায় integral $\int$ (০.৪)। CDF ধারণাটা একই থাকবে — শুধু step function-এর বদলে মসৃণ বক্ররেখা। সেখানে Uniform, Exponential (Geometric-এর continuous সহোদর, এটাও memoryless), Normal, Gamma, Beta দেখবে।

Statistics-এ গন্তব্য (source pointer): এই PMF-গুলো Part IV-এ likelihood ও maximum likelihood estimation-এর কাঁচামাল — data দেখে $p$ বা $\lambda$ আন্দাজ করা। Part V-এ Binomial → logistic regression, Poisson → Poisson/count regression-এর ভিত্তি হবে। বিস্তারিত প্রমাণ Rice Ch.2, Wasserman Ch.2 ও Fernández-Granda Ch

\(k\)	\(\binom{3}{k}\)	\(p_X(k)\)	\(F_X(k)=P(X\le k)\)
\(0\)	\(1\)	\(1/8 = 0.125\)	\(0.125\)
\(1\)	\(3\)	\(3/8 = 0.375\)	\(0.500\)
\(2\)	\(3\)	\(3/8 = 0.375\)	\(0.875\)
\(3\)	\(1\)	\(1/8 = 0.125\)	\(1.000\)

Distribution	সৃষ্টিগল্প	PMF	Mean	Variance
Bernoulli\((p)\)	একটা হ্যাঁ/না	\(p^k(1-p)^{1-k},\;k\in\{0,1\}\)	\(p\)	\(p(1-p)\)
Binomial\((n,p)\)	\(n\) স্বাধীন trial-এ success	\(\binom{n}{k}p^k(1-p)^{n-k}\)	\(np\)	\(np(1-p)\)
Poisson\((\lambda)\)	ব্যবধিতে বিরল ঘটনা	\(\dfrac{\lambda^k e^{-\lambda}}{k!}\)	\(\lambda\)	\(\lambda\)
Geometric\((p)\)	প্রথম success-এর trial	\((1-p)^{k-1}p,\;k\ge1\)	\(1/p\)	\((1-p)/p^2\)