7.3 — Measurable Maps ও Random Variables (যে ফাংশনদের পরিমাপ করা যায়)¶

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶

১.১ যেখানে 7.2 থেমেছিল — আর এই অধ্যায়ের নতুন বস্তু¶

আগের অধ্যায়ে (7.2) আমরা অনেক পরিশ্রমে একটা দৃঢ় বস্তু গড়েছিলাম — probability space $(\Omega,\mathcal F,\mathbb P)$: একটা নমুনাক্ষেত্র $\Omega$, ঘটনার একটা σ-algebra $\mathcal F$ (complement ও গণনাযোগ্য union-বদ্ধ পরিবার), আর তার উপর একটা measure $\mathbb P$ যা প্রতিটি ঘটনাকে $[0,1]$-এ একটা আকার দেয়। Carathéodory extension আর π–λ uniqueness মিলিয়ে আমরা নিশ্চিত হয়েছিলাম — এই মঞ্চটা সুসংগত ও unambiguous।

কিন্তু এই মঞ্চে এখনও একটা প্রধান চরিত্র অনুপস্থিত। বাস্তব পরিসংখ্যানে আমরা $\Omega$-এর কোনো বিমূর্ত ফলাফল $\omega$ নিয়ে সরাসরি কাজ করি না — আমরা কাজ করি সংখ্যা নিয়ে: একটা পরিমাপ, একটা গণনা, একটা উচ্চতা, একটা ক্ষতি। অর্থাৎ আমরা প্রতিটি ফলাফল $\omega$-কে একটা বাস্তব সংখ্যায় অনুবাদ করি — এটাই random variable (দৈব চলক)। 2.3-এ আমরা একে অনানুষ্ঠানিকভাবে চিনেছিলাম: "একটা random variable মানে ফলাফলকে সংখ্যায় রূপান্তরের নিয়ম"। কিন্তু সেই অধ্যায়ে আমরা একটা সূক্ষ্ম প্রশ্ন এড়িয়ে গিয়েছিলাম, যা এখন আর এড়ানো চলে না।

মূল উপলব্ধি: একটা random variable আসলে কোনো রহস্যময় নতুন বস্তু নয় — সে স্রেফ একটা ফাংশন

\[ X:\Omega\to\mathbb R, \qquad \omega\mapsto X(\omega). \]

প্রতিটি ফলাফল $\omega$ ঢোকে, একটা সংখ্যা $X(\omega)$ বেরোয়। কিন্তু $\Omega$ থেকে $\mathbb R$-এ যাওয়া সব ফাংশন কি random variable হিসেবে চলবে? এই প্রশ্নই এ অধ্যায়ের সূচনা — আর উত্তরটা "না", এবং সেই "না"-এর পেছনের শর্তটাই measurability।

এক বাক্যে সূচনা। 7.2 দিয়েছিল মঞ্চ $(\Omega,\mathcal F,\mathbb P)$; এই অধ্যায় সেই মঞ্চে মূল চরিত্রটিকে নামায় — random variable হলো একটা ফাংশন $X:\Omega\to\mathbb R$, আর প্রশ্ন: কোন ফাংশনগুলো বৈধ?

১.২ কেন প্রতিটি ফাংশন চলবে না — measurability-র জন্ম¶

random variable নিয়ে আমরা যা-ই করতে চাই, তার গোড়ায় একটা দাবি আছে: আমরা জিজ্ঞেস করতে চাই সম্ভাব্যতা-প্রশ্ন —

\[ \mathbb P(X\le x)=?\qquad \mathbb P(a< X\le b)=?\qquad \mathbb P(X\in B)=? \]

এগুলোই তো random variable-এর গোটা উপযোগিতা — CDF, density, প্রত্যাশা, সব এদের উপরই দাঁড়ায়। কিন্তু একটু থামি: $\mathbb P(\cdot)$ তো শুধু ঘটনার উপর সংজ্ঞায়িত — অর্থাৎ $\mathcal F$-এর সদস্যদের উপর (7.2)। তাহলে "$\mathbb P(X\in B)$" লিখতে গেলে আগে নিশ্চিত হতে হবে যে "$X\in B$" নিজে একটা ঘটনা, অর্থাৎ $\mathcal F$-এর সদস্য।

"$X\in B$" বলতে আসলে কোন set বোঝায়? ঠিক সেই ফলাফলগুলোর সংগ্রহ যাদের $X$-মান $B$-তে পড়ে:

\[ \{X\in B\}\;=\;\{\omega\in\Omega:X(\omega)\in B\}\;=\;X^{-1}(B), \]

অর্থাৎ $B$-এর preimage (পূর্বপ্রতিচ্ছবি — $X$ দিয়ে $B$-তে পৌঁছানো সব input)। তাহলে দাবিটা দাঁড়াল:

\[ \boxed{\ \mathbb P(X\in B)\text{ অর্থবহ হতে হলে }X^{-1}(B)\in\mathcal F\ } \]

এবং আমরা চাই এটা শুধু একটা-দুটো $B$-র জন্য নয়, যথেষ্ট-বড় একটা শ্রেণির সব $B$-র জন্য সত্য হোক — যাতে $(-\infty,x]$, $(a,b]$, open set, এবং তাদের থেকে গড়া সবকিছু ধরা পড়ে। সেই "যথেষ্ট-বড় শ্রেণি" হলো ঠিক Borel $\mathcal B(\mathbb R)$ (7.2)। আর "$X^{-1}(B)\in\mathcal F$ সব Borel $B$-র জন্য" — এই শর্তটারই নাম measurability (পরিমাপযোগ্যতা)।

এখন স্পষ্ট কেন সব ফাংশন চলবে না: যদি কোনো ফাংশন $X$-এর জন্য কোনো Borel $B$ পাওয়া যায় যার preimage $X^{-1}(B)$ মোটেই $\mathcal F$-এর সদস্য নয় (Vitali-ধরনের একটা "অগম্য" set, 7.2-এর §১.১ মনে করুন), তবে "$\mathbb P(X\in B)$" বাক্যটাই অর্থহীন — $\mathbb P$ ওই set-এ সংজ্ঞায়িতই নয়। এমন ফাংশনকে random variable বলা যায় না। measurability হলো ঠিক সেই ছাঁকনি যা কেবল সেই ফাংশনদের ছাড়ে যাদের নিয়ে সম্ভাব্যতা-প্রশ্ন তোলা যায়।

এক বাক্যে measurability। $\mathbb P$ শুধু ঘটনায় (∈ $\mathcal F$) সংজ্ঞায়িত, তাই $\mathbb P(X\in B)$ অর্থবহ হতে হলে $\{X\in B\}=X^{-1}(B)$-কে ঘটনা হতে হবে — "সব Borel $B$-র জন্য $X^{-1}(B)\in\mathcal F$" এই শর্তই measurability, এবং এটিই বৈধ random variable-এর ছাঁকনি।

১.৩ তিনটি প্রাপ্তি — তথ্য, বণ্টন, ও integration-এর সেতু¶

measurability-র সংজ্ঞাটা প্রথমে কারিগরি মনে হলেও, এর হাত ধরে তিনটে গভীর ও কাজের বস্তু আসে — এই অধ্যায়ের আসল পুরস্কার, আর Part VII-এর বাকিটার বীজ।

প্রাপ্তি ১ — $\sigma(X)$: "$X$-এর মধ্যে কতটা তথ্য"। একটা random variable $X$ পর্যবেক্ষণ করলে আমরা কেবল কিছু প্রশ্নের উত্তর জানতে পারি — যেমন "$X\le 3$ কি?" — কিন্তু $\omega$-এর অন্য সূক্ষ্ম খুঁটিনাটি জানতে পারি না। $X$ যেসব ঘটনাকে "দৃশ্যমান" করে, তাদের সবার সংগ্রহই generated σ-algebra $\sigma(X)=X^{-1}(\mathcal B)$ — $X$-কে measurable করা সবচেয়ে ছোট σ-algebra, অর্থাৎ "$X$-এ ধরা তথ্যের পরিমাণ"-এর গাণিতিক রূপ। এই "σ-algebra = তথ্য" ছবিটাই পরে conditional expectation (7.7 — "$\sigma(X)$ জানা থাকলে প্রত্যাশা") ও filtration (7.8 — সময়ের সঙ্গে বেড়ে চলা তথ্য)-এর ভিত্তি।
প্রাপ্তি ২ — law হিসেবে pushforward। এতদিন "$X$-এর বণ্টন" বলতে আমরা pmf/pdf-এর অনানুষ্ঠানিক ছবি বুঝতাম (2.3–2.4)। এখন একে rigorous করি: $X$ তার মাধ্যমে $\Omega$-র উপরকার ভর $\mathbb P$-কে $\mathbb R$-এ "ঠেলে দেয়" (push forward) — তৈরি হয় $(\mathbb R,\mathcal B)$-এর উপর একটা নতুন probability measure

$$ P_X(B)\;=\;\mathbb P\big(X^{-1}(B)\big)\;=\;\mathbb P(X\in B), $$

যার নাম law বা distribution (বণ্টন) — এটাই pushforward / image measure (সম্মুখ-ঠেলা পরিমাপ)। এবং $F_X(x)=P_X((-\infty,x])$ রূপে CDF আবির্ভূত হয়; 7.2-এর π–λ uniqueness বলে দেয় — CDF একাই এই law-কে সম্পূর্ণ নির্ধারণ করে।

প্রাপ্তি ৩ — simple-function সেতু (integration-এর দিকে)। measurable ফাংশনদের সবচেয়ে শক্তিশালী structural সত্য: প্রতিটি অঋণাত্মক measurable $f$-কে simple function ($s=\sum a_i\mathbf 1_{A_i}$, কেবল কয়েকটা মান নেয়) দিয়ে নিচ থেকে ক্রমবর্ধমানভাবে ছোঁয়া যায় — $f_n\uparrow f$, একটা "dyadic সিঁড়ি"। এই approximation theorem-ই হবে পরের অধ্যায়ের (7.4) Lebesgue integral-এর সরাসরি প্রবেশদ্বার: integral প্রথমে simple function-এ সংজ্ঞায়িত (সহজ — ভর × আকার), তারপর limit নিয়ে সব measurable $f$-এ প্রসারিত।

এক বাক্যে প্রাপ্তি। measurability তিন উপহার দেয় — $\sigma(X)$ ("$X$-এর তথ্য", ⇒ 7.7/7.8), pushforward law $P_X$ ("বণ্টন rigorous", CDF ⟺ law via π–λ), আর simple-function approximation $f_n\uparrow f$ (⇒ 7.4-এর Lebesgue integral)।

১.৪ এই অধ্যায়ের পথরেখা¶

§২ সব মূল ধারণার precise সংজ্ঞা — measurable map ও random variable; check-on-generator ও good-sets principle; $\sigma(X)$ ও তথ্য; Borel function ও continuous⇒Borel; closure properties (যোগ/গুণ/$\max$/$\sup$/$\limsup$/$\lim$ ও composition); pushforward measure / law / CDF correspondence; simple function; approximation theorem; এবং a.e. সমতা — প্রতিটির স্বজ্ঞাসহ, ভারী প্রমাণ §৪-এ স্থগিত রেখে।
§৪ ভারী প্রমাণ — good-sets principle ও তা থেকে check-on-generator-এর বৈধতা; continuous ⇒ Borel; closure-এর derivation ($\{f+g<a\}$-কে rational দিয়ে খোলা, $\{\sup_n f_n\le a\}=\bigcap_n\{f_n\le a\}$, $\limsup$/$\lim$-এর measurability); $\sigma(X)$ যে ক্ষুদ্রতম তা; $P_X$ যে probability measure; law ⟺ CDF (π–λ দিয়ে); এবং approximation theorem-এর dyadic-staircase নির্মাণ।
§৫–৬ simulation ও চিত্র (seed 20260619) — 7-3-dyadic-approximation (অঋণাত্মক $f$-এর নিচে dyadic simple সিঁড়ি $f_n\uparrow f$ কীভাবে চেপে ওঠে), 7-3-preimage-measurability ($X^{-1}(B)$-কে $\{X\in B\}$ ঘটনা হিসেবে, বিশেষত $X^{-1}((-\infty,x])$), 7-3-sigma-generated-by-X ($\sigma(X)=X^{-1}(\mathcal B)$-কে "$X$-এর তথ্য-পরিবার" হিসেবে), এবং 7-3-pushforward-law ($\Omega$-র ভরকে $\mathbb R$-এ ঠেলে $P_X$ ও তার CDF তৈরি)।

এর পরে Part VII এগোয়: 7.4 এই measurable ফাংশনদের উপরই Lebesgue integral $\int X\,d\mu$ গড়ে (approximation theorem-কে ভিত্তি করে) এবং MCT/Fatou/DCT প্রমাণ করে; 7.5 $L^p$ space, Hilbert space ও Radon–Nikodym theorem; 7.6 σ-algebra-দের independence; 7.7 এই $\sigma(X)$-কেই "শর্তসাপেক্ষ তথ্য" ধরে conditional expectation; 7.8 filtration ও martingale — শেষে rigorous CLT-র দিকে।

এক বাক্যে পথরেখা। §২ precise সংজ্ঞা → §৪ প্রমাণ → §৫–৬ চার চিত্র (seed 20260619); আর এই measurable-ফাংশন ভিত্তির উপর Part VII গড়ে 7.4 (Lebesgue integral) → 7.7 ($\sigma(X)$-ভিত্তিক conditional expectation) → 7.8 (filtration), rigorous CLT-র পথে।

২ · মূল ধারণা ও সংজ্ঞা¶

এই বিভাগে এ অধ্যায়ের সব formal বস্তুর precise সংজ্ঞা দিই — প্রতিটি প্রতীক প্রথম ব্যবহারেই খুলে। কাঠামো §১-এর সুতো ধরে: প্রথমে কোন ফাংশন বৈধ (measurable map, random variable, check-on-generator — ২.১–২.৩); তারপর তথ্যের ভাষা ($\sigma(X)$ — ২.৪); তারপর কোন ফাংশন measurable (Borel function, continuous⇒Borel, closure — ২.৫–২.৬); তারপর বণ্টন rigorous (pushforward / law / CDF — ২.৭); শেষে integration-এর সেতু (simple function ও approximation theorem, a.e. — ২.৮–২.৯)। ভারী প্রমাণগুলো §৪-এ — এখানে কেবল বিবৃতি ও স্বজ্ঞা, স্পষ্ট forward pointer সহ।

২.১ Preimage — যে ভাষায় measurability লেখা হয়¶

সব সংজ্ঞার গোড়ায় একটাই অপারেশন — preimage (পূর্বপ্রতিচ্ছবি)। একটা ফাংশন $f:\Omega\to E$ ও target-এর একটা subset $B\subseteq E$ দিলে,

\[ f^{-1}(B)\;:=\;\{\omega\in\Omega:f(\omega)\in B\}\;\subseteq\;\Omega \]

হলো ঠিক সেই input-গুলো যাদের output $B$-তে পড়ে। (সাবধান: এখানে $f^{-1}$ মানে inverse function নয় — $f$ উল্টানো-যোগ্য না হলেও preimage সবসময় সংজ্ঞায়িত; এটা শুধু একটা set।)

preimage-কে measurability-র ভাষা বানায় তার একটা অসাধারণ গুণ: সে set-অপারেশনের সঙ্গে নিখুঁতভাবে অদলবদল করে (commute) — যেকোনো (এমনকি গণনাযোগ্য-অসীম) সংগ্রহের জন্য

\[ f^{-1}\!\Big(\bigcup_i B_i\Big)=\bigcup_i f^{-1}(B_i),\qquad f^{-1}\!\Big(\bigcap_i B_i\Big)=\bigcap_i f^{-1}(B_i),\qquad f^{-1}(B^c)=\big(f^{-1}(B)\big)^c. \]

অর্থাৎ preimage union, intersection ও complement — তিনটেই অবিকৃত রাখে। ঠিক এই তিন সংরক্ষণই পরে good-sets principle (২.৩) ও closure-প্রমাণগুলোকে (§৪) প্রায় আপনাআপনি চালিয়ে দেবে — কারণ σ-algebra-র axiom-ও তো এই তিন অপারেশন নিয়েই।

এক বাক্যে। $f^{-1}(B)=\{f\in B\}$ হলো $B$-তে অবতরণকারী input-দের set, আর সে union/intersection/complement সংরক্ষণ করে — এই সংরক্ষণই গোটা অধ্যায়ের কারিগরি ইঞ্জিন।

২.২ Measurable Map ও Random Variable — কেন্দ্রীয় সংজ্ঞা¶

এবার মূল সংজ্ঞা। দুটো measurable space নিই — $(\Omega,\mathcal F)$ (source, 7.2-এর σ-algebra) ও $(E,\mathcal E)$ (target, তার নিজের σ-algebra)।

সংজ্ঞা (measurable map, পরিমাপযোগ্য চিত্রণ)। একটা ফাংশন $f:\Omega\to E$-কে $\mathcal F\text{–}\mathcal E$ measurable বলা হয় যদি target-এর প্রতিটি measurable set-এর preimage source-এ measurable হয়: $$ f^{-1}(B)\in\mathcal F\qquad\text{সব }B\in\mathcal E\text{-র জন্য}. $$ (একে $f:(\Omega,\mathcal F)\to(E,\mathcal E)$ লেখা হয়।)

বিশেষ ও সবচেয়ে গুরুত্বপূর্ণ ক্ষেত্রে target হলো বাস্তব রেখা তার Borel σ-algebra সহ — $(E,\mathcal E)=(\mathbb R,\mathcal B)$, যেখানে $\mathcal B=\mathcal B(\mathbb R)$ হলো 7.2-এর Borel σ-algebra ($=\sigma(\text{open sets})$)।

সংজ্ঞা (random variable, দৈব চলক)। একটা probability space $(\Omega,\mathcal F,\mathbb P)$-এর উপর একটা random variable হলো একটা measurable map $$ X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B), \qquad\text{অর্থাৎ}\qquad X^{-1}(B)\in\mathcal F\ \ \forall B\in\mathcal B. $$ এই শর্ত মানার সুবাদেই প্রতিটি Borel $B$-র জন্য $\{X\in B\}=X^{-1}(B)$ একটা ঘটনা, তাই $\mathbb P(X\in B)$ সর্বদা অর্থবহ।

দুটো টীকা স্বচ্ছতার জন্য:

পরিভাষা। $\Omega$-তে কোনো probability না বসিয়ে কেবল $(\Omega,\mathcal F)$-এর কাঠামোয় measurable হলে অনেকে $X$-কে measurable function বলেন; "random variable" শব্দটা সাধারণত একটা probability measure $\mathbb P$-এর প্রেক্ষাপটে ব্যবহৃত। গাণিতিক শর্তটা একই — measurability।
বর্ধিত মান। অনেক সময় $X$ মান নেয় $\overline{\mathbb R}=[-\infty,+\infty]$-এ (যেমন $\sup_n X_n$ অসীম হতে পারে); তখন target $(\overline{\mathbb R},\mathcal B(\overline{\mathbb R}))$, আর $X$-কে বলা হয় extended-valued (বর্ধিত-মান) random variable। সংজ্ঞা অপরিবর্তিত।

এক বাক্যে। random variable = measurable map $X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$, অর্থাৎ প্রতিটি Borel $B$-র preimage $X^{-1}(B)$ একটা ঘটনা — এটিই $\mathbb P(X\in B)$-কে সর্বদা অর্থবহ করে।

২.৩ Check-on-Generator ও Good-Sets Principle — সংজ্ঞা যাচাইযোগ্য করার চাবি¶

সংজ্ঞাটা শুনতে ভয়ংকর: "প্রতিটি Borel $B$-র জন্য $X^{-1}(B)\in\mathcal F$" — কিন্তু Borel set অগণিত ও বিদঘুটে রকমের জটিল হতে পারে; এক-এক করে সবার preimage যাচাই অসম্ভব। সৌভাগ্যবশত যাচাই করতে হয় না — একটামাত্র সহজ generator-পরিবারে দেখলেই যথেষ্ট।

উপপাদ্য (check-on-generator, জনিত্রে যাচাই — বিবৃতি)। ধরা যাক target σ-algebra $\mathcal E=\sigma(\mathcal G)$, অর্থাৎ $\mathcal G$ হলো $\mathcal E$-এর একটা generator (7.2)। তাহলে $f:(\Omega,\mathcal F)\to(E,\mathcal E)$ measurable iff কেবল generator-এর সদস্যদের preimage measurable: $$ f^{-1}(G)\in\mathcal F\qquad\text{সব }G\in\mathcal G\text{-র জন্য}. $$

random variable-এর ক্ষেত্রে $\mathcal B=\sigma\big(\{(-\infty,x]:x\in\mathbb R\}\big)$ (7.2), তাই এই উপপাদ্য দেয় একটা অত্যন্ত ব্যবহারিক পরীক্ষা:

ফল (RV-পরীক্ষা)। $X:\Omega\to\mathbb R$ একটা random variable iff $$ {X\le x}=X^{-1}\big((-\infty,x]\big)\in\mathcal F\qquad\text{সব }x\in\mathbb R\text{-র জন্য}. $$ অর্থাৎ শুধু "$\{X\le x\}$ ঘটনা কি না" — এইটুকু সব $x$-এর জন্য দেখলেই $X$-এর measurability সম্পূর্ণ নিশ্চিত। (সমতুল্যভাবে $\{X<x\}$, বা $\{X>x\}$, বা $\{X\ge x\}$ দিয়েও চলে — এরা একই Borel σ-algebra generate করে।)

কেন একটা generator-এই চলে — good-sets principle। এর পেছনের যুক্তিটা এত মৌলিক ও বারবার ফিরে আসে যে এর নিজস্ব নাম আছে — good-sets principle (সুসেট-নীতি)। ধারণাটা: target-এর যেসব set-এর preimage "ভালো" (অর্থাৎ $\mathcal F$-এ পড়ে), তাদের সংগ্রহটা নিজেই একটা σ-algebra গড়ে।

good-sets principle (স্বজ্ঞা — প্রমাণ §৪)। $f:\Omega\to E$ যেকোনো ফাংশনের জন্য $$ \mathcal A\;:=\;{B\subseteq E:\ f^{-1}(B)\in\mathcal F} $$ ("good sets"-এর সংগ্রহ) একটা σ-algebra — কারণ preimage union/intersection/complement সংরক্ষণ করে (২.১), তাই $\mathcal F$-এর σ-algebra-গুণগুলো হুবহু $\mathcal A$-তে অনূদিত হয়।

এখন তর্কটা এক লাইনে দাঁড়ায়: ধরা যাক $\mathcal G\subseteq\mathcal A$ (অর্থাৎ generator-এর সব preimage ভালো)। যেহেতু $\mathcal A$ একটা σ-algebra আর $\sigma(\mathcal G)$ হলো $\mathcal G$-ধারণকারী ক্ষুদ্রতম σ-algebra (7.2), তাই $\sigma(\mathcal G)\subseteq\mathcal A$ — অর্থাৎ পুরো $\sigma(\mathcal G)=\mathcal E$-এর প্রতিটি set-ই ভালো, সব $B\in\mathcal E$-র জন্য $f^{-1}(B)\in\mathcal F$। এটাই measurability। (এই "একটা generator-এ মিললে গোটা σ-algebra-তে মেলে" কৌশলটা 7.2-এর π–λ-যুক্তির সরাসরি জ্ঞাতি — মনে রাখার মতো।)

এক বাক্যে। "good sets" $\{B:f^{-1}(B)\in\mathcal F\}$ নিজেই একটা σ-algebra, তাই generator $\mathcal G$-এর preimage-গুলো $\mathcal F$-এ থাকলেই পুরো $\sigma(\mathcal G)$ ঢাকা পড়ে — RV-এর জন্য শুধু "$\{X\le x\}$ ঘটনা সব $x$-এ" যাচাই করাই যথেষ্ট।

২.৪ Generated σ-Algebra $\sigma(X)$ — "$X$-এর মধ্যে কতটা তথ্য"¶

measurability-র সংজ্ঞা থেকে স্বাভাবিকভাবেই একটা গভীর বস্তু বেরিয়ে আসে — একটা random variable $X$ যে তথ্য বহন করে, তার পরিমাপ।

সংজ্ঞা (generated σ-algebra, $X$-জনিত সিগমা-বীজগণিত)। একটা random variable $X:\Omega\to\mathbb R$-এর জন্য $$ \sigma(X)\;:=\;X^{-1}(\mathcal B)\;=\;\big{X^{-1}(B):B\in\mathcal B\big}\;\subseteq\;\mathcal F $$ হলো $X$-জনিত σ-algebra — অর্থাৎ Borel set-দের সব preimage-এর সংগ্রহ।

দুটো সত্য একে অর্থপূর্ণ করে (প্রমাণ §৪):

$\sigma(X)$ একটা σ-algebra, এবং good-sets-যুক্তির সুবাদে $\sigma(X)\subseteq\mathcal F$ ঠিক যখন $X$ measurable। (অর্থাৎ এই বস্তুটা সংজ্ঞায়িত হওয়াই measurability-র সমার্থক।)
$\sigma(X)$ হলো $X$-কে measurable করা সবচেয়ে ছোট σ-algebra — অন্য কোনো σ-algebra $\mathcal G$-তে $X$ measurable হলে অবশ্যই $\sigma(X)\subseteq\mathcal G$।

"তথ্য" ব্যাখ্যাটা। $\sigma(X)$-কে ভাবুন "$X$ পর্যবেক্ষণ করলে যে প্রশ্নগুলোর উত্তর জানা যায়" তার পুরো তালিকা। যদি আমরা কেবল $X(\omega)$-এর মান দেখি (কিন্তু $\omega$ নিজে নয়), তবে আমরা "$X\le 3$ কি?" বা "$X\in[1,2]$ কি?"-এর উত্তর দিতে পারি — এরা সবই $\sigma(X)$-এর সদস্য, কারণ এরা $X^{-1}(B)$-আকারের। কিন্তু $X$ যদি অনেক $\omega$-কে একই মানে পাঠায় (যেমন একটা coarse $X$), তবে সেই $\omega$-গুলোকে $X$ আলাদা করতে পারে না — সংশ্লিষ্ট সূক্ষ্ম ঘটনা $\sigma(X)$-এ থাকে না। সুতরাং:

বড় $\sigma(X)$ ⟺ $X$ বেশি তথ্য খোলে (যেমন $X=\mathrm{id}$ হলে $\sigma(X)=\mathcal B$, সব দেখা যায়);
ছোট $\sigma(X)$ ⟺ $X$ কম তথ্য খোলে (যেমন $X\equiv c$ ধ্রুবক হলে $\sigma(X)=\{\varnothing,\Omega\}$, কিছুই আলাদা করা যায় না)।

এই "σ-algebra = তথ্যের পরিমাণ" ছবিটাই Part VII-এর সবচেয়ে ফলদায়ক রূপকগুলোর একটা — 7.7-এ conditional expectation $\mathbb E[Y\mid\sigma(X)]$ মানে হবে "$X$-এর তথ্য জানা থাকলে $Y$-এর সেরা অনুমান", আর 7.8-এ filtration $(\mathcal F_t)$ মানে হবে "সময়ের সঙ্গে ক্রমে বেড়ে চলা তথ্য"।

এক বাক্যে। $\sigma(X)=X^{-1}(\mathcal B)$ হলো $X$-কে measurable করা ক্ষুদ্রতম σ-algebra — "$X$ পর্যবেক্ষণে যত প্রশ্নের উত্তর মেলে" তার সংগ্রহ, অর্থাৎ "$X$-এর মধ্যেকার তথ্য" — যা 7.7 ও 7.8-এর ভিত্তি।

২.৫ Borel Function ও Continuous ⇒ Borel — measurable-দের প্রাচুর্য¶

সংজ্ঞা তো হলো, কিন্তু বাস্তবে এত measurable ফাংশন আদৌ আছে কি? — যাতে measurability একটা সংযত-অথচ-সমৃদ্ধ শ্রেণি হয়, না অতি-সংকীর্ণ? উত্তর: হ্যাঁ, প্রায় যা-কিছু আমরা স্বাভাবিকভাবে লিখি, সবই measurable। শুরু একটা নাম দিয়ে।

সংজ্ঞা (Borel function, বোরেল অপেক্ষক)। একটা ফাংশন $g:\mathbb R\to\mathbb R$ (বা $g:\mathbb R^d\to\mathbb R$)-কে Borel-measurable বা সংক্ষেপে Borel function বলা হয় যদি সে $(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)$ measurable হয়, অর্থাৎ $g^{-1}(B)\in\mathcal B$ সব Borel $B$-র জন্য।

আর measurable-দের প্রাচুর্যের প্রথম বড় উৎস:

উপপাদ্য (continuous ⇒ Borel — বিবৃতি)। প্রতিটি continuous (অবিচ্ছিন্ন) ফাংশন $g:\mathbb R\to\mathbb R$ Borel। আরও সাধারণভাবে, যেকোনো metric space-এর মধ্যে continuous map Borel–Borel measurable।

স্বজ্ঞা ও যুক্তির বীজ (পূর্ণ প্রমাণ §৪): continuity-র topological সংজ্ঞা বলে — open set-এর preimage সবসময় open। আর $\mathcal B=\sigma(\text{open sets})$। তাই continuous $g$-র জন্য প্রতিটি open $B$-র preimage open ⟹ Borel; এখন good-sets principle (২.৩) লাগালেই generator (open set) থেকে গোটা $\mathcal B$-তে ছড়িয়ে পড়ে — সব Borel $B$-র preimage Borel। সুতরাং বহুপদী, $\exp,\sin,\cos$, যেকোনো continuous রূপান্তর — সবই Borel।

কিন্তু Borel শ্রেণি continuity-র চেয়ে অনেক বড়: এতে আছে indicator $\mathbf 1_A$ ($A\in\mathcal B$), step function, monotone function, এবং — 7.1-এর সেই নায়ক — Dirichlet function $\mathbf 1_{\mathbb Q}$ (যা সর্বত্র discontinuous, Riemann-integrable নয়, তবু measurable: $\mathbf 1_{\mathbb Q}^{-1}(B)$ সর্বদা $\varnothing,\mathbb Q,\mathbb Q^c,$ বা $\mathbb R$ — সবই Borel)। এটাই measurability-র উদারতার প্রতীক: Riemann-তত্ত্ব যাকে বাতিল করে, measure-তত্ত্ব তাকে অনায়াসে ধরে।

এক বাক্যে। continuous ⇒ Borel (open-preimage-open + good-sets), কিন্তু Borel শ্রেণি ঢের বড় — indicator, step, monotone, এমনকি সর্বত্র-অবিচ্ছিন্ন Dirichlet $\mathbf 1_{\mathbb Q}$-ও Borel; measurability Riemann-integrability-র চেয়ে অনেক উদার।

২.৬ Closure Properties — measurable থেকে measurable¶

measurability-র আসল ব্যবহারিক শক্তি এর বদ্ধতা (closure)-য়: পরিচিত operation দিয়ে measurable ফাংশন জোড়া দিলে ফল আবার measurable — তাই একবার মৌলিক ব্লকগুলো measurable জানলে, তা থেকে গড়া সবকিছুর measurability আর আলাদা করে যাচাই করতে হয় না।

ধরা যাক $f,g$ এবং $(f_n)_{n\ge 1}$ সবাই $(\Omega,\mathcal F)$-এর উপর measurable real-valued (বা extended-valued) ফাংশন।

উপপাদ্য (closure properties — বিবৃতি; প্রমাণ §৪)। 1. বীজগাণিতিক: $f+g$, $f-g$, $cf$ ($c\in\mathbb R$), $fg$, এবং $f/g$ (যেখানে $g\ne 0$) — সবই measurable। 2. জালক (lattice): $\max(f,g)$, $\min(f,g)$, $\lvert f\rvert$, এবং বিশেষত ধনাত্মক/ঋণাত্মক অংশ $f^+=\max(f,0)$, $f^-=\max(-f,0)$ — measurable (লক্ষ্য করুন $f=f^+-f^-$ ও $\lvert f\rvert=f^++f^-$)। 3. ক্রমিক সীমা (sequential limits): $\displaystyle\sup_n f_n$, $\displaystyle\inf_n f_n$, $\displaystyle\limsup_{n} f_n$, $\displaystyle\liminf_{n} f_n$ — সবই measurable; এবং যেখানে point-wise limit $\displaystyle\lim_n f_n$ বিদ্যমান, সেখানে তা-ও measurable।

এই তিন নম্বর ধর্মটিই measure-তত্ত্বকে Riemann-তত্ত্বের চেয়ে এত শক্তিশালী করে: measurable ফাংশনদের শ্রেণি point-wise সীমার অধীনে বদ্ধ — limit নিলে measurability ভাঙে না। (তুলনায় continuity বা Riemann-integrability point-wise limit-এ সহজেই ভেঙে পড়ে।)

যুক্তির বীজ (পূর্ণ §৪): বীজগাণিতিক বদ্ধতার চাবি — $\{f+g<a\}=\bigcup_{q\in\mathbb Q}\big(\{f<q\}\cap\{g<a-q\}\big)$, একটা গণনাযোগ্য union, তাই $\mathcal F$-এ; আর $fg=\tfrac14\big[(f+g)^2-(f-g)^2\big]$ ও "$f^2$ measurable" (যেহেতু $t\mapsto t^2$ continuous, ২.৫) মিলিয়ে গুণফল। ক্রমিক সীমার চাবি আরও সরাসরি: $\{\sup_n f_n\le a\}=\bigcap_n\{f_n\le a\}$ — গণনাযোগ্য intersection — তাই measurable; আর $\limsup,\liminf$ এদের থেকে গড়া ($\limsup_n f_n=\inf_k\sup_{n\ge k}f_n$)।

একটা বিশেষ ও অতি-ব্যবহৃত রূপ আলাদা করে রাখি — composition (যৌগিকীকরণ):

ফল (composition, $g\circ X$)। যদি $X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ একটা random variable এবং $g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)$ একটা Borel function হয়, তবে যৌগিক $g\circ X:\Omega\to\mathbb R$, $\omega\mapsto g(X(\omega))$, আবার একটা random variable। (যুক্তি এক লাইন: $(g\circ X)^{-1}(B)=X^{-1}\big(g^{-1}(B)\big)$ — ভেতরে $g^{-1}(B)\in\mathcal B$, বাইরে তার preimage $\in\mathcal F$।)

ফলত $X^2,\ e^{X},\ \lvert X\rvert,\ \max(X,c)$ — যেকোনো Borel রূপান্তরে random variable আবার random variable; এটাই পরে expectation (প্রত্যাশা), moment, রূপান্তর-নিয়ম ইত্যাদির ভিত্তি।

এক বাক্যে। measurable ফাংশনদের যোগ/গুণ/$\max$/$\min$/$\lvert\cdot\rvert$ ও — সবচেয়ে গুরুত্বপূর্ণভাবে — $\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n$ আবার measurable, আর Borel-$g$ দিয়ে composition $g\circ X$-ও measurable; তাই measurability স্বাভাবিক operation-এর অধীনে বদ্ধ।

২.৭ Pushforward Measure, Law ও CDF — বণ্টন rigorous¶

এবার $\mathbb P$-কে আবার দৃশ্যে আনি (এতক্ষণ কেবল $\mathcal F$-এর কাঠামো লাগছিল)। একটা random variable $X$ measurable হওয়ায় প্রতিটি Borel $B$-র জন্য $\mathbb P(X\in B)$ অর্থবহ — তাহলে $B\mapsto\mathbb P(X\in B)$ ফাংশনটাই কি $\mathbb R$-এর উপর একটা নতুন measure? হ্যাঁ — এবং এটাই "$X$-এর বণ্টন"-এর rigorous সংজ্ঞা।

সংজ্ঞা (pushforward / image measure, law)। random variable $X:(\Omega,\mathcal F,\mathbb P)\to(\mathbb R,\mathcal B)$-এর law (বা distribution, বণ্টন) হলো $(\mathbb R,\mathcal B)$-এর উপর সংজ্ঞায়িত set-function $$ P_X(B)\;:=\;\mathbb P\big(X^{-1}(B)\big)\;=\;\mathbb P(X\in B),\qquad B\in\mathcal B. $$ একে pushforward বা image measure (সম্মুখ-ঠেলা / প্রতিচ্ছবি-পরিমাপ) বলা হয় এবং প্রায়ই $P_X=\mathbb P\circ X^{-1}$ বা $\mu_X$ লেখা হয়।

উপপাদ্য (law একটা probability measure — বিবৃতি; প্রমাণ §৪)। $P_X$ হলো $(\mathbb R,\mathcal B)$-এর উপর একটা probability measure: $P_X(B)\ge 0$, $P_X(\mathbb R)=\mathbb P(X\in\mathbb R)=1$, এবং disjoint $B_1,B_2,\dots\in\mathcal B$-র জন্য countable additivity — সবই $\mathbb P$-এর সংশ্লিষ্ট ধর্ম ও preimage-এর union/disjointness-সংরক্ষণ (২.১) থেকে সরাসরি আসে।

এর তাৎপর্য গভীর: $X$ আসলে $\Omega$-র উপরকার ভর $\mathbb P$-কে $X$-এর মাধ্যমে $\mathbb R$-এ ঠেলে দেয় — $\Omega$-র যে অংশ $B$-তে map হয়, তার সম্পূর্ণ ভর গিয়ে জমা হয় $\mathbb R$-এর $B$-অঞ্চলে। ফলে মূল space $\Omega$ যত জটিল-বিমূর্তই হোক, $X$-এর সব সম্ভাব্যতা-প্রশ্নের উত্তর এখন শুধু $(\mathbb R,\mathcal B,P_X)$-এই খোঁজা যায় — বিশ্লেষণ পুরোপুরি বাস্তব রেখায় নেমে আসে।

CDF-এর সঙ্গে সংযোগ। 2.4-এর পরিচিত CDF এখন এই law-এর একটা বিশেষ মান মাত্র:

\[ F_X(x)\;=\;\mathbb P(X\le x)\;=\;P_X\big((-\infty,x]\big),\qquad x\in\mathbb R. \]

এখন একটা চমৎকার uniqueness প্রশ্ন: CDF তো law-এর তথ্যের কেবল একটা সরু অংশ (শুধু $(-\infty,x]$-আকার set-এ মান); তবু কি $F_X$ পুরো law $P_X$-কে নির্ধারণ করে?

ফল (law ⟺ CDF correspondence — বিবৃতি; প্রমাণ §৪)। $F_X$ একাই law $P_X$-কে সম্পূর্ণ নির্ধারণ করে: দুটো random variable-এর CDF সর্বত্র সমান হলে তাদের law অভিন্ন। কারণ $\{(-\infty,x]:x\in\mathbb R\}$ একটা π-system যা $\mathcal B$ generate করে, আর দুই probability measure এই π-system-এ মিললে — 7.2-এর π–λ (Dynkin) uniqueness অনুসারে — তারা গোটা $\mathcal B$-তে মেলে।

এটাই 7.2-এর uniqueness-যন্ত্রের সবচেয়ে দৃশ্যমান লভ্যাংশ: পরিসংখ্যানে "বণ্টন জানা" আর "CDF জানা" একই কথা — π–λ এই সমতাকে কঠোরভাবে প্রতিষ্ঠা করে।

এক বাক্যে। law $P_X(B)=\mathbb P(X\in B)$ হলো $\mathbb P$-কে $X$ দিয়ে $\mathbb R$-এ ঠেলে পাওয়া একটা probability measure, আর $F_X(x)=P_X((-\infty,x])$ — π–λ uniqueness (7.2) বলে CDF একাই law-কে সম্পূর্ণ pin করে।

২.৮ Simple Function — integration-এর মৌলিক ইট¶

এবার অধ্যায়ের শেষ থিম — measurable ফাংশনের একটা structural উপপাদ্য যা সরাসরি পরের অধ্যায়ের (7.4) Lebesgue integral-এর ভিত্তি গড়ে। শুরু সবচেয়ে সরল measurable ফাংশন দিয়ে।

সংজ্ঞা (simple function, সরল অপেক্ষক)। একটা measurable ফাংশন $s:\Omega\to\mathbb R$-কে simple বলা হয় যদি সে কেবল সসীম-সংখ্যক ভিন্ন মান নেয়। সমতুল্যভাবে, $s$ লেখা যায় $$ s\;=\;\sum_{i=1}^{n} a_i\,\mathbf 1_{A_i}, $$ যেখানে $a_1,\dots,a_n\in\mathbb R$ স্বতন্ত্র মান, $A_i=\{s=a_i\}\in\mathcal F$ পরস্পর-বিচ্ছিন্ন (disjoint) measurable set, $\bigcup_i A_i=\Omega$, এবং $\mathbf 1_{A}$ হলো indicator (নির্দেশক): $\mathbf 1_A(\omega)=1$ যদি $\omega\in A$, নয়তো $0$।

simple function-রাই integration-এর "পরমাণু": এদের integral সংজ্ঞায়িত করা তুচ্ছ-স্বাভাবিক — প্রতিটা মান $a_i$-কে তার set-এর আকার $\mu(A_i)$ দিয়ে গুণ করে যোগ, অর্থাৎ স্বজ্ঞাগতভাবে "$\int s\,d\mu=\sum_i a_i\,\mu(A_i)$" (উচ্চতা × আকার-এর যোগফল)। 7.4-এ Lebesgue integral এখান থেকেই শুরু হবে। কিন্তু তার আগে চাই একটা সেতু — সাধারণ measurable ফাংশনকে এই পরমাণু দিয়ে ছোঁয়ার উপায়।

এক বাক্যে। simple function $s=\sum_i a_i\mathbf 1_{A_i}$ কেবল সসীম মান নেয় (measurable disjoint $A_i$-র উপর ধ্রুবক), আর এদের "উচ্চতা × আকার" integral তুচ্ছ — এরাই Lebesgue integration-এর মৌলিক ইট।

২.৯ Approximation Theorem ও a.e. সমতা — Lebesgue integral-এর প্রবেশদ্বার¶

এই অধ্যায়ের চূড়ান্ত উপপাদ্য — এবং Part VII-এর গোটা integration-তত্ত্বের ভিত্তিপ্রস্তর: যত জটিলই হোক, প্রতিটি অঋণাত্মক measurable ফাংশনকে simple function দিয়ে নিচ থেকে ক্রমবর্ধমানভাবে ছোঁয়া যায়।

উপপাদ্য (approximation / simple-function approximation — বিবৃতি; নির্মাণ §৪)। ধরা যাক $f:\Omega\to[0,\infty]$ একটা অঋণাত্মক measurable ফাংশন। তবে এমন simple function-দের একটা ক্রম $(s_n)_{n\ge 1}$ আছে যা $$ 0\;\le\;s_1\;\le\;s_2\;\le\;\cdots\;\le\;f, \qquad\text{এবং}\qquad s_n(\omega)\;\uparrow\;f(\omega)\ \ \text{প্রতিটি }\omega\in\Omega\text{-তে} $$ (অর্থাৎ point-wise ক্রমবর্ধমান limit, $s_n\uparrow f$)। আরও — $f$ bounded হলে এই অভিসরণ uniform।

dyadic-সিঁড়ির ধারণা (পূর্ণ নির্মাণ §৪): $n$-তম ধাপে $y$-অক্ষকে $1/2^n$ মাপের ধাপে কাটা হয় এবং উচ্চতাকে $n$-এ থামিয়ে দেওয়া হয় —

\[ s_n\;=\;\sum_{k=0}^{n2^n-1}\frac{k}{2^n}\,\mathbf 1_{\{\,k/2^n\,\le\, f\,<\,(k+1)/2^n\,\}}\;+\;n\,\mathbf 1_{\{f\ge n\}}. \]

প্রতিটি $A=\{k/2^n\le f<(k+1)/2^n\}$ measurable (কারণ $f$ measurable, ২.৬), তাই $s_n$ সত্যিই simple; $n$ বাড়লে ধাপ অর্ধেক হয় ও ছাদ ওঠে, তাই $s_n$ বাড়ে ও $f$-কে নিচ থেকে চেপে ধরে — একটা ক্রমশ-সূক্ষ্ম "সিঁড়ি" $f$-এর গায়ে উঠে যায়।

সাধারণ (চিহ্নযুক্ত) $f$। যেকোনো measurable $f:\Omega\to\mathbb R$-কে ধনাত্মক ও ঋণাত্মক অংশে ভাঙি — $f=f^+-f^-$ যেখানে $f^+=\max(f,0)\ge 0$ ও $f^-=\max(-f,0)\ge 0$ (দুটোই measurable, ২.৬) — তারপর প্রতিটি অংশে আলাদা করে উপরের theorem লাগাই। 7.4-এ Lebesgue integral ঠিক এভাবেই সংজ্ঞায়িত হবে: simple-এ integral → অঋণাত্মক $f$-এ $\sup$/limit → সাধারণ $f$-এ $\int f=\int f^+-\int f^-$।

a.e. সমতা। integration-তত্ত্বে একটা শিথিলতা অপরিহার্য — যা "প্রায় সর্বত্র" একই, তাকে একই গণ্য করা। 3.2 ও 7.1-এর null-set স্বজ্ঞা স্মরণ করে:

সংজ্ঞা (almost everywhere, প্রায়-সর্বত্র / a.e.)। একটা ধর্ম "$\mu$-প্রায়-সর্বত্র" ($\mu$-a.e.) সত্য বলা হয় যদি যেখানে সে ব্যর্থ সেই set-টি একটা null set-এ ধরা পড়ে — অর্থাৎ $N\in\mathcal F$ যার $\mu(N)=0$, এবং ধর্মটি $\Omega\setminus N$-এর সর্বত্র সত্য। বিশেষত $f=g$ a.e. মানে $\mu(\{f\ne g\})=0$; probability-প্রেক্ষাপটে একে almost surely (প্রায়-নিশ্চিতভাবে, a.s.) বলা হয়।

কেন এই ধারণা জরুরি: Lebesgue integral measure-zero set-এ ফাংশনের মান গায়ে মাখে না — $f=g$ a.e. হলে $\int f\,d\mu=\int g\,d\mu$। তাই integration-তত্ত্বে ফাংশন আসলে তার a.e.-সমতা-শ্রেণি হিসেবে আচরণ করে; এটিই 7.4-এর integral, 7.9-এর $L^p$ space ও সর্বত্র "a.s. convergence"-এর ভাষাগত ভিত্তি।

এক বাক্যে। প্রতিটি অঋণাত্মক measurable $f$ হলো simple function-দের ক্রমবর্ধমান point-wise limit ($s_n\uparrow f$, dyadic সিঁড়ি), সাধারণ $f=f^+-f^-$ — এটিই 7.4-এর Lebesgue integral-এর প্রবেশদ্বার, আর a.e. (null-set বাদে) সমতা সেই integral-এর স্বাভাবিক শিথিলতা।

৩ · পূর্ণাঙ্গ উদাহরণ¶

§১–২-এ আমরা measurable map (মাপযোগ্য চিত্রণ)-এর সংজ্ঞা — $f^{-1}(B)\in\mathcal F$ প্রতিটি $B\in\mathcal B$-এর জন্য — random variable (এলোমেলো চলক), generated σ-algebra $\sigma(X)$, pushforward law (অগ্রগামী বণ্টন) $P_X$, "continuous ⇒ Borel", এবং sup/limsup/sum-এর আবদ্ধতা ও simple function (সরল ফাংশন)-এর dyadic approximation theorem (দ্বিভাজিত আসন্নীকরণ উপপাদ্য) — সবই কিছুটা বিমূর্ত ভাষায় গড়েছি। এই অংশের উদ্দেশ্য সেই কাঠামোকে হাতে-কলমে, কংক্রিট set ও কংক্রিট সংখ্যা দিয়ে ছুঁয়ে দেখা। ছয়টি উদাহরণে প্রতিটি ধাপ ধৈর্য ধরে কষব — কোনো ধাপ লুকানো থাকবে না — তারপর প্রতিটির শেষে "কী শিখলাম" বলে মূল শিক্ষাটা গুটিয়ে আনব। কষ্টের স্তর শিরোনামে তারা দিয়ে চিহ্নিত: ★ = সরাসরি, সংজ্ঞা প্রয়োগ করলেই হয় · ★★ = কিছু কৌশল বা সতর্ক যুক্তি লাগে। প্রতিটি ইংরেজি পরিভাষা প্রথম ব্যবহারে বাংলায় খুলে দেওয়া হবে।

উদাহরণ ১ — indicator কখন random variable (★)¶

সেটআপ। কোনো set $A\subseteq\Omega$-এর indicator (নির্দেশক) ফাংশন $\mathbf 1_A:\Omega\to\mathbb R$ হলো $$ \mathbf 1_A(\omega)=\begin{cases}1,& \omega\in A,\[2pt] 0,& \omega\notin A.\end{cases} $$ প্রশ্ন: কখন $\mathbf 1_A$ একটা random variable, অর্থাৎ $(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ measurable? সংজ্ঞা বলছে — প্রতিটি Borel set $B$-এর জন্য pre-image (পূর্বপ্রতিচ্ছবি) $\mathbf 1_A^{-1}(B)$ যেন $\mathcal F$-এ থাকে। যেহেতু $\mathbf 1_A$ মাত্র দুটো মান নেয় ($0$ ও $1$), এর pre-image-এর হিসাব সম্পূর্ণরূপে নির্ভর করে $B$ কেবল $0$ আর $1$-এর কোনটিকে ধরে তার উপর — বাকি বিন্দু $B$-তে থাকুক না-থাকুক, কিছু যায়-আসে না, কারণ $\mathbf 1_A$ সে-মান কখনো নেয় না।

চারটি ক্ষেত্র গুনে ফেলা। $0\in B$ কি না এবং $1\in B$ কি না — দুটো হ্যাঁ/না, মোট চারটি সম্ভাবনা। প্রতিটির জন্য $\mathbf 1_A^{-1}(B)=\{\omega:\mathbf 1_A(\omega)\in B\}$ কষি:

ক্ষেত্র ১ — $0\notin B$, $1\notin B$। $\mathbf 1_A$ কখনো $B$-তে পড়ে না; তাই $\mathbf 1_A^{-1}(B)=\emptyset$।
ক্ষেত্র ২ — $0\notin B$, $1\in B$। শুধু "$\mathbf 1_A=1$" বিন্দুগুলো গোনা হয়, অর্থাৎ $\{\omega:\mathbf 1_A(\omega)=1\}=A$। তাই $\mathbf 1_A^{-1}(B)=A$।
ক্ষেত্র ৩ — $0\in B$, $1\notin B$। শুধু "$\mathbf 1_A=0$" বিন্দু, অর্থাৎ $A^c$। তাই $\mathbf 1_A^{-1}(B)=A^c$।
ক্ষেত্র ৪ — $0\in B$, $1\in B$। দুটো মানই ধরা; সব $\omega$ পড়ে। তাই $\mathbf 1_A^{-1}(B)=\Omega$।

সংক্ষেপে, $B$-ভেদে $\mathbf 1_A$-এর সম্ভাব্য pre-image-এর তালিকা মাত্র চারটি set: $$ \mathbf 1_A^{-1}(B)\;\in\;{\,\emptyset,\;A,\;A^c,\;\Omega\,}. $$ এদের মধ্যে $\emptyset,\Omega$ এবং $A^c$ ($=A$ থাকলে complement-আবদ্ধতায়) সবসময় যেকোনো σ-algebra-তে থাকে। তাই measurability-র গোটা প্রশ্নটা একটিমাত্র সদস্যে গিয়ে দাঁড়ায়: $A$ নিজে $\mathcal F$-এ আছে কি না।

উপসংহার (iff)। $$ \mathbf 1_A \text{ measurable} \quad\Longleftrightarrow\quad A\in\mathcal F . $$ ডান-থেকে-বাঁ: $A\in\mathcal F$ হলে চারটি pre-image-ই ($\emptyset,A,A^c,\Omega$) $\mathcal F$-এ — তাই সব Borel $B$-এর pre-image $\mathcal F$-এ, অর্থাৎ measurable। বাঁ-থেকে-ডান: $\mathbf 1_A$ measurable হলে বিশেষভাবে $B=\{1\}$ (একটা Borel set) নিলে $\mathbf 1_A^{-1}(\{1\})=A\in\mathcal F$।

কী শিখলাম। একটা random variable-এর সংজ্ঞা "প্রতিটি Borel $B$-এর জন্য $f^{-1}(B)\in\mathcal F$" শুনতে যতই ভারী হোক, indicator-এর ক্ষেত্রে তা ভেঙে দাঁড়ায় একটিমাত্র শর্তে: $A$ যেন একটা event হয়, অর্থাৎ $A\in\mathcal F$। এতে measurability ও "ঘটনার ভাষা" এক হয়ে যায় — "$\mathbf 1_A$ পরিমাপ করা যায়" আর "$A$ একটা বৈধ ঘটনা যার সম্ভাবনা $\mathbb P(A)$ বলা যায়" আসলে একই কথা। তাই σ-algebra $\mathcal F$ ঠিক সেইসব $A$-ই ধরে যাদের indicator random variable, আর এই ছোট উদাহরণটাই random variable-এর গোটা তত্ত্বের গোড়ার ইট।

উদাহরণ ২ — simple function ও $\sigma(X)$ (★)¶

সেটআপ। simple function (সরল ফাংশন) হলো সসীম-অনেক মান নেওয়া measurable ফাংশন, যাকে indicator-এর ভারিত যোগফলে লেখা যায়: $$ X=\sum_{i=1}^{k} a_i\,\mathbf 1_{A_i}, $$ যেখানে $a_1,\dots,a_k$ পরস্পর-আলাদা বাস্তব মান, আর $A_1,\dots,A_k$ পরস্পর-বিচ্ছিন্ন (disjoint) set যারা মিলে $\Omega$-কে ঢাকে — অর্থাৎ $\{A_i\}$ হলো $\Omega$-এর একটা partition (বিভাজন)। এখানে $A_i=\{X=a_i\}=X^{-1}(\{a_i\})$ হলো level set (স্তর-সেট): একই মান নেওয়া $\omega$-দের ঝাঁক। প্রশ্ন: $X$-এর তৈরি করা তথ্য — $\sigma(X)$ — দেখতে কেমন, আর তাতে কতগুলো set?

$\sigma(X)$ মানে $X$-বহন-করা তথ্য। সংজ্ঞা: $\sigma(X)=\{X^{-1}(B):B\in\mathcal B\}$ — যত রকম Borel-প্রশ্ন "$X\in B$?" করা যায়, তাদের answer-set-এর সংগ্রহ। যেহেতু $X$ মাত্র $k$টি মান নেয়, যেকোনো Borel $B$ এই $k$টি মানের কোন-কোনটি ধরে কেবল সেটাই গুরুত্বপূর্ণ। যদি $B$ ধরে মানগুলোর উপসেট $S\subseteq\{a_1,\dots,a_k\}$, তবে $$ X^{-1}(B)=\bigcup_{i:\,a_i\in S} A_i , $$ অর্থাৎ level set-গুলোর একটা union। উল্টোভাবে, যেকোনো level set-উপসংগ্রহের union-কে এক উপযুক্ত $B$ (সেই মানগুলোর set) দিয়ে পাওয়া যায়। তাই $$ \sigma(X)=\Big{\textstyle\bigcup_{i\in I}A_i : I\subseteq{1,\dots,k}\Big} =\text{level set-গুলোর সব union}. $$ এখানে level set $A_i$-গুলোই হলো $\sigma(X)$-এর atom (পরমাণু) — আর-ভাঙা-যায়-না সবচেয়ে ছোট দানা।

গোনা। $k$টি atom-এর প্রতিটিকে union-এ "রাখি / রাখি না" — স্বাধীন দুই-পথ বাছাই $k$ বার: $$ \lvert\sigma(X)\rvert = 2^{k}. $$ (দুই প্রান্ত-কেস ধরা: কোনো atom না নিলে $\emptyset$, সব নিলে $\Omega$।) তাই $k=2,3,4$ হলে যথাক্রমে $4,\;8,\;16$টি set।

কংক্রিট: $k=3$¶

ধরা যাক $\Omega=\{1,2,3,4,5,6\}$ (একটা ছক্কা), আর $$ X=\;\underbrace{0}{a_1}\cdot\mathbf 1}+\underbrace{1{a_2}\cdot\mathbf 1}+\underbrace{2{a_3}\cdot\mathbf 1, $$ অর্থাৎ level set $A_1=\{1\},\;A_2=\{2,3\},\;A_3=\{4,5,6\}$। এই তিনটি atom থেকে $2^3=8$টি union: $$ \emptyset,\;{1},\;{2,3},\;{4,5,6},\;{1,2,3},\;{1,4,5,6},\;{2,3,4,5,6},\;{1,2,3,4,5,6}. $$ ঠিক আটটি — এটাই $\sigma(X)$। লক্ষণীয়, $\sigma(X)$ গোটা power set $2^\Omega$ ($=2^6=64$ set) নয়: যেমন $\{2\}$ আলাদা করে $\sigma(X)$-এ নেই, কারণ $X$ "$2$" আর "$3$"-কে একই মান $1$ দেয় বলে এ-দুটোকে আলাদা করার তথ্য $X$ বহন করে না।

কী শিখলাম। $\sigma(X)$ হলো "$X$ দেখে যত প্রশ্নের উত্তর জানা যায়" — তার গাণিতিক রূপ। simple $X$-এর জন্য এই তথ্য পুরোপুরি গোনা যায়: তার level set-গুলোই atom, আর $\sigma(X)$ ঠিক সেই atom-গুলোর সব union — $k$টি আলাদা মান থাকলে $2^k$টি set ($k=2,3,4\to4,8,16$)। মূল insight (অন্তর্দৃষ্টি): একই মান-পাওয়া বিন্দুদের $X$ আলাদা করতে পারে না, তাই $\sigma(X)$ সাধারণত পুরো power set-এর চেয়ে মোটা (coarser) — এই "তথ্যের সূক্ষ্মতা = σ-algebra-র সূক্ষ্মতা" ছবিটাই পরে conditional expectation ও sufficiency-র ভিত্তি হবে।

উদাহরণ ৩ — check-on-generator (★★)¶

সেটআপ। measurability যাচাইয়ে "প্রতিটি Borel $B$-এর জন্য $X^{-1}(B)\in\mathcal F$" পরীক্ষা করা অসম্ভব — Borel set অগুনতি। সুসংবাদ: $\mathcal B(\mathbb R)$-কে জন্ম দেয় এমন একটা ছোট generator family-তে শর্তটা মিললেই যথেষ্ট। বিশেষভাবে half-line (অর্ধরেখা) $(-\infty,x]$-রা $\mathcal B(\mathbb R)$ জন্ম দেয়, তাই — $$ X \text{ একটা RV} \quad\Longleftrightarrow\quad {X\le x}\in\mathcal F\ \ \forall x\in\mathbb R . $$ আরও কম খাটুনিতে, $x$-কে শুধু rational ($x\in\mathbb Q$) ধরলেও চলে, কারণ $\mathbb Q$ ঘন (dense) বলে $\{X\le x\}=\bigcap_{q\in\mathbb Q,\,q>x}\{X\le q\}$ — গণনাযোগ্য ছেদে যেকোনো বাস্তব $x$ পুনর্গঠিত হয়।

কেন জেনারেটরে যাচাই-ই যথেষ্ট — good-sets নীতি। যুক্তির কঙ্কাল: ধরি $\mathcal D=\{B\subseteq\mathbb R:X^{-1}(B)\in\mathcal F\}$ — "ভালো" Borel-target-দের সংগ্রহ, যাদের pre-image সত্যিই $\mathcal F$-এ। pre-image অপারেশন set-অপারেশন রক্ষা করে: $X^{-1}(B^c)=\big(X^{-1}(B)\big)^c$ এবং $X^{-1}\!\big(\bigcup_n B_n\big)=\bigcup_n X^{-1}(B_n)$। যেহেতু $\mathcal F$ complement ও গণনাযোগ্য union-এ আবদ্ধ, $\mathcal D$ও তাই — অর্থাৎ $\mathcal D$ একটা σ-algebra। এখন যদি জেনারেটর (সব half-line) $\mathcal D$-তে থাকে, তবে তাদের জন্মানো গোটা $\mathcal B(\mathbb R)\subseteq\mathcal D$ — অর্থাৎ প্রতিটি Borel target ভালো, $X$ measurable। এটাই good-sets principle: "যেখানে শর্ত মেলে" সেই সংগ্রহ একটা σ-algebra; জেনারেটর তাতে থাকলে গোটা generated σ-algebra ঢেকে যায়।

প্রয়োগ ১: $X=\max(Y,c)$¶

ধরা যাক $Y$ একটা RV আর $c$ ধ্রুবক; $X(\omega)=\max\big(Y(\omega),c\big)$। দাবি: $X$ও RV। half-line যাচাই করি — কোন $\omega$-তে $\max(Y,c)\le x$? max ছোট-বা-সমান হতে গেলে দুটোই ছোট-বা-সমান হতে হবে, তাই $$ {X\le x}={Y\le x}\cap{c\le x}. $$ দুই ক্ষেত্র: যদি $x\ge c$, তবে $\{c\le x\}=\Omega$, তাই $\{X\le x\}=\{Y\le x\}\in\mathcal F$ ($Y$ RV বলে)। যদি $x<c$, তবে $\{c\le x\}=\emptyset$, তাই $\{X\le x\}=\emptyset\in\mathcal F$। দু-ক্ষেত্রেই $\{X\le x\}\in\mathcal F$ — সুতরাং $X=\max(Y,c)$ একটা RV।

প্রয়োগ ২: একটা monotone $X$¶

ধরা যাক $\Omega=\mathbb R$ একটা Borel σ-algebra-সহ, আর $X:\mathbb R\to\mathbb R$ non-decreasing (অ-হ্রাসমান)। তখন প্রতিটি $x$-এর জন্য sub-level set $\{X\le x\}$ একটা interval (অন্তর) — হয় $(-\infty,b]$, নয় $(-\infty,b)$, নয় খালি, নয় গোটা $\mathbb R$ (monotonicity-র কারণে: $\omega$ এতে থাকলে তার বাঁ-দিকের সবও থাকে)। প্রতিটি interval একটা Borel set, তাই $\{X\le x\}\in\mathcal B(\mathbb R)$ সব $x$-এর জন্য — জেনারেটর-যাচাই মিলে গেল, $X$ measurable (Borel)। অর্থাৎ প্রতিটি monotone ফাংশন Borel — অসংখ্য বিন্দুতে আলাদা করে পরীক্ষা না করেই।

কী শিখলাম। measurability প্রমাণে আসল কৌশল হলো জেনারেটরে নেমে আসা: গোটা Borel σ-algebra না ঘেঁটে শুধু $\{X\le x\}$ (এমনকি কেবল $x\in\mathbb Q$) $\mathcal F$-এ আছে কি না দেখলেই চলে — কারণ half-line-রা $\mathcal B(\mathbb R)$ জন্ম দেয়। এর পিছনে good-sets principle: "শর্ত-মানা" target-দের সংগ্রহ একটা σ-algebra, তাই জেনারেটরে শর্ত মিললে সব Borel set-এ আপনাআপনি মেলে। এই একটা চাল দিয়ে $\max(Y,c)$-জাতীয় গড়ন আর গোটা monotone শ্রেণিকে এক ঝটকায় RV বানিয়ে ফেলা যায়।

উদাহরণ ৪ — continuous ও Borel function of a RV (★)¶

সেটআপ। $X$ একটা RV হলে তাকে একটা continuous (অবিচ্ছিন্ন) ফাংশন $g$ দিয়ে রূপান্তর করলে $g(X)$ কি আবার RV? উত্তর: হ্যাঁ — এর গোড়া দুটো তথ্য: (i) প্রতিটি continuous $g:\mathbb R\to\mathbb R$ Borel measurable, আর (ii) দুটো measurable map-এর composition (যৌগ) measurable।

(i) continuous ⇒ Borel কেন। $g$ continuous হলে যেকোনো open set $U$-এর pre-image $g^{-1}(U)$ও open (topology-র সংজ্ঞা), তাই Borel। কিন্তু open set-রা $\mathcal B(\mathbb R)$ জন্ম দেয়, আর উদাহরণ ৩-এর good-sets যুক্তিতে $\{B:g^{-1}(B)\in\mathcal B\}$ একটা σ-algebra যাতে সব open set আছে — সুতরাং গোটা $\mathcal B\subseteq$ সেই সংগ্রহ, অর্থাৎ $g^{-1}(B)\in\mathcal B$ প্রতিটি Borel $B$-এর জন্য। তাই $g$ Borel measurable।

(ii) composition measurable কেন। $X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ আর $g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)$ — দুটোই measurable। তখন $g\circ X$-এর pre-image দু-ধাপে খোলে: $$ (g\circ X)^{-1}(B)=X^{-1}\big(g^{-1}(B)\big). $$ $B$ Borel ⇒ $g^{-1}(B)$ Borel ((i) থেকে) ⇒ $X^{-1}\big(g^{-1}(B)\big)\in\mathcal F$ ($X$ RV বলে)। সুতরাং $g(X)$ একটা RV।

কংক্রিট: $g(t)=t^2$। $g(t)=t^2$ continuous, তাই Borel; ফলে $X$ RV হলে $X^2=g(X)$ও RV। সরাসরি যাচাইও মেলে: $y\ge 0$-এর জন্য $$ {X^2\le y}={-\sqrt y\le X\le \sqrt y}={X\le\sqrt y}\setminus{X<-\sqrt y}\in\mathcal F, $$ আর $y<0$-এর জন্য $\{X^2\le y\}=\emptyset\in\mathcal F$ — half-line যাচাই খাটে।

আরও যা RV থেকে যায়। §২-এর আবদ্ধতা-ধর্ম মনে রেখে: $X,Y$ RV হলে $X+Y$, $XY$, $\max(X,Y)$, $\min(X,Y)$, $\lvert X\rvert$, $cX$ — সবই RV। কারণ যোগ ও গুণ $(s,t)\mapsto s+t$ এবং $(s,t)\mapsto st$ continuous $\mathbb R^2\to\mathbb R$, আর $(X,Y):\Omega\to\mathbb R^2$ একটা measurable map; তাই continuous ফাংশন দিয়ে composition করলে আবার RV। (এটাই উদাহরণ ৫-এ $Y=X^2$ নেওয়ার বৈধতা দেয় — $X^2$ যে একটা RV তা এখানেই নিশ্চিত হলো।)

কী শিখলাম। RV-এর শ্রেণি রূপান্তরে অত্যন্ত স্থিতিশীল: যেকোনো continuous (এমনকি যেকোনো Borel) $g$ দিয়ে $g(X)$ আবার RV, কারণ "continuous ⇒ Borel" আর "measurable ∘ measurable = measurable"। এর ফল — $X^2$, $X+Y$, $XY$, $\max(X,Y)$ ইত্যাদি গড়ন আলাদা করে প্রমাণ ছাড়াই RV, যা পরিসংখ্যানের প্রায় সব statistic (mean, variance, order statistic …) কে বৈধ random variable হিসেবে দাঁড় করায়। মূল বার্তা: pre-image দু-ধাপে $X^{-1}\big(g^{-1}(B)\big)$ হিসেবে খোলে — তাই দুই measurable ধাপ জুড়লে measurability টিকে থাকে।

উদাহরণ ৫ — pushforward / law of $Y=X^2$ (★★)¶

সেটআপ। ধরা যাক $X\sim\text{Uniform}(-1,1)$, অর্থাৎ $X$-এর density $f_X(t)=\tfrac12$ for $t\in(-1,1)$ (নাহলে $0$)। ধরি $Y=X^2$ (উদাহরণ ৪-এ দেখেছি এটা RV)। প্রশ্ন: $Y$-এর law / distribution (বণ্টন) — অর্থাৎ pushforward measure (অগ্রগামী পরিমাপ) $P_Y=P_X\circ(X^2)^{-1}$ — কেমন? সংজ্ঞা মনে করি: যেকোনো Borel $B$-এর জন্য $P_Y(B)=\mathbb P(Y\in B)=\mathbb P\big(X\in (X^2)^{-1}(B)\big)=P_X\big((X^2)^{-1}(B)\big)$। সবচেয়ে পরিষ্কার পথ — CDF বের করা।

ধাপ ১ — CDF। $Y=X^2\ge 0$, তাই $F_Y(y)=0$ for $y\le 0$। আর যেহেতু $\lvert X\rvert\le 1$, $Y\le 1$, তাই $F_Y(y)=1$ for $y\ge 1$। মাঝের অংশ $y\in(0,1)$-এর জন্য: $$ F_Y(y)=\mathbb P(X^2\le y)=\mathbb P\big(-\sqrt y\le X\le\sqrt y\big)=\int_{-\sqrt y}^{\sqrt y}\tfrac12\,dt=\tfrac12\big(2\sqrt y\big)=\sqrt y . $$ অর্থাৎ $$ F_Y(y)=\begin{cases}0,& y\le 0,\[2pt]\sqrt y,& 0<y<1,\[2pt]1,& y\ge 1.\end{cases} $$

ধাপ ২ — density। $(0,1)$-এ $F_Y$ অবকলনযোগ্য, তাই density হলো $$ f_Y(y)=F_Y'(y)=\frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y},\qquad y\in(0,1). $$ লক্ষণীয়, $y\to 0^+$-এ $f_Y(y)\to\infty$ — density অসীমে যায় অথচ মোট ভর সসীম: $\int_0^1\frac{1}{2\sqrt y}\,dy=\big[\sqrt y\,\big]_0^1=1$ ✓। এটাই $Y$-এর pushforward law: $X$-এর uniform ভর $X\mapsto X^2$ চিত্রণে ঠেলে দেওয়ায় $0$-এর কাছে জমা হয় (কারণ ছোট $X$ আরও ছোট $X^2$ দেয়)।

ধাপ ৩ — $\mathbb E[Y]$। density দিয়ে সরাসরি: $$ \mathbb E[Y]=\int_0^1 y\cdot\frac{1}{2\sqrt y}\,dy=\int_0^1\tfrac12\,y^{1/2}\,dy=\tfrac12\cdot\frac{y^{3/2}}{3/2}\Big\rvert_0^1=\tfrac12\cdot\tfrac23=\frac13 . $$ (মিলিয়ে দেখা যায় change-of-variable ছাড়াই, মূল $X$-এ: $\mathbb E[X^2]=\int_{-1}^1 t^2\cdot\tfrac12\,dt=\tfrac12\cdot\tfrac{2}{3}=\tfrac13$ — pushforward-এর মূল সুবিধা যে দু-পথে একই উত্তর।)

ধাপ ৪ — একটা probability। $$ \mathbb P!\big(Y\le\tfrac14\big)=F_Y!\big(\tfrac14\big)=\sqrt{\tfrac14}=\tfrac12 . $$ স্বজ্ঞায়ও মেলে: $Y\le\tfrac14\iff\lvert X\rvert\le\tfrac12$, আর uniform $X$-এর অর্ধেক ভর $[-\tfrac12,\tfrac12]$-এ — তাই $\tfrac12$।

Monte-Carlo মিলিয়ে দেখা¶

বিশ্লেষণী মান যাচাই করতে একটা simulation: numpy-তে rng = default_rng(20260619), $X$-এর $N=10^6$ নমুনা rng.uniform(-1, 1, N), তারপর $Y=X^2$। ফল কাছাকাছি বসে—

পরিমাণ	বিশ্লেষণী	Monte-Carlo ($N=10^6$)
$\mathbb E[Y]$	$\tfrac13\approx0.3333$	$0.3335$
$\mathbb P(Y\le 0.25)$	$0.5$	$0.4997$

দু-ক্ষেত্রেই simulation বিশ্লেষণী মানের তিন-দশমিক-ঘরে মিলছে — pushforward-এর হিসাব নিশ্চিত।

কী শিখলাম। একটা RV-কে রূপান্তর করলে তার law নিজে থেকেই বদলায়, আর সেই নতুন law-ই pushforward measure $P_Y=P_X\circ(X^2)^{-1}$। ব্যবহারিক চাবিকাঠি: target-এর CDF $F_Y(y)=\mathbb P(g(X)\le y)$ বের করে অবকলনে density পাওয়া — এখানে $\text{Uniform}(-1,1)$-এর $X^2$ দিল $f_Y(y)=\frac{1}{2\sqrt y}$ on $(0,1)$, $\mathbb E[Y]=\tfrac13$, $\mathbb P(Y\le\tfrac14)=\tfrac12$ (Monte-Carlo: $0.3335,\,0.4997$)। গভীর বার্তা: $\mathbb E[g(X)]$ হিসাব করতে দু-পথ সমান — হয় নতুন density $f_Y$-তে, নয় মূল $f_X$-এ — কারণ pushforward ঠিক এই "ভর বহন করে নিয়ে যাওয়া" কে আনুষ্ঠানিক করে; এটাই পরের change-of-variable ও $\int g\,dP_X=\int y\,dP_Y$ সূত্রের ভিত্তি।

উদাহরণ ৬ — dyadic approximation by simple functions (★★)¶

সেটআপ। §২-এর সবচেয়ে দামি যন্ত্র — dyadic approximation theorem: যেকোনো অঋণাত্মক measurable $f$-কে নিচ থেকে বেড়ে-ওঠা (increasing) simple function-এর ক্রম $f_n\uparrow f$ দিয়ে আসন্ন করা যায়। এখানে সরল কেস $f(x)=x$ on $[0,1]$-এ যন্ত্রটা হাতে চালিয়ে দেখি।

নির্মাণ — dyadic staircase (দ্বিভাজিত সিঁড়ি)। স্তর $n$-এ $[0,1)$-কে $2^n$টি সমান $2^{-n}$-চওড়া টুকরোয় কাটি, আর প্রতিটি টুকরোয় $f$-এর মান নিচের দিকে গোল করি নিকটতম $2^{-n}$-গুণিতকে: $$ f_n(x)=\frac{\lfloor 2^n x\rfloor}{2^n}\qquad(x\in[0,1),\ \text{ক্যাপ করা }f_n(1)=1). $$ এটা simple function: এটা মাত্র $2^n$টি মান $\{0,\tfrac{1}{2^n},\tfrac{2}{2^n},\dots,\tfrac{2^n-1}{2^n}\}$ নেয়, প্রতিটি একটা dyadic interval $\big[\tfrac{k}{2^n},\tfrac{k+1}{2^n}\big)$-এ ধ্রুবক — অর্থাৎ $f_n=\sum_{k=0}^{2^n-1}\tfrac{k}{2^n}\mathbf 1_{[k/2^n,\,(k+1)/2^n)}$।

ধর্ম ১ — error bound (ত্রুটি-সীমা)। floor-এর সংজ্ঞা থেকে $\lfloor 2^n x\rfloor\le 2^n x<\lfloor 2^n x\rfloor+1$, $2^n$ দিয়ে ভাগ করলে $$ f_n(x)\le x< f_n(x)+2^{-n}\quad\Longrightarrow\quad 0\le f(x)-f_n(x)<2^{-n}. $$ তাই sup-দূরত্ব নিয়ন্ত্রিত: $$ \sup_{x\in[0,1]}\lvert f(x)-f_n(x)\rvert\le 2^{-n}\xrightarrow[n\to\infty]{}0, $$ অর্থাৎ $f_n\to f$ uniformly (সমভাবে) — শুধু বিন্দুভিত্তিক নয়।

ধর্ম ২ — monotone (একঘেয়ে বৃদ্ধি) $f_n\uparrow f$। স্তর $n$ থেকে $n+1$-এ প্রতিটি টুকরো ঠিক দু-ভাগ হয়, তাই $\lfloor 2^{n+1}x\rfloor/2^{n+1}\ge\lfloor 2^n x\rfloor/2^n$ — নতুন সিঁড়ি কখনো নামে না, প্রায়ই উঠে আসে $x$-এর আরও কাছে। ফলে $f_n(x)\le f_{n+1}(x)\le x$ প্রতিটি $x$-এ, এবং ধর্ম ১ থেকে $f_n(x)\to x=f(x)$। অর্থাৎ $f_n\uparrow f$।

সংখ্যায়: error টেবিল¶

$\sup$-error $=2^{-n}$ ধরে $n=1,2,3,4$:

$n$	টুকরোর সংখ্যা $2^n$	$\sup\lvert f-f_n\rvert\le 2^{-n}$
$1$	$2$	$0.5$
$2$	$4$	$0.25$
$3$	$8$	$0.125$
$4$	$16$	$0.0625$

প্রতি স্তরে error ঠিক অর্ধেক হয় — সিঁড়ির ধাপ যত সরু, $f_n$ তত $f$-এর গা ঘেঁষে ওঠে। একটা বিন্দুতে মিলিয়ে দেখা: $x=0.7$, $n=2$ হলে $f_2(0.7)=\lfloor 4\cdot 0.7\rfloor/4=\lfloor 2.8\rfloor/4=2/4=0.5$, ত্রুটি $0.7-0.5=0.2\le 0.25$ ✓; $n=3$ হলে $f_3(0.7)=\lfloor 5.6\rfloor/8=5/8=0.625$, ত্রুটি $0.075\le 0.125$ ✓ — এবং $0.5\le 0.625$, বৃদ্ধি নিশ্চিত।

কী শিখলাম। dyadic staircase $f_n(x)=\lfloor 2^n x\rfloor/2^n$ যেকোনো (এখানে $f(x)=x$) অঋণাত্মক measurable ফাংশনকে নিচ থেকে simple function দিয়ে চেপে ধরে: $0\le f-f_n<2^{-n}$, তাই $\sup$-error $n=1,2,3,4\to0.5,0.25,0.125,0.0625$, এবং $f_n\uparrow f$ (এমনকি uniformly)। কেন এটা এত গুরুত্বপূর্ণ — simple function-এর integral গোনা তুচ্ছ (মান × measure-এর যোগফল); তাই "$f_n\uparrow f$" থাকলে $\int f$-কে সংজ্ঞায়িত করা যায় $\lim_n\int f_n$ হিসেবে। এই একটিমাত্র নির্মাণই §৭.৪-এর Lebesgue integral-এর ইঞ্জিন — যেকোনো measurable ফাংশনের অখণ্ডন এই বেড়ে-ওঠা সিঁড়ির সীমা।

৪ · প্রমাণ ও উৎপাদন¶

এই অংশে §২-এর সংজ্ঞাগুলো থেকে আমরা measurable map (পরিমাপযোগ্য চিত্রণ) ও random variable (এলোমেলো চলক)-এর মূল কাঠামোগত ফলাফলগুলো ধাপে ধাপে উৎপাদন (derive) করব। প্রতিটি প্রমাণে কেন প্রতিটি পদক্ষেপ বৈধ — কোন সংজ্ঞা, কোন পূর্ববর্তী ফল, বা কোন set-অভেদ ব্যবহৃত হচ্ছে — তা স্পষ্ট করে বলা হবে। প্রতিটি প্রমাণের শিরোনামে কঠিনতা-চিহ্ন (difficulty tag) দেওয়া আছে:

★ — মৌলিক, প্রথম পাঠেই বোঝা উচিত।
★★ — মাঝারি, একটু কৌশল লাগে।
★★★ — গভীর, প্রথম পাঠে কিছু অংশ এড়িয়ে যাওয়া যায় (যথাস্থানে চিহ্নিত)।

স্মরণ করি, দুটি measurable space $(\Omega,\mathcal F)$ ও $(E,\mathcal E)$-এর মধ্যে একটি ফাংশন $f:\Omega\to E$-কে বলা হয় measurable (পরিমাপযোগ্য) যদি প্রতিটি $B\in\mathcal E$-এর জন্য তার preimage (পূর্বপ্রতিচ্ছবি) $f^{-1}(B):=\{\omega\in\Omega:f(\omega)\in B\}$ সদস্য হয় $\mathcal F$-এর:

\[ f \text{ measurable} \quad:\Longleftrightarrow\quad f^{-1}(B)\in\mathcal F \ \ \text{সব } B\in\mathcal E\text{-র জন্য}. \]

বিশেষ ক্ষেত্রে $(E,\mathcal E)=(\mathbb R,\mathcal B)$ ($\mathcal B$ = Borel σ-algebra) হলে এমন $X:\Omega\to\mathbb R$-কে বলা হয় random variable (RV)। গোটা অংশজুড়ে আমরা preimage-এর তিনটি মৌলিক commutation (বিনিময়) ধর্ম বারবার ব্যবহার করব, যা যেকোনো ফাংশন $f$-এর জন্য সত্য (σ-algebra-র প্রয়োজন নেই):

\[ f^{-1}(B^c)=\bigl(f^{-1}(B)\bigr)^c,\qquad f^{-1}\!\Bigl(\bigcup_i B_i\Bigr)=\bigcup_i f^{-1}(B_i),\qquad f^{-1}\!\Bigl(\bigcap_i B_i\Bigr)=\bigcap_i f^{-1}(B_i). \]

এই তিনটি অভেদই preimage-কে set-অপারেশনের সাথে নিখুঁত সামঞ্জস্যে রাখে; এদের প্রমাণ স্রেফ সদস্যপদ যাচাই (যেমন $\omega\in f^{-1}(B^c)\iff f(\omega)\notin B\iff\omega\notin f^{-1}(B)$), এবং Part VII-এর 7.2-এ এগুলো ধরে নেওয়া আছে।

প্রমাণ ১ — good-sets principle: generator-এ পরীক্ষাই যথেষ্ট (★★)¶

দাবি। ধরা যাক $f:(\Omega,\mathcal F)\to(E,\mathcal E)$, যেখানে target σ-algebra-টি একটি সংগ্রহ $\mathcal G$ থেকে উৎপন্ন: $\mathcal E=\sigma(\mathcal G)$। তাহলে

\[ f \text{ measurable} \quad\Longleftrightarrow\quad f^{-1}(G)\in\mathcal F \ \ \text{সব } G\in\mathcal G\text{-র জন্য}. \]

অর্থাৎ measurability যাচাই করতে গোটা (প্রায়শই অগণনীয়) $\mathcal E$-র উপর পরীক্ষা চালানোর দরকার নেই; শুধু generator $\mathcal G$-তে preimage যাচাই করলেই হয়।

কৌশলের নাম — good-sets principle. যেসব target-set "ভালো আচরণ" করে (এখানে: যাদের preimage $\mathcal F$-এ পড়ে) তাদের সংগ্রহটিকে আলাদা করে নাম দিই, দেখাই সেটি একটি σ-algebra এবং generator-কে ধারণ করে; তখন σ-algebra-র ন্যূনতমতা থেকে সংগ্রহটি গোটা $\sigma(\mathcal G)$-কেই গিলে ফেলে। measure theory-তে এই ছাঁচ বারবার ফিরে আসে।

নির্মাণ — good sets-এর সংগ্রহ। সংজ্ঞা করি

\[ \mathcal D:=\{B\subseteq E:\ f^{-1}(B)\in\mathcal F\}. \]

এটি হলো target-জগৎ $E$-এর সেই সব subset, যাদের preimage source σ-algebra $\mathcal F$-এ থাকে।

ধাপ ১ — $\mathcal D$ একটি σ-algebra (target $E$-এর উপর)। তিনটি স্বীকার্য যাচাই করি।

(A1) সম্পূর্ণ সেট। $f^{-1}(E)=\{\omega:f(\omega)\in E\}=\Omega$, কারণ প্রতিটি $f(\omega)$ অবশ্যই $E$-তে থাকে। আর $\Omega\in\mathcal F$ (σ-algebra-র (A1))। সুতরাং $E\in\mathcal D$।

(A2) complement-এ বদ্ধ। ধরা যাক $B\in\mathcal D$, অর্থাৎ $f^{-1}(B)\in\mathcal F$। preimage complement-এর সাথে বিনিময় করে: $f^{-1}(B^c)=\bigl(f^{-1}(B)\bigr)^c$। যেহেতু $\mathcal F$ complement-এ বদ্ধ (σ-algebra-র (A2)) এবং $f^{-1}(B)\in\mathcal F$, তাই $\bigl(f^{-1}(B)\bigr)^c\in\mathcal F$। সুতরাং $f^{-1}(B^c)\in\mathcal F$, অর্থাৎ $B^c\in\mathcal D$।

(A3) গণনাযোগ্য সংযোগে বদ্ধ। ধরা যাক $B_1,B_2,\dots\in\mathcal D$, অর্থাৎ প্রতিটি $f^{-1}(B_n)\in\mathcal F$। preimage গণনাযোগ্য সংযোগের সাথে বিনিময় করে:

\[ f^{-1}\!\Bigl(\bigcup_{n=1}^{\infty}B_n\Bigr)=\bigcup_{n=1}^{\infty}f^{-1}(B_n). \]

ডান পাশের প্রতিটি পদ $\mathcal F$-এ, আর $\mathcal F$ গণনাযোগ্য সংযোগে বদ্ধ (σ-algebra-র (A3)), তাই গোটা সংযোগটি $\mathcal F$-এ। সুতরাং $f^{-1}\bigl(\bigcup_n B_n\bigr)\in\mathcal F$, অর্থাৎ $\bigcup_n B_n\in\mathcal D$।

তিনটি স্বীকার্য মিলল, তাই $\mathcal D$ একটি σ-algebra (target $E$-এর উপর)। ∎(ধাপ ১)

ধাপ ২ — দিক (⇐): generator-এ পরীক্ষাই যথেষ্ট। ধরা যাক ডান পক্ষ সত্য: প্রতিটি $G\in\mathcal G$-র জন্য $f^{-1}(G)\in\mathcal F$। এর মানে ঠিক $\mathcal G\subseteq\mathcal D$ (সংজ্ঞা অনুসারে)। কিন্তু $\mathcal D$ একটি σ-algebra (ধাপ ১), আর $\sigma(\mathcal G)$ হলো $\mathcal G$-ধারণকারী ক্ষুদ্রতম σ-algebra — তাই $\mathcal G$-কে ধারণকারী যেকোনো σ-algebra $\sigma(\mathcal G)$-কে অন্তর্ভুক্ত করে। ফলে

\[ \mathcal E=\sigma(\mathcal G)\subseteq\mathcal D. \]

এর অর্থ: প্রতিটি $B\in\mathcal E$-ও $\mathcal D$-তে আছে, অর্থাৎ $f^{-1}(B)\in\mathcal F$। সুতরাং $f$ measurable। ∎(ধাপ ২)

ধাপ ৩ — দিক (⇒): সহজ পথ। ধরা যাক $f$ measurable, অর্থাৎ সব $B\in\mathcal E$-র জন্য $f^{-1}(B)\in\mathcal F$। যেহেতু $\mathcal G\subseteq\sigma(\mathcal G)=\mathcal E$, প্রতিটি $G\in\mathcal G$-ও $\mathcal E$-তে; তাই বিশেষত $f^{-1}(G)\in\mathcal F$। ডান পক্ষ পাওয়া গেল। ∎(ধাপ ৩)

দুই দিক মিলে দ্বিমুখী অভেদ প্রতিষ্ঠিত। ∎

অনুসিদ্ধান্ত (CDF-পরীক্ষা) — $X$ একটি RV iff $\{X\le x\}\in\mathcal F$ সব $x\in\mathbb R$-র জন্য। §১-এ (এবং 7.2-এ) দেখানো হয়েছে যে Borel σ-algebra-কে রশ্মি (ray) দিয়ে উৎপন্ন করা যায়: $\mathcal B=\sigma\bigl(\{(-\infty,x]:x\in\mathbb R\}\bigr)$। নিই $\mathcal G=\{(-\infty,x]:x\in\mathbb R\}$। তখন

\[ X^{-1}\bigl((-\infty,x]\bigr)=\{\omega:X(\omega)\le x\}=\{X\le x\}. \]

উপরের উপপাদ্য সরাসরি প্রয়োগ করলে: $X$ measurable (অর্থাৎ RV) $\iff$ প্রতিটি $x$-এর জন্য $\{X\le x\}\in\mathcal F$। এটাই RV-যাচাইয়ের সবচেয়ে কাজের রূপ — গোটা $\mathcal B$ নয়, কেবল "$X$ একটা সীমার নিচে থাকার ঘটনা"-গুলো event কিনা দেখলেই চলে। (একইভাবে $(-\infty,x)$, $[x,\infty)$ বা $(x,\infty)$ generator নিলেও সমতুল্য পরীক্ষা পাওয়া যায়, কারণ এরাও $\mathcal B$ উৎপন্ন করে।)

এক বাক্যে: "যেসব target-set-এর preimage $\mathcal F$-এ পড়ে" তাদের সংগ্রহটি সর্বদা একটি σ-algebra, তাই generator-কে ধারণ করলেই সেটি গোটা $\sigma(\mathcal G)$-কে ধারণ করে—ফলে measurability কেবল generator-এ যাচাই করাই যথেষ্ট, এবং RV-র জন্য তা $\{X\le x\}\in\mathcal F$-এ নেমে আসে।

প্রমাণ ২ — $\sigma(X)$ সুসংজ্ঞায়িত ও ক্ষুদ্রতম (★)¶

দাবি। যেকোনো RV $X:\Omega\to\mathbb R$-এর জন্য সংগ্রহ

\[ \sigma(X):=X^{-1}(\mathcal B)=\bigl\{X^{-1}(B):B\in\mathcal B\bigr\} \]

হলো $\Omega$-এর উপর একটি σ-algebra, এবং এটিই সেই ক্ষুদ্রতম σ-algebra যার সাপেক্ষে $X$ measurable। একে বলা হয় $X$ কর্তৃক উৎপন্ন σ-algebra (σ-algebra generated by $X$) — স্বজ্ঞাগতভাবে "$X$ যে তথ্য বহন করে" তা-ই।

ধাপ ১ — $\sigma(X)$ একটি σ-algebra। এখানে আবার preimage-এর বিনিময়-ধর্মই মূল চাবি, তবে এবার $\mathcal F$-এর বদলে target σ-algebra $\mathcal B$-র বদ্ধতা ব্যবহার করছি।

(A1) $\Omega=X^{-1}(\mathbb R)$ এবং $\mathbb R\in\mathcal B$, তাই $\Omega\in\sigma(X)$।

(A2) ধরা যাক $A\in\sigma(X)$, অর্থাৎ $A=X^{-1}(B)$ কোনো $B\in\mathcal B$-র জন্য। তখন

\[ A^c=\bigl(X^{-1}(B)\bigr)^c=X^{-1}(B^c). \]

যেহেতু $\mathcal B$ complement-বদ্ধ, $B^c\in\mathcal B$, তাই $A^c=X^{-1}(B^c)\in\sigma(X)$।

(A3) ধরা যাক $A_1,A_2,\dots\in\sigma(X)$, অর্থাৎ $A_n=X^{-1}(B_n)$ কোনো $B_n\in\mathcal B$-র জন্য। তখন

\[ \bigcup_{n=1}^{\infty}A_n=\bigcup_{n=1}^{\infty}X^{-1}(B_n)=X^{-1}\!\Bigl(\bigcup_{n=1}^{\infty}B_n\Bigr). \]

$\mathcal B$ গণনাযোগ্য সংযোগে বদ্ধ বলে $\bigcup_n B_n\in\mathcal B$, তাই $\bigcup_n A_n\in\sigma(X)$।

তিনটি স্বীকার্য মিলল। (সাধারণ নীতি: যেকোনো σ-algebra-র preimage-চিত্র $f^{-1}(\mathcal E)$ সর্বদা একটি σ-algebra; এখানে $f=X$, $\mathcal E=\mathcal B$।) ∎(ধাপ ১)

ধাপ ২ — $\sigma(X)\subseteq\mathcal F$ যদি $X$ একটি RV হয়। যেহেতু $X$ RV, প্রতিটি $B\in\mathcal B$-র জন্য $X^{-1}(B)\in\mathcal F$। অর্থাৎ $\sigma(X)$-এর প্রতিটি সদস্যই $\mathcal F$-এ। তাই $\sigma(X)\subseteq\mathcal F$ — অর্থাৎ $X$ কর্তৃক উৎপন্ন তথ্য মূল σ-algebra $\mathcal F$-এ ধরা পড়ে, যা সঙ্গত। ∎(ধাপ ২)

ধাপ ৩ — ক্ষুদ্রতমতা। ধরা যাক $\mathcal H$ যেকোনো σ-algebra ($\Omega$-এর উপর) যার সাপেক্ষে $X$ measurable, অর্থাৎ সব $B\in\mathcal B$-র জন্য $X^{-1}(B)\in\mathcal H$। তাহলে সংজ্ঞা অনুসারে $\sigma(X)=\{X^{-1}(B):B\in\mathcal B\}\subseteq\mathcal H$। সুতরাং $X$-কে measurable করা যেকোনো σ-algebra-কেই $\sigma(X)$ অন্তর্ভুক্ত করে — অর্থাৎ $\sigma(X)$ সেই শ্রেণির ক্ষুদ্রতম। আর $\sigma(X)$ নিজে $X$-কে measurable করে (কারণ যেকোনো $B$-র জন্য $X^{-1}(B)\in\sigma(X)$ স্পষ্টতই), তাই দাবি সম্পূর্ণ। ∎

ব্যাখ্যা — "$X$ যে তথ্য বহন করে"। $\sigma(X)$-এর একটি সদস্য $\{X\in B\}$ মানে "$X$-এর মান $B$-তে পড়ল কি না" — এ প্রশ্নের উত্তর শুধু $X(\omega)$ জানলেই দেওয়া যায়। তাই $\sigma(X)$ ঠিক সেই সব ঘটনা ধারণ করে যা "$X$ পর্যবেক্ষণ করে" নিষ্পত্তি করা যায়, এর বেশি নয়। এই দৃষ্টিভঙ্গিই 7.6-এ independence এবং পরে conditional expectation $\mathbb E[Y\mid\sigma(X)]$-র ভিত্তি — যেখানে "$X$ দেখে $Y$ সম্পর্কে সেরা অনুমান" সংজ্ঞায়িত হয় σ-algebra-র ভাষায়।

এক বাক্যে: $X^{-1}(\mathcal B)$ একটি σ-algebra (কারণ preimage complement ও গণনাযোগ্য সংযোগের সাথে বিনিময় করে এবং $\mathcal B$ এ-দুটোতে বদ্ধ), আর যেহেতু $X$-কে measurable করা যেকোনো σ-algebra-ই $X^{-1}(\mathcal B)$-কে ধারণ করে, এটি ক্ষুদ্রতম—অর্থাৎ ঠিক "$X$-এর বহন করা তথ্য"।

প্রমাণ ৩ — continuous ⇒ Borel measurable (★)¶

দাবি। যদি $g:\mathbb R\to\mathbb R$ একটি continuous (অবিচ্ছিন্ন) ফাংশন হয়, তবে $g$ Borel measurable, অর্থাৎ $g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)$ একটি measurable map। ফলস্বরূপ, $X$ একটি RV হলে $g(X)=g\circ X$-ও একটি RV।

ধাপ ১ — continuity-র topological রূপ। বিশ্লেষণের একটি মৌলিক উপপাদ্য: $g:\mathbb R\to\mathbb R$ continuous $\iff$ প্রতিটি open set $U\subseteq\mathbb R$-এর জন্য $g^{-1}(U)$-ও open। (স্মরণ: $\epsilon$–$\delta$ সংজ্ঞা থেকে এটি বেরোয় — $g(x_0)$-এর চারপাশের যেকোনো open ঘেরাটোপের preimage-এ $x_0$-এর চারপাশে একটা open ঘেরাটোপ থাকে; বিস্তারিত প্রমাণ Real Analysis-এ, এখানে ব্যবহার করছি।) এই অংশটুকুই আমাদের একমাত্র বিশ্লেষণিক ইনপুট; বাকিটা সম্পূর্ণ measure-তাত্ত্বিক।

ধাপ ২ — open set Borel। Borel σ-algebra-র সংজ্ঞাই হলো $\mathcal B=\sigma(\mathcal O)$, যেখানে $\mathcal O$ = $\mathbb R$-এর সব open set-এর সংগ্রহ। বিশেষত প্রতিটি open $U$-ই $\mathcal B$-তে: $\mathcal O\subseteq\mathcal B$।

ধাপ ৩ — good-sets principle প্রয়োগ। এখন প্রমাণ ১ (good-sets principle) সরাসরি খাটাই, target generator হিসেবে $\mathcal G=\mathcal O$ নিয়ে (যেহেতু $\mathcal B=\sigma(\mathcal O)$)। প্রমাণ ১ বলছে: $g$ measurable হওয়ার জন্য শুধু দেখানো দরকার যে প্রতিটি generator-সদস্য $U\in\mathcal O$-র জন্য $g^{-1}(U)\in\mathcal B$।

কিন্তু ধাপ ১ দিয়ে $g^{-1}(U)$ open, আর ধাপ ২ দিয়ে প্রতিটি open set $\mathcal B$-তে। সুতরাং $g^{-1}(U)\in\mathcal B$ — generator-পরীক্ষা উত্তীর্ণ। তাই good-sets principle অনুযায়ী $g$ Borel measurable। ∎(ধাপ ৩)

ধাপ ৪ — composition $g(X)$ একটি RV। ধরা যাক $X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ একটি RV এবং $g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)$ measurable (ধাপ ৩ থেকে, বা যেকোনো measurable $g$)। দেখাতে হবে $g\circ X$ measurable। যেকোনো $B\in\mathcal B$-র জন্য preimage composition-নিয়ম ব্যবহার করি:

\[ (g\circ X)^{-1}(B)=X^{-1}\bigl(g^{-1}(B)\bigr). \]

(এটি সদস্যপদ থেকে সরাসরি: $\omega\in(g\circ X)^{-1}(B)\iff g(X(\omega))\in B\iff X(\omega)\in g^{-1}(B)\iff\omega\in X^{-1}(g^{-1}(B))$।) এখন:

$g$ measurable, তাই $g^{-1}(B)\in\mathcal B$;
$X$ measurable, তাই $X^{-1}\bigl(g^{-1}(B)\bigr)\in\mathcal F$।

সুতরাং $(g\circ X)^{-1}(B)\in\mathcal F$ সব $B\in\mathcal B$-র জন্য, অর্থাৎ $g\circ X$ একটি RV। (এটি একটি স্বতন্ত্রভাবে দরকারি ফল: measurable map-এর composition আবার measurable।) ∎

এই ফলটি প্রভূত শক্তিশালী: $X$ RV হলে $X^2,\ \lvert X\rvert,\ e^{X},\ \sin X,\ \max(X,0)$ — সব continuous (বা আংশিক, যেমন নিচে দেখা যাবে) রূপান্তরই আবার RV। তাই দৈনন্দিন গণিতে গড়া প্রায় প্রতিটি ফাংশনই measurability ভাঙে না।

এক বাক্যে: continuity ঠিক বলে "open-এর preimage open", আর open set-রা Borel; তাই good-sets principle অনুযায়ী generator (open set)-এ পরীক্ষা উত্তীর্ণ হয় ও $g$ Borel measurable হয়ে যায়—এবং measurable map-এর composition measurable হওয়ায় $g(X)$ও একটি RV।

প্রমাণ ৪ — closure under $\sup,\inf,\limsup,\liminf,\lim$ (★★)¶

দাবি। ধরা যাক $f_1,f_2,\dots$ একটি ক্রম, প্রতিটি $f_n:(\Omega,\mathcal F)\to(\overline{\mathbb R},\overline{\mathcal B})$ measurable (এখানে $\overline{\mathbb R}=[-\infty,+\infty]$ বর্ধিত বাস্তব রেখা, যেহেতু sup/inf অসীম হতে পারে)। তবে নিচের সব ফাংশনই measurable:

\[ \sup_n f_n,\qquad \inf_n f_n,\qquad \limsup_n f_n,\qquad \liminf_n f_n, \]

এবং যেখানে $\lim_n f_n$ অস্তিত্বশীল সেখানে তা-ও measurable। (এর বিশেষ ক্ষেত্রে সসীম $\max,\min$-ও।)

মূল কৌশল। বর্ধিত রেখায় Borel σ-algebra $\overline{\mathcal B}$-কে রশ্মি $(a,+\infty]$ (বা সমতুল্যভাবে $[-\infty,a]$) দিয়ে উৎপন্ন করা যায়; তাই প্রমাণ ১ অনুযায়ী একটি ফাংশন $h$ measurable হওয়ার জন্য শুধু প্রতিটি $\{h\le a\}$ (বা $\{h>a\}$) $\mathcal F$-এ পড়লেই হয়। প্রতিটি সুপ্রিমাম/ইনফিমামের জন্য আমরা এই level set-টিকে একটি গণনাযোগ্য ছেদ বা সংযোগ হিসেবে লিখব।

ধাপ ১ — $\sup_n f_n$ measurable। মূল অভেদ:

\[ \Bigl\{\sup_n f_n\le a\Bigr\}=\bigcap_{n=1}^{\infty}\{f_n\le a\}. \]

কেন? কোনো $\omega$-তে $\sup_n f_n(\omega)\le a$ ⟺ প্রতিটি পদ $f_n(\omega)$ ঊর্ধ্বসীমা $a$-কে অতিক্রম করে না (কারণ $\sup$ হলো ক্ষুদ্রতম ঊর্ধ্বসীমা — সব পদ $\le a$ হলে এবং কেবল তখনই $\sup\le a$) ⟺ প্রতিটি $n$-এ $f_n(\omega)\le a$ ⟺ $\omega\in\bigcap_n\{f_n\le a\}$। সদস্যপদ অভিন্ন, অভেদ প্রতিষ্ঠিত।

এখন প্রতিটি $f_n$ measurable বলে $\{f_n\le a\}\in\mathcal F$, আর $\mathcal F$ গণনাযোগ্য ছেদে বদ্ধ (σ-algebra, প্রমাণ-অধ্যায় 7.2-এর উদ্ভূত ধর্ম), তাই $\bigcap_n\{f_n\le a\}\in\mathcal F$। সুতরাং $\{\sup_n f_n\le a\}\in\mathcal F$ সব $a$-র জন্য, অর্থাৎ $\sup_n f_n$ measurable। ∎(ধাপ ১)

ধাপ ২ — $\inf_n f_n$ measurable। প্রতিসম অভেদ:

\[ \Bigl\{\inf_n f_n\ge a\Bigr\}=\bigcap_{n=1}^{\infty}\{f_n\ge a\}, \]

একই যুক্তিতে ($\inf$ হলো বৃহত্তম নিম্নসীমা; সব পদ $\ge a$ হলে এবং কেবল তখনই $\inf\ge a$)। $\{f_n\ge a\}=\{f_n<a\}^c\in\mathcal F$, তাই ছেদটিও $\mathcal F$-এ। রশ্মি $[a,+\infty]$-ও $\overline{\mathcal B}$ উৎপন্ন করে, তাই এই পরীক্ষাই যথেষ্ট: $\inf_n f_n$ measurable। (সংক্ষেপে, $\inf_n f_n=-\sup_n(-f_n)$ লিখেও ধাপ ১ থেকে পাওয়া যেত, যেহেতু $f\mapsto -f$ measurability রক্ষা করে।) ∎(ধাপ ২)

ধাপ ৩ — $\limsup$ ও $\liminf$ measurable। সংজ্ঞা অনুযায়ী

\[ \limsup_{n\to\infty} f_n=\inf_{N\ge 1}\ \Bigl(\sup_{n\ge N} f_n\Bigr),\qquad \liminf_{n\to\infty} f_n=\sup_{N\ge 1}\ \Bigl(\inf_{n\ge N} f_n\Bigr). \]

ভেতরের রাশি বিশ্লেষণ করি। স্থির $N$-এর জন্য $g_N:=\sup_{n\ge N} f_n$ হলো একটা গণনাযোগ্য পরিবার $\{f_n:n\ge N\}$-এর supremum; ধাপ ১ ঠিক এই রূপের জন্য প্রযোজ্য (গণনাযোগ্য index), তাই প্রতিটি $g_N$ measurable। এবার $\limsup_n f_n=\inf_{N} g_N$ — একটা গণনাযোগ্য পরিবার $\{g_N:N\ge 1\}$-এর infimum; ধাপ ২ দিয়ে এটিও measurable।

$\liminf$-এর ক্ষেত্রে ভূমিকা বদলে: $h_N:=\inf_{n\ge N}f_n$ measurable (ধাপ ২), আর $\liminf_n f_n=\sup_N h_N$ measurable (ধাপ ১)। ∎(ধাপ ৩)

ধাপ ৪ — $\lim_n f_n$ (যেখানে অস্তিত্বশীল)। যে সব $\omega$-তে $\lim_n f_n(\omega)$ অস্তিত্বশীল (বর্ধিত অর্থে), সেখানে বিশ্লেষণের সংজ্ঞা থেকেই

\[ \lim_{n} f_n=\limsup_{n} f_n=\liminf_{n} f_n. \]

ডান পাশের দুটো ফাংশন (ধাপ ৩) measurable; তাই তাদের সাধারণ মান, অর্থাৎ $\lim_n f_n$, ওই সব বিন্দুতে measurable। (আরও সূক্ষ্মভাবে, যে set-টিতে limit অস্তিত্বশীল তা নিজেই measurable: এটি $\{\limsup_n f_n=\liminf_n f_n\}=\{\limsup_n f_n-\liminf_n f_n=0\}$, যা দুই measurable ফাংশনের সমতা-set, পরবর্তী প্রমাণ ৫ অনুসারে $\mathcal F$-এ।) ∎

সসীম $\max,\min$। দুটি (বা সসীম সংখ্যক) measurable $f,g$-র জন্য $\max(f,g)$ ও $\min(f,g)$ একই ছাঁচে measurable: $\{\max(f,g)\le a\}=\{f\le a\}\cap\{g\le a\}$ এবং $\{\min(f,g)\le a\}=\{f\le a\}\cup\{g\le a\}$ — উভয়ই $\mathcal F$-এ। (অথবা ক্রমকে শেষ পদে স্থির করে ধাপ ১–২ প্রয়োগ করা যায়।) এই $\max$-নিয়মই পরে $f^+=\max(f,0)$ ও $f^-=\max(-f,0)$-কে measurable নিশ্চিত করবে, যা প্রমাণ ৬-এ ও 7.4-এর integral-সংজ্ঞায় অপরিহার্য।

এক বাক্যে: $\{\sup_n f_n\le a\}$ একটা গণনাযোগ্য ছেদ ও $\{\inf_n f_n\ge a\}$ একটা গণনাযোগ্য ছেদ হওয়ায় sup/inf measurable থাকে, আর $\limsup=\inf_N\sup_{n\ge N}$, $\liminf=\sup_N\inf_{n\ge N}$ এই দুই ধাপের পুনরাবৃত্তিমাত্র—ফলে limit (যেখানে আছে) measurable, এবং σ-algebra-র গণনাযোগ্য বদ্ধতাই এ পুরো স্থিতিশীলতার উৎস।

প্রমাণ ৫ — sums ও products measurable (★★)¶

দাবি। $f,g:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ measurable (সসীম-মানবিশিষ্ট) হলে $f+g$ এবং $fg$-ও measurable। অর্থাৎ RV-দের সংগ্রহ যোগ ও গুণের অধীনে বদ্ধ — তারা একটি বীজগণিত (algebra of functions) গঠন করে।

পথ ক (সরাসরি, rational কাটিং) — $f+g$ measurable। প্রমাণ ১ অনুযায়ী শুধু দেখানো দরকার $\{f+g<a\}\in\mathcal F$ সব $a$-র জন্য (যেহেতু রশ্মি $(-\infty,a)$ $\mathcal B$ উৎপন্ন করে)। মূল অভেদ:

\[ \{f+g<a\}=\bigcup_{q\in\mathbb Q}\bigl(\{f<q\}\cap\{g<a-q\}\bigr). \]

কেন? "(⊇)" সহজ: যদি কোনো $\omega$-তে $f(\omega)<q$ ও $g(\omega)<a-q$, তবে যোগ করে $f(\omega)+g(\omega)<a$। "(⊆)": ধরা যাক $f(\omega)+g(\omega)<a$, অর্থাৎ $f(\omega)<a-g(\omega)$। বাস্তব সংখ্যার ঘনত্ব (density of $\mathbb Q$ in $\mathbb R$) অনুসারে $f(\omega)$ ও $a-g(\omega)$-এর মাঝে একটি মূলদ $q$ আছে: $f(\omega)<q<a-g(\omega)$। তখন $f(\omega)<q$ এবং (ডান অসমতা পুনর্বিন্যাস করে) $g(\omega)<a-q$ — তাই $\omega$ ডান পাশের ($q$-ঘরের) সদস্য। দুই অন্তর্ভুক্তি মিলে অভেদ সম্পূর্ণ।

এখন প্রতিটি $q\in\mathbb Q$-র জন্য $\{f<q\}\in\mathcal F$ ও $\{g<a-q\}\in\mathcal F$ ($f,g$ measurable), তাই তাদের ছেদ $\mathcal F$-এ। মূলদ সংখ্যা গণনাযোগ্য ($\mathbb Q$ countable) — এটাই সূক্ষ্ম বিন্দু — তাই ডান পাশ একটি গণনাযোগ্য সংযোগ, যা $\mathcal F$-এ। সুতরাং $\{f+g<a\}\in\mathcal F$; $f+g$ measurable। ∎(পথ ক)

পথ খ (vector-valued, কাঠামোগত) — একই ফল, ভিন্ন আলোয়। এই পথটি কেন গুরুত্বপূর্ণ: এটি যোগ/গুণ/যেকোনো continuous দুই-চলক ক্রিয়াকে একসাথে সামলায়।

ধাপ খ১ — $\omega\mapsto(f(\omega),g(\omega))$ measurable into $(\mathbb R^2,\mathcal B^2)$. সংজ্ঞা করি $F:\Omega\to\mathbb R^2$, $F(\omega)=(f(\omega),g(\omega))$, যেখানে $\mathcal B^2=\mathcal B\otimes\mathcal B$ হলো সমতলের Borel σ-algebra। $\mathcal B^2$ উৎপন্ন হয় আয়তক্ষেত্র $A\times B$ ($A,B\in\mathcal B$) দিয়ে, তাই প্রমাণ ১ অনুযায়ী $F$ measurable হওয়ার জন্য শুধু

\[ F^{-1}(A\times B)=\{f\in A\}\cap\{g\in B\}\in\mathcal F \]

দেখলেই হয় — যা সত্য, কারণ $\{f\in A\}=f^{-1}(A)\in\mathcal F$ ও $\{g\in B\}=g^{-1}(B)\in\mathcal F$ এবং σ-algebra ছেদ-বদ্ধ। সুতরাং $F$ measurable।

ধাপ খ২ — continuous ক্রিয়া আরোপ। মানচিত্র $s:\mathbb R^2\to\mathbb R$, $s(u,v)=u+v$ continuous; প্রমাণ ৩-এর যুক্তি (open-এর preimage open, good-sets) ঠিক একইভাবে $\mathbb R^2\to\mathbb R$-তেও খাটে, তাই $s$ Borel measurable। এখন composition: $f+g=s\circ F$, দুই measurable map-এর গঠন, তাই (প্রমাণ ৩-এর ধাপ ৪) measurable। ∎(পথ খ)

$fg$ measurable — polarization কৌশল। আলাদা rational-অভেদ না খুঁজে আমরা ইতিমধ্যে-প্রমাণিত যোগ ও বর্গকে কাজে লাগাই। মূল পরিচয়:

\[ fg=\tfrac14\bigl[(f+g)^2-(f-g)^2\bigr]. \]

(সরল বীজগণিত: $(f+g)^2-(f-g)^2=4fg$।) এবার ধাপে ধাপে:

$f+g$ ও $f-g$ measurable (পথ ক বা খ; বিয়োগ = $f+(-1)g$, আর $-g$ measurable কারণ $t\mapsto -t$ continuous);
বর্গ-মানচিত্র $t\mapsto t^2$ continuous, তাই প্রমাণ ৩ দিয়ে Borel measurable; ফলে $(f+g)^2$ ও $(f-g)^2$ measurable (composition);
দুই measurable ফাংশনের বিয়োগও measurable, এবং ধ্রুবক $\tfrac14$ দিয়ে গুণও (এটিও $t\mapsto\tfrac14 t$ continuous-এর composition)।

সুতরাং $fg$ measurable। ∎

(বিকল্প: পথ খ-এর কাঠামোয় $m(u,v)=uv$ continuous, তাই $fg=m\circ F$ সরাসরি measurable — একই উপসংহার, এক লাইনে।) এই দুই ফল একত্রে দেখায় measurable ফাংশনগুলো যোগ, বিয়োগ, ধ্রুবক-গুণ ও গুণে বদ্ধ — অর্থাৎ একটি বীজগণিত; ফলে যেকোনো বহুপদী $P(X,Y)$ দুই RV-তে আবার RV, যা পরিসংখ্যানে (নমুনা-গড়, নমুনা-ভেদাঙ্ক) ব্যবহৃত রাশিগুলোর measurability নিশ্চিত করে।

এক বাক্যে: হয় $\{f+g<a\}=\bigcup_{q\in\mathbb Q}(\{f<q\}\cap\{g<a-q\})$ (মূলদের ঘনত্ব + গণনাযোগ্যতা), নয়তো $\omega\mapsto(f,g)$-কে $\mathbb R^2$-এ measurable দেখিয়ে continuous $+$ আরোপ করে $f+g$ measurable হয়; আর polarization $fg=\tfrac14[(f+g)^2-(f-g)^2]$ ও $t\mapsto t^2$-এর continuity দিয়ে $fg$ও measurable—তাই RV-রা যোগ-গুণে বদ্ধ একটা বীজগণিত গড়ে।

প্রমাণ ৬ — approximation theorem (★★★, 7.4-এর সেতু)¶

এই প্রমাণ গভীর (★★★), কিন্তু গোটা Lebesgue integration (7.4)-এর মেরুদণ্ড। প্রথম পাঠের পরামর্শ: নির্মাণ, একঘাতিতা (ধাপ ২) ও অভিসৃতি (ধাপ ৩)-র বিবৃতি ভালো করে বুঝুন; দরকারে ধাপ ২-এর কেস-বিশ্লেষণের সূক্ষ্ম হিসাব প্রথমবার দ্রুত পড়ে নিন।

দাবি। ধরা যাক $f:(\Omega,\mathcal F)\to[0,\infty]$ একটি অঋণাত্মক (non-negative) measurable ফাংশন। প্রতিটি $n\in\mathbb N$-এর জন্য সংজ্ঞা করি dyadic truncation (দ্বিমিক কর্তন)

\[ f_n:=\sum_{k=0}^{n2^n-1}\frac{k}{2^n}\,\mathbf 1_{\{\,k/2^n\le f<(k+1)/2^n\,\}}\ +\ n\,\mathbf 1_{\{f\ge n\}}. \]

স্বজ্ঞা: $[0,n)$ পরিসরকে $2^{-n}$ মাপের ছোট ছোট ধাপে কাটা হয়েছে, প্রতিটি ধাপে $f$-এর মানকে নিচের প্রান্ত $k/2^n$-এ গোল করা হয়; আর $f\ge n$ হলে মান $n$-এ ছেঁটে দেওয়া (ceiling)। তখন:

(ক) প্রতিটি $f_n$ একটি simple function (সরল ফাংশন — সসীম সংখ্যক মান, প্রতিটি measurable set-এ ধ্রুব) এবং measurable; (খ) ক্রমটি monotone (একঘাতী) বর্ধমান: $0\le f_n\le f_{n+1}$ সর্বত্র; (গ) বিন্দুভিত্তিক convergence (অভিসৃতি) $f_n\to f$, এবং $\{f\le n\}$-এ $0\le f-f_n\le 2^{-n}$ (যেখানে $f$ সীমাবদ্ধ সেখানে সমভাবে — uniform)।

ধাপ ০ — মানগুলো কোথায় বসে। স্থির $\omega$-তে ঠিক দুই রকম: হয় $f(\omega)\ge n$, তখন $f_n(\omega)=n$; নয়তো $f(\omega)<n$, তখন একটি অনন্য $k\in\{0,1,\dots,n2^n-1\}$ আছে যার জন্য $k/2^n\le f(\omega)<(k+1)/2^n$, এবং তখন $f_n(\omega)=k/2^n$। অর্থাৎ $f_n(\omega)$ হলো $f(\omega)$-কে নিচের দিকে নিকটতম $2^{-n}$-গুণিতকে গোল-করা মান, ঊর্ধ্বে $n$-এ আবদ্ধ। স্পষ্টতই $0\le f_n(\omega)\le f(\omega)$ ও $f_n(\omega)\le n$।

ধাপ ১ — $f_n$ simple ও measurable (অংশ ক)। $f_n$ কেবল সসীম সংখ্যক মান নেয়: $\{0,\tfrac1{2^n},\tfrac2{2^n},\dots,\tfrac{n2^n-1}{2^n}\}\cup\{n\}$ — মোট $n2^n+1$টি। আর প্রতিটি মানের স্তর-set একটি measurable set:

\[ \Bigl\{\tfrac{k}{2^n}\le f<\tfrac{k+1}{2^n}\Bigr\}=f^{-1}\!\Bigl(\bigl[\tfrac{k}{2^n},\tfrac{k+1}{2^n}\bigr)\Bigr)\in\mathcal F, \qquad \{f\ge n\}=f^{-1}\bigl([n,\infty]\bigr)\in\mathcal F, \]

যেহেতু $f$ measurable এবং $[\tfrac{k}{2^n},\tfrac{k+1}{2^n})$, $[n,\infty]$ Borel। একটি indicator $\mathbf 1_A$ measurable iff $A\in\mathcal F$ (কারণ $\mathbf 1_A^{-1}(B)$ কেবল $\varnothing,A,A^c,\Omega$-র একটি), এবং measurable ফাংশনের সসীম ধনাত্মক-গুণিত যোগও measurable (প্রমাণ ৫)। সুতরাং $f_n$ একটি measurable simple function। ∎(ধাপ ১)

ধাপ ২ — একঘাতিতা $f_n\le f_{n+1}$ (অংশ খ): dyadic পরিশোধন। এখানেই $2^{-n}\to 2^{-(n+1)}$ গ্রিড দ্বিগুণ সূক্ষ্ম হওয়ার সৌন্দর্য। স্থির $\omega$, ধরি $t=f(\omega)$। দুই কেস:

কেস A: $t\ge n+1$. তখন $f_{n+1}(\omega)=n+1$ এবং (যেহেতু $t\ge n+1>n$) $f_n(\omega)=n$। তাই $f_n(\omega)=n\le n+1=f_{n+1}(\omega)$। ✓

কেস B: $n\le t<n+1$. তখন $f_n(\omega)=n$ (truncation)। আর স্তরে $t<n+1$ বলে $f_{n+1}(\omega)=k/2^{n+1}$ যেখানে $k/2^{n+1}\le t$; বিশেষত $k/2^{n+1}\le t$ মানে $k\ge n\cdot 2^{n+1}$ থেকে শুরু করে, এবং সবচেয়ে ছোট সম্ভাব্য মান $f_{n+1}(\omega)\ge n$ (কারণ $t\ge n$ গোল করলে অন্তত $n$)। সুতরাং $f_n(\omega)=n\le f_{n+1}(\omega)$। ✓

কেস C: $t<n$. তখন উভয় ক্ষেত্রেই truncation-এর বদলে গোল-করা কাজ করে। $f_n(\omega)=k/2^n$ যেখানে এটি $t$-এর নিচে নিকটতম $2^{-n}$-গুণিতক। লক্ষ করি $k/2^n=2k/2^{n+1}$ একটি $2^{-(n+1)}$-গুণিতকও বটে এবং $\le t$; তাই $t$-এর নিচে নিকটতম $2^{-(n+1)}$-গুণিতক $f_{n+1}(\omega)$ অন্তত $k/2^n$ (সূক্ষ্মতর গ্রিডে নিচের প্রান্ত আরও কাছে বা সমান, কখনো দূরে নয়)। অর্থাৎ $f_{n+1}(\omega)\ge f_n(\omega)$। ✓ — এটাই "পরিশোধন": গ্রিড সূক্ষ্ম হলে নিচ-থেকে আনুমান কখনো নামে না, কেবল ওঠে।

তিন কেসেই $f_n(\omega)\le f_{n+1}(\omega)$; যেহেতু $\omega$ যথেচ্ছ, $f_n\le f_{n+1}$ সর্বত্র। ∎(ধাপ ২)

ধাপ ৩ — অভিসৃতি $f_n\to f$ ও ত্রুটি-সীমা (অংশ গ)। স্থির $\omega$, $t=f(\omega)$।

যদি $t<\infty$: তখন $n>t$-এর জন্য সর্বদা $t<n$, তাই $f_n(\omega)$ গোল-করা শাখায় পড়ে এবং সংজ্ঞা থেকে

\[ 0\le t-f_n(\omega)<\frac{1}{2^n}\xrightarrow[n\to\infty]{}0. \]

(কারণ $f_n(\omega)=k/2^n$ আর $t\in[k/2^n,(k+1)/2^n)$, তাই পার্থক্য এক ঘরের চেয়ে ছোট।) সুতরাং $f_n(\omega)\to t=f(\omega)$। বিশেষত $\{f\le n\}$-এ ($t\le n$) এই ত্রুটি $\le 2^{-n}$, যা $\omega$-নিরপেক্ষ — অর্থাৎ $f$ যেখানে $n$-এ আবদ্ধ সেখানে অভিসৃতি সমভাবে (uniform), তাই গোটা সীমাবদ্ধ অংশে।

যদি $t=\infty$: তখন প্রতিটি $n$-এ $f(\omega)\ge n$, তাই $f_n(\omega)=n\to\infty=f(\omega)$। অভিসৃতি বর্ধিত অর্থে বজায়।

দুই ক্ষেত্রেই $f_n(\omega)\to f(\omega)$; বিন্দুভিত্তিক অভিসৃতি প্রতিষ্ঠিত। ∎(ধাপ ৩)

ধাপ ৪ — সাধারণ (সাইন-যুক্ত) $f$। যেকোনো measurable $f:\Omega\to\overline{\mathbb R}$-কে ধনাত্মক ও ঋণাত্মক অংশে ভাঙি:

\[ f^+=\max(f,0),\qquad f^-=\max(-f,0),\qquad f=f^+-f^-,\quad \lvert f\rvert=f^++f^-, \]

যেখানে $f^+,f^-\ge 0$ উভয়ই measurable (প্রমাণ ৪-এর $\max$-নিয়ম)। উপরের নির্মাণ আলাদাভাবে $f^+$ ও $f^-$-এ প্রয়োগ করে simple function $f_n^{+}\uparrow f^+$ ও $f_n^{-}\uparrow f^-$ পাই; তখন $f_n:=f_n^{+}-f_n^{-}$ simple এবং $f_n\to f$ বিন্দুভিত্তিকভাবে (যেখানে $f$ সংজ্ঞায়িত)। ∎

কেন এটাই 7.4-এর ভিত্তি। Lebesgue integral সংজ্ঞায়িত হয় ঠিক এই মই বেয়ে: প্রথমে simple ফাংশনের integral সরল যোগফল হিসেবে, $\int\bigl(\sum_i a_i\mathbf 1_{A_i}\bigr)d\mu=\sum_i a_i\,\mu(A_i)$; তারপর অঋণাত্মক measurable $f\ge 0$-র জন্য

\[ \int f\,d\mu:=\sup\Bigl\{\textstyle\int s\,d\mu:\ s\ \text{simple},\ 0\le s\le f\Bigr\}=\lim_{n}\int f_n\,d\mu, \]

যেখানে শেষ সমতা ঠিক এই উপপাদ্যের একঘাতী $f_n\uparrow f$ থেকে Monotone Convergence Theorem (একঘাতী অভিসৃতি উপপাদ্য) দিয়ে আসে। আর সাধারণ $f$-এর জন্য $\int f=\int f^+-\int f^-$। এই উপপাদ্য না থাকলে "প্রতিটি measurable ফাংশনকে simple দিয়ে নিচ-থেকে একঘাতীভাবে ছোঁয়া যায়" — Lebesgue integration-এর গোটা সংজ্ঞাটাই দাঁড়াত না।

এক বাক্যে: dyadic truncation $f_n$ প্রতিটি স্তরে measurable simple function, গ্রিড দ্বিগুণ সূক্ষ্ম হওয়ায় তা একঘাতী বর্ধমান ($f_n\uparrow$), এবং সীমাবদ্ধ অংশে ত্রুটি $\le 2^{-n}$ হওয়ায় বিন্দুভিত্তিকভাবে $f$-এ পৌঁছায়—এই "simple দিয়ে নিচ-থেকে ছোঁয়া"-ই Lebesgue integral (7.4)-কে গড়ার একমাত্র সিঁড়ি।

প্রমাণ ৭ — pushforward $P_X$ একটি probability measure (★)¶

দাবি। ধরা যাক $(\Omega,\mathcal F,\mathbb P)$ একটি probability space এবং $X:\Omega\to\mathbb R$ একটি RV। সংজ্ঞা করি pushforward (অগ্র-ঠেলা) বা distribution / law (বণ্টন):

\[ P_X(B):=\mathbb P\bigl(X^{-1}(B)\bigr)=\mathbb P(X\in B),\qquad B\in\mathcal B. \]

তবে $P_X$ হলো $(\mathbb R,\mathcal B)$-এর উপর একটি probability measure, ফলে $(\mathbb R,\mathcal B,P_X)$ একটি probability space — RV-এর "নিজস্ব" নমুনাক্ষেত্র।

প্রথমে — $P_X$ সুসংজ্ঞায়িত। প্রতিটি $B\in\mathcal B$-র জন্য $X$ RV হওয়ায় $X^{-1}(B)\in\mathcal F$, তাই $\mathbb P\bigl(X^{-1}(B)\bigr)$ অর্থপূর্ণ ($\mathbb P$ কেবল $\mathcal F$-এর সদস্যে সংজ্ঞায়িত)। এ কারণেই measurability শর্তটি অপরিহার্য — তা ছাড়া $P_X$ লেখাই যেত না।

ধাপ ১ — অঋণাত্মকতা ও মোট ভর $1$। যেকোনো $B$-র জন্য $X^{-1}(B)\in\mathcal F$ এবং $\mathbb P\ge 0$, তাই $P_X(B)=\mathbb P\bigl(X^{-1}(B)\bigr)\ge 0$। আর

\[ P_X(\mathbb R)=\mathbb P\bigl(X^{-1}(\mathbb R)\bigr)=\mathbb P(\Omega)=1, \]

কারণ $X^{-1}(\mathbb R)=\{\omega:X(\omega)\in\mathbb R\}=\Omega$ (প্রতিটি $X(\omega)$ একটি বাস্তব সংখ্যা) এবং $\mathbb P(\Omega)=1$ (probability measure)। ∎(ধাপ ১)

ধাপ ২ — $P_X(\varnothing)=0$. $X^{-1}(\varnothing)=\varnothing$ (কোনো $\omega$-ই $X(\omega)\in\varnothing$ মানে না), তাই $P_X(\varnothing)=\mathbb P(\varnothing)=0$। ∎(ধাপ ২)

ধাপ ৩ — গণনাযোগ্য যোগাত্মকতা (countable additivity)। এটাই measure হওয়ার মূল শর্ত। ধরা যাক $B_1,B_2,\dots\in\mathcal B$ পরস্পর-বিচ্ছিন্ন (pairwise disjoint): $i\ne j\Rightarrow B_i\cap B_j=\varnothing$। দুটি ধাপে চলি।

ধাপ ৩ক — preimage বিচ্ছিন্নতা সংরক্ষণ করে। দাবি: $X^{-1}(B_1),X^{-1}(B_2),\dots$-ও পরস্পর-বিচ্ছিন্ন। কারণ preimage ছেদের সাথে বিনিময় করে:

\[ X^{-1}(B_i)\cap X^{-1}(B_j)=X^{-1}(B_i\cap B_j)=X^{-1}(\varnothing)=\varnothing\qquad(i\ne j). \]

তাই source-জগতেও ঘরগুলো অ-অধিক্রমী থাকে — এটাই $\mathbb P$-র additivity প্রয়োগের পূর্বশর্ত।

ধাপ ৩খ — হিসাব। এবার preimage সংযোগের সাথেও বিনিময় করে এবং $\mathbb P$-র গণনাযোগ্য যোগাত্মকতা (Kolmogorov axiom) ব্যবহার করে:

\[ P_X\!\Bigl(\bigsqcup_{n=1}^{\infty}B_n\Bigr) =\mathbb P\!\Bigl(X^{-1}\!\Bigl(\bigsqcup_{n=1}^{\infty}B_n\Bigr)\Bigr) =\mathbb P\!\Bigl(\bigsqcup_{n=1}^{\infty}X^{-1}(B_n)\Bigr) \overset{(\ast)}{=}\sum_{n=1}^{\infty}\mathbb P\bigl(X^{-1}(B_n)\bigr) =\sum_{n=1}^{\infty}P_X(B_n). \]

এখানে দ্বিতীয় সমতা preimage-সংযোগ বিনিময়; $(\ast)$ ধাপ ৩ক-এর বিচ্ছিন্নতার জন্য $\mathbb P$-এর countable additivity; শেষ সমতা $P_X$-এর সংজ্ঞা। সুতরাং $P_X$ গণনাযোগ্যভাবে যোগাত্মক। ∎(ধাপ ৩)

ধাপ ১–৩ একত্রে: $P_X(\varnothing)=0$, $P_X\ge 0$, গণনাযোগ্য যোগাত্মক, এবং $P_X(\mathbb R)=1$ — তাই $P_X$ একটি probability measure, আর $(\mathbb R,\mathcal B,P_X)$ একটি probability space। ∎

সংযোগ — $F_X$ গোটা $P_X$ নির্ধারণ করে (π–λ, 7.2)। CDF (cumulative distribution function, ক্রমযোজিত বণ্টন ফাংশন) সংজ্ঞায়িত $F_X(x):=P_X\bigl((-\infty,x]\bigr)=\mathbb P(X\le x)$। সংগ্রহ $\mathcal P=\{(-\infty,x]:x\in\mathbb R\}$ একটি π-system (ছেদ-বদ্ধ: $(-\infty,x]\cap(-\infty,y]=(-\infty,\min(x,y)]$) এবং $\sigma(\mathcal P)=\mathcal B$। ধরা যাক $Q$ আরেকটি probability measure যার $Q\bigl((-\infty,x]\bigr)=F_X(x)$ সব $x$-এ — অর্থাৎ $P_X$ ও $Q$ গোটা $\mathcal P$-তে মেলে। তবে 7.2-এর π–λ uniqueness উপপাদ্য (দুই probability measure একটি generating π-system-এ মিললে গোটা $\sigma(\mathcal P)$-তে মেলে) দিয়ে $P_X=Q$ সর্বত্র $\mathcal B$-তে। সুতরাং একটিমাত্র $F_X$ গোটা law $P_X$-কে অনন্যভাবে pin করে — এ কারণেই পরিসংখ্যানে "বণ্টন" বলতে প্রায়শই কেবল CDF-ই যথেষ্ট।

এক বাক্যে: $P_X(B)=\mathbb P(X^{-1}(B))$ অঋণাত্মক, $P_X(\mathbb R)=\mathbb P(\Omega)=1$, এবং preimage বিচ্ছিন্নতা ও সংযোগ দুটোই সংরক্ষণ করায় $\mathbb P$-র countable additivity সরাসরি $P_X$-এ উত্তরায়িত হয়—তাই $(\mathbb R,\mathcal B,P_X)$ একটি probability space, আর π–λ দিয়ে এর CDF $F_X$ গোটা law-কে অনন্যভাবে নির্ধারণ করে।

৫ · কোড ল্যাব (Python)¶

এই অধ্যায়ের কেন্দ্রীয় বস্তুগুলো — measurable map (পরিমাপযোগ্য চিত্রণ), σ(X) (একটা random variable-এর জেনারেট-করা σ-algebra, অর্থাৎ "$X$-এর তথ্য"), pushforward law (সম্মুখ-ঠেলা বণ্টন $P_X$), আর simple function-এর dyadic approximation (দ্বিমিক সিঁড়ি-আসন্নায়ন) — সবই কাগজে বিমূর্ত। কিন্তু এদের একটা সুবিধা আছে: প্রতিটাকেই একটা কম্পিউটার দিয়ে হয় গুনিয়ে, নয় আসন্ন করিয়ে, নয় যাচাই করিয়ে নেওয়া যায়। dyadic সিঁড়ি একটা grid-এর উপর সংখ্যা; $\sigma(X)$ একটা finite Ω-তে কেবল closure গোনার ব্যাপার (যেমন 7.2-এর ল্যাবে); আর $Y=X^2$-এর law একটা seeded Monte-Carlo গড়। এই ল্যাবে তাই §৪-এর প্রতিটা প্রমাণ-উপপাদ্যকে যন্ত্রের হাতে তুলে দিয়ে তাদের সংখ্যাগুলো স্ক্রিনে ফোটানো হবে।

কী কী computationally যাচাই করা হবে, এক নজরে:

Dyadic staircase approximation। $f(x)=x$-এর জন্য $f_n(x)=\min\!\bigl(n,\ \lfloor 2^n x\rfloor/2^n\bigr)$ গড়ে একটা fine grid-এ $\sup\lvert f-f_n\rvert$ ছাপাই $n=1,2,3,4,8$-এ → প্রায় $2^{-n}$; এবং monotone সিঁড়ি $f_n\le f_{n+1}$ pointwise যাচাই করি। একই নির্মাণ একটা বাঁকানো লক্ষ্য $f(x)=\sqrt x$-এও চালাই।
σ(X) of a simple function। একটা finite Ω-তে $k$-টা স্তর-সেট (level set) বিশিষ্ট simple function $X$-এর জন্য $\sigma(X)$ = level set-গুলোকে complement+union-এ বন্ধ করার ফল; যাচাই: $\lvert\sigma(X)\rvert=2^k$ ($k=2,3,4\to 4,8,16$)।
Measurability closure। finite grid-এ দেখাই — সসীম-সংখ্যক measurable step function-এর sup আবার একটা step function (তাই measurable); আর continuous $g$-এর জন্য $g\circ X$ আবার একটা RV (compose করে যাচাই)।
Pushforward / law of $Y=X^2$। default_rng(20260619), $N=10^6$; $X\sim\text{Uniform}(-1,1)$-এ MC $\mathbb E[Y]\to 0.3335$ (সত্যি $1/3$), $\mathbb P(Y\le \tfrac14)\to 0.4997$ (সত্যি $1/2$); এবং $Y$-এর empirical density-কে analytic $\frac{1}{2\sqrt y}$-এর সঙ্গে মিলাই।

স্ক্রিপ্টের কাঠামো¶

পুরো ল্যাবটা একটাই runnable স্ক্রিপ্ট — _code/lab_7-3.py — চারটে ব্যাখ্যাযুক্ত অংশে ভাগ করা। নির্ভরতা শুধু numpy আর standard library-র itertools (subset-জোড়ার উপর iterate করতে, $\sigma(X)$-এর closure-এ)। প্রতিটা অংশ একটা function:

অংশ	function	কী দেখায়	মূল ধারণা
১	`part1_dyadic()`	$\sup\lvert f-f_n\rvert\approx 2^{-n}$, ও $f_n\le f_{n+1}$	approximation
২	`part2_sigma_of_X()`	$\lvert\sigma(X)\rvert=4,8,16$ ($k=2,3,4$)	generated σ-algebra
৩	`part3_closure()`	step-গুলোর sup আবার step; $g\circ X$ আবার RV	closure
৪	`part4_pushforward()`	$\mathbb E[Y]=0.3335$, $\mathbb P(Y\le\tfrac14)=0.4997$	pushforward law

Monte-Carlo অংশের randomness reproducible রাখতে seed বাঁধা: np.random.default_rng(20260619)। dyadic আর $\sigma(X)$ অংশ deterministic — কোনো randomness নেই। নিচের প্রতিটা output block স্ক্রিপ্টটা সত্যিই চালিয়ে পাওয়া আসল stdout; নিজের মেশিনে python3 lab_7-3.py চালালে অবিকল এই সংখ্যাগুলোই পাওয়া যাবে।

import itertools
import numpy as np


def banner(title):
    line = "=" * 64
    print(line)
    print(title)
    print(line)


def show_set(s):
    """frozenset-কে সাজানো {...} string হিসেবে ছাপায়।"""
    if not s:
        return "{}"
    return "{" + ",".join(str(x) for x in sorted(s)) + "}"

৫.১ · Dyadic staircase — $f_n\uparrow f$ এবং $\sup\lvert f-f_n\rvert\approx 2^{-n}$¶

§৪-এর approximation theorem-এর হৃৎপিণ্ড একটা স্পষ্ট নির্মাণ: অঋণাত্মক measurable $f$-এর নিচে একটা dyadic সিঁড়ি

\[ f_n(x)=\min\!\Bigl(n,\ \frac{\lfloor 2^n x\rfloor}{2^n}\Bigr) \]

বসাও — অর্থাৎ $f(x)$-কে নিচ থেকে দ্বিমিক-পর্দা $1/2^n$-এর গুণিতকে গোল করো (আর উপরে $n$-এ ছাঁটো)। $[0,1]$-এ ছাঁট কখনো লাগে না, তাই কার্যত $f_n(x)=\lfloor 2^n x\rfloor/2^n$ — $x$-কে না-ছাড়ানো বৃহত্তম $2^n$-হরের দ্বিমিক ভগ্নাংশ। প্রতিবার $n$ এক বাড়লে পর্দা অর্ধেক হয়, তাই ত্রুটি $\sup\lvert f-f_n\rvert$ ঠিক $2^{-n}$-এর দিকে নামে; আর যেহেতু প্রতিটা পর্দা পরেরটার পরিশোধন (refinement), সিঁড়ি monotone — $f_n\le f_{n+1}$ সর্বত্র। (এটাই 7.4-এ monotone convergence-এর মঞ্চ সাজায়।)

grid হিসেবে $[0,1)$-এ $2{,}000{,}000$ বিন্দু নিই, আর ঠিক ডান-প্রান্ত $1.0$ বাদ দিই — কারণ সেখানে $\lfloor 2^n x\rfloor$ লাফ দিয়ে $2^n$ হয়ে যায় (supremum $[0,1)$-এ অর্জিত হয় না, কেবল আসন্ন হয়)। একই নির্মাণ একটা বাঁকানো লক্ষ্য $f(x)=\sqrt x$-এও চালিয়ে দেখাই — সিঁড়িটা $f$-কেই পড়ে (identity-কে নয়), তাই সেখানেও ত্রুটি $\approx 2^{-n}$।

def dyadic_simple(x, n):
    """n-তম dyadic simple function:
        f_n(x) = min( n , floor(2^n * x) / 2^n ).
    প্রতিবার n বাড়লে পর্দা অর্ধেক হয়; [0,1]-এ cap কখনো লাগে না, তাই
    f_n(x) = x-কে না-ছাড়ানো বৃহত্তম 2^n-হরের দ্বিমিক ভগ্নাংশ।"""
    step = np.floor((2.0 ** n) * x) / (2.0 ** n)
    return np.minimum(float(n), step)


def part1_dyadic():
    banner("PART 1 : dyadic staircase approximation  f_n ^ f")
    grid = np.linspace(0.0, 1.0, 2_000_001)[:-1]      # [0,1), ডান-প্রান্ত বাদ

    print("  target f(x) = x  on [0,1)   (fine grid, 2,000,000 points)\n")
    print("    n     sup|f - f_n|       2^-n        ratio")
    print("   ---    ------------    ----------    -------")
    f = grid
    for n in (1, 2, 3, 4, 8):
        fn = dyadic_simple(grid, n)
        sup_err = float(np.max(np.abs(f - fn)))
        bound = 2.0 ** (-n)
        print(f"   {n:>3d}      {sup_err:>10.6f}    {bound:>10.6f}    {sup_err / bound:>6.3f}")
    print()

    print("  monotone check  f_n <= f_{n+1}  pointwise on the grid:")
    all_mono = True
    for n in range(0, 10):
        fn, fn1 = dyadic_simple(grid, n), dyadic_simple(grid, n + 1)
        mono = bool(np.all(fn <= fn1 + 1e-15))
        all_mono = all_mono and mono
        if n in (0, 1, 2, 3, 8):
            print(f"      f_{n} <= f_{n + 1} everywhere ? {mono}")
    print(f"  => ladder is monotone for all n checked (0..9) ? {all_mono}\n")

    print("  same construction against a curved target f(x) = sqrt(x):")
    print("    n     sup|f - f_n|       2^-n")
    print("   ---    ------------    ----------")
    g = np.sqrt(grid)
    for n in (1, 2, 3, 4, 8):
        step = np.floor((2.0 ** n) * g) / (2.0 ** n)
        gn = np.minimum(float(n), step)
        sup_err = float(np.max(np.abs(g - gn)))
        print(f"   {n:>3d}      {sup_err:>10.6f}    {2.0 ** (-n):>10.6f}")
    return all_mono

================================================================
PART 1 : dyadic staircase approximation  f_n ^ f
================================================================
  target f(x) = x  on [0,1)   (fine grid, 2,000,000 points)

    n     sup|f - f_n|       2^-n        ratio
   ---    ------------    ----------    -------
     1        0.499999      0.500000     1.000
     2        0.249999      0.250000     1.000
     3        0.124999      0.125000     1.000
     4        0.062499      0.062500     1.000
     8        0.003906      0.003906     1.000

  monotone check  f_n <= f_{n+1}  pointwise on the grid:
      f_0 <= f_1 everywhere ? True
      f_1 <= f_2 everywhere ? True
      f_2 <= f_3 everywhere ? True
      f_3 <= f_4 everywhere ? True
      f_8 <= f_9 everywhere ? True
  => ladder is monotone for all n checked (0..9) ? True

  same construction against a curved target f(x) = sqrt(x):
    n     sup|f - f_n|       2^-n
   ---    ------------    ----------
     1        0.500000      0.500000
     2        0.250000      0.250000
     3        0.125000      0.125000
     4        0.062500      0.062500
     8        0.003906      0.003906

পাঠোদ্ধার (read-off)। ত্রুটি-স্তম্ভ আর $2^{-n}$-স্তম্ভ কার্যত অভিন্ন: $0.5,\,0.25,\,0.125,\,0.0625,\,0.003906$ — ratio ঠিক $1.000$। ($f(x)=x$-এ মান $0.499999$ হলো grid-পদক্ষেপের জন্য $2^{-n}$-এর সামান্য-নিচের আসন্ন; আদর্শ supremum $2^{-n}$ অর্জিত হয় না, কেবল আসন্ন হয় — তাই grid-মান ও bound প্রায় মিলে।) প্রতিবার $n$ এক বাড়লে ত্রুটি ঠিক অর্ধেক, কারণ সিঁড়ি-পর্দা $1/2^n$ অর্ধেক হয় — এটাই "যত সূক্ষ্ম দ্বিমিক বিভাজন, তত কাছাকাছি আসন্নায়ন"। monotone-যাচাই সবগুলো $n$-এ True: পরের সিঁড়ি আগেরটাকে কোথাও নিচে নামায় না, কেবল পরিশোধন করে — অর্থাৎ $0\le f_n\uparrow f$, যা §৪-এর approximation theorem-এর হুবহু দাবি। আর বাঁকানো $\sqrt x$-এও একই $2^{-n}$ হার দেখায় যে নির্মাণটা যেকোনো অঋণাত্মক measurable $f$-এর তলায় বসে — identity-তে নয়, $f$-এর নিজের মানে গোল করে — এটাই simple function থেকে integral-এ সেতুর সর্বজনীনতা।

৫.২ · σ(X) — simple function থেকে জেনারেট-করা σ-algebra, $\lvert\sigma(X)\rvert=2^k$¶

§৩–§৪-এ দেখা গেছে একটা simple random variable $X=\sum_{i=1}^k a_i\mathbf 1_{A_i}$-এর জন্য $\sigma(X)=X^{-1}(\mathcal B)$ আসলে কেবল level set (স্তর-সেট) $A_i=\{X=a_i\}$-গুলোকে complement আর union-এ বন্ধ করার ফল — কারণ $X$ এই $A_i$-গুলোর মধ্যে কোনো পার্থক্য টের পায় না, কেবল কোন স্তরে আছ তা বলে। $A_1,\dots,A_k$ একটা partition (Ω-এর পারস্পরিক-বিচ্ছিন্ন আবরণ), তাই এদের closure ঠিক finite atom-ভিত্তিক σ-algebra, যার সদস্যসংখ্যা সবসময় $2^{(\text{atom-সংখ্যা})}=2^k$।

7.2-এর ল্যাবের sigma_algebra() (fixed-point closure, $\{\varnothing,\Omega\}$ থেকে complement+pairwise-union-এ বন্ধ) এখানে পুনর্ব্যবহার করি, কেবল generator হিসেবে level set-গুলো ঢালি। $\Omega=\{0,\dots,7\}$-এ তিনটে simple function নিই — $k=2,3,4$টা ভিন্ন মান বিশিষ্ট — আর প্রতিবার গুনি $\lvert\sigma(X)\rvert$।

def sigma_algebra(omega, generators):
    """finite `omega`-র উপর `generators`-ধারী ক্ষুদ্রতম σ-algebra:
    {∅, Ω} + generator থেকে complement ও pairwise union-এ বন্ধ যতক্ষণ
    family স্থির না হয়। (finite Ω-তে pairwise union সব countable union আনে।)"""
    omega = frozenset(omega)
    fam = {frozenset(), omega}
    for g in generators:
        fam.add(frozenset(g))
    changed = True
    while changed:
        changed = False
        current = list(fam)
        for s in current:                                  # complement-এ বন্ধ
            comp = omega - s
            if comp not in fam:
                fam.add(comp); changed = True
        for s, t in itertools.combinations(current, 2):    # pairwise union
            u = s | t
            if u not in fam:
                fam.add(u); changed = True
    return fam


def level_sets(omega, X):
    """simple function X (point -> value) -এর level set {X = a};
    এগুলোই σ(X)-এর atom।"""
    buckets = {}
    for w in omega:
        buckets.setdefault(X[w], set()).add(w)
    return [frozenset(v) for v in buckets.values()]


def part2_sigma_of_X():
    banner("PART 2 : sigma(X) of a simple function -- |sigma(X)| = 2^k")
    Omega = frozenset(range(8))
    simple_funcs = {
        2: {0: 5, 1: 5, 2: 5, 3: 5, 4: 9, 5: 9, 6: 9, 7: 9},
        3: {0: 1, 1: 1, 2: 1, 3: 2, 4: 2, 5: 3, 6: 3, 7: 3},
        4: {0: 0, 1: 0, 2: 7, 3: 7, 4: 4, 5: 4, 6: 8, 7: 8},
    }
    for k in (2, 3, 4):
        X = simple_funcs[k]
        atoms = level_sets(Omega, X)
        sigX = sigma_algebra(Omega, atoms)
        vals = sorted(set(X.values()))
        print(f"  k = {k}  distinct values {vals}")
        print(f"      level sets {{X=a}} : " +
              ", ".join(show_set(a) for a in sorted(atoms, key=lambda z: sorted(z))))
        print(f"      |sigma(X)| = {len(sigX)}   expected 2^{k} = {2 ** k}   "
              f"match? {len(sigX) == 2 ** k}")
        print()
    return [len(sigma_algebra(Omega, level_sets(Omega, simple_funcs[k]))) for k in (2, 3, 4)]

================================================================
PART 2 : sigma(X) of a simple function -- |sigma(X)| = 2^k
================================================================
  k = 2  distinct values [5, 9]
      level sets {X=a} : {0,1,2,3}, {4,5,6,7}
      |sigma(X)| = 4   expected 2^2 = 4   match? True

  k = 3  distinct values [1, 2, 3]
      level sets {X=a} : {0,1,2}, {3,4}, {5,6,7}
      |sigma(X)| = 8   expected 2^3 = 8   match? True

  k = 4  distinct values [0, 4, 7, 8]
      level sets {X=a} : {0,1}, {2,3}, {4,5}, {6,7}
      |sigma(X)| = 16   expected 2^4 = 16   match? True

পাঠোদ্ধার। তিন ক্ষেত্রেই $\lvert\sigma(X)\rvert$ ঠিক $2^k$ — $k=2\to4$, $k=3\to8$, $k=4\to16$ (match? True)। তাৎপর্যটা হলো: $\sigma(X)$ "$X$-পর্যবেক্ষণ করলে যে প্রশ্নগুলোর উত্তর জানা যায়" তাদের পরিবার, আর simple $X$-এর ক্ষেত্রে সেই প্রশ্নগুলো ঠিক "$\omega$ কোন level set-এ আছে?"-এর সব যৌক্তিক সমন্বয়। $k$টা level set মানে $k$টা atom, আর atom-দের যেকোনো উপসংগ্রহ মেলালে একেকটা সেট — তাই মোট $2^k$। লক্ষণীয়, $X$ যে মানগুলো নেয় (যেমন $\{5,9\}$ বনাম $\{0,4,7,8\}$) তা $\sigma(X)$-এ কিছুই বদলায় না — কেবল কয়টা স্তর (অর্থাৎ partition-এর সূক্ষ্মতা) গুনে; এটাই "$\sigma(X)$ = তথ্যের রুক্ষতা, মানের নাম নয়"। এই finite ছবি 7.7-এ conditional expectation ($\sigma$-algebra-র উপর projection) ও 7.8-এ filtration-এর সরাসরি ভিত্তি।

৫.৩ · Closure — step-গুলোর sup আবার step, এবং $g\circ X$ আবার RV¶

§৪-এর closure-উপপাদ্যগুলো বলে measurable ফাংশনের শ্রেণি ভাঙা যায় না: সসীম (বা গণনাযোগ্য) sup/inf, এবং continuous $g$-এর সঙ্গে composition $g\circ X$ — সব আবার measurable। finite grid-এ এর দুটো রূপ সংখ্যায় দেখাই। (ক) $[0,1)$-কে $4$টা দ্বিমিক ব্লকে ভেঙে তিনটে step function (যাদের মান কেবল ব্লক-সূচকের উপর নির্ভর করে, তাই measurable) নিই; তাদের pointwise sup যদি প্রতিটা ব্লকে ধ্রুবক থাকে, তবে সেটাও একটা step function — অর্থাৎ measurable। যাচাই: প্রতি ব্লকে sup-এর distinct মানসংখ্যা $1$ কিনা। (খ) একটা simple RV $X$ আর continuous $g(t)=t^2-1$ নিয়ে $g\circ X$ গণনা করি — যেহেতু $X$ সসীম-মান, $g\circ X$-ও সসীম-মান, তাই একটা simple RV (measurable); $g$ কিছু স্তর মিলিয়ে দিতে পারে (যেমন $X=\pm1$ দুটোই $g$-তে $0$ দেয়), তাই $g\circ X$-এর স্তরসংখ্যা $\le$ $X$-এর স্তরসংখ্যা।

def part3_closure():
    banner("PART 3 : closure -- sup of step functions, and g o X")
    # (a) 4টা দ্বিমিক ব্লকে তিনটে step function; pointwise sup ব্লকে ধ্রুবক?
    grid = np.linspace(0.0, 1.0, 100_001)[:-1]
    block = np.floor(4.0 * grid).astype(int)            # ব্লক-সূচক 0,1,2,3
    s1_vals = np.array([0.0, 2.0, 1.0, 3.0])
    s2_vals = np.array([1.0, 1.0, 2.5, 0.5])
    s3_vals = np.array([2.0, 0.0, 0.0, 2.0])
    s1, s2, s3 = s1_vals[block], s2_vals[block], s3_vals[block]
    smax = np.maximum.reduce([s1, s2, s3])              # pointwise sup
    per_block_unique = [int(np.unique(np.round(smax[block == b], 12)).size)
                        for b in range(4)]
    smax_block_vals = [float(smax[block == b][0]) for b in range(4)]
    is_step = all(u == 1 for u in per_block_unique)
    print("  (a) sup of 3 measurable step functions on 4 dyadic blocks:")
    print(f"      s1 block-values = {s1_vals.tolist()}")
    print(f"      s2 block-values = {s2_vals.tolist()}")
    print(f"      s3 block-values = {s3_vals.tolist()}")
    print(f"      max block-values= {smax_block_vals}   "
          f"(expected {np.maximum.reduce([s1_vals, s2_vals, s3_vals]).tolist()})")
    print(f"      distinct values per block = {per_block_unique}  "
          f"(all 1 => still a step function => measurable? {is_step})\n")

    # (b) g o X, g(t)=t^2-1 continuous, X simple => g o X simple (measurable)
    print("  (b) composition g o X with continuous g(t) = t^2 - 1:")
    Xvals = np.array([-2.0, -1.0, 0.0, 1.0, 2.0, 3.0])
    gX = Xvals ** 2 - 1.0
    print(f"      X takes values     : {Xvals.tolist()}")
    print(f"      (g o X) values     : {gX.tolist()}")
    n_levels_X, n_levels_gX = int(np.unique(Xvals).size), int(np.unique(gX).size)
    print(f"      #levels of X = {n_levels_X},  #levels of g o X = {n_levels_gX} "
          f"(finite => g o X is a simple RV => measurable)")
    ok_compose = n_levels_gX <= n_levels_X
    n_merged = n_levels_X - n_levels_gX
    print(f"      #levels(g o X) <= #levels(X) ? {ok_compose}  "
          f"(g merged {n_merged} levels: X=+/-1 -> 0 and X=+/-2 -> 3)")
    return is_step, ok_compose

================================================================
PART 3 : closure -- sup of step functions, and g o X
================================================================
  (a) sup of 3 measurable step functions on 4 dyadic blocks:
      s1 block-values = [0.0, 2.0, 1.0, 3.0]
      s2 block-values = [1.0, 1.0, 2.5, 0.5]
      s3 block-values = [2.0, 0.0, 0.0, 2.0]
      max block-values= [2.0, 2.0, 2.5, 3.0]   (expected [2.0, 2.0, 2.5, 3.0])
      distinct values per block = [1, 1, 1, 1]  (all 1 => still a step function => measurable? True)

  (b) composition g o X with continuous g(t) = t^2 - 1:
      X takes values     : [-2.0, -1.0, 0.0, 1.0, 2.0, 3.0]
      (g o X) values     : [3.0, 0.0, -1.0, 0.0, 3.0, 8.0]
      #levels of X = 6,  #levels of g o X = 4 (finite => g o X is a simple RV => measurable)
      #levels(g o X) <= #levels(X) ? True  (g merged 2 levels: X=+/-1 -> 0 and X=+/-2 -> 3)

পাঠোদ্ধার। (ক) তিনটে step-এর pointwise max ব্লকওয়াইজ $[2.0,2.0,2.5,3.0]$ — আর প্রতি ব্লকে distinct মানসংখ্যা $[1,1,1,1]$, অর্থাৎ sup প্রতিটা ব্লকে একটাই মান নেয়, কাজেই এটা আবার একটা step function, তাই measurable (measurable? True)। এটাই §৪-এর "$\max$ measurable" দাবির সংখ্যা-রূপ: measurable building-block-এর sup ভাঙে না। (খ) $X$ ছয়টা মান নেয়, কিন্তু continuous $g(t)=t^2-1$-এর পর $g\circ X$ মাত্র চারটা স্তরে নামে — কারণ $g$ জোড়-প্রতিসম, তাই $X=\pm1\mapsto 0$ আর $X=\pm2\mapsto 3$ মিলে যায় ($g$ merged $2$ levels)। তবু সবগুলো মান সসীম, কাজেই $g\circ X$ একটা simple RV — measurable। লক্ষণীয়, composition স্তর মেলাতে পারে কিন্তু কখনো বাড়ায় না (#levels(g o X) <= #levels(X)), যা $\sigma(g\circ X)\subseteq\sigma(X)$-এরই প্রতিফলন: $g$ প্রয়োগ মানে তথ্য হারানো বা সমান থাকা, নতুন তথ্য নয়।

৫.৪ · Pushforward — $Y=X^2$-এর law, $\mathbb E[Y]=0.3335$, $\mathbb P(Y\le\tfrac14)=0.4997$¶

§৪-এর শেষ প্রমাণে দেখা গেছে pushforward $P_X(B)=\mathbb P(X^{-1}(B))$ একটা genuine probability measure — $X$-এর law। এখানে সেটা হাতেনাতে দেখি: $X\sim\text{Uniform}(-1,1)$ থেকে $Y=X^2$ গড়ে $Y$-এর law-এর দুটো বৈশিষ্ট্য Monte-Carlo-তে আনি। analytic হিসাব সরল — $\mathbb E[Y]=\mathbb E[X^2]=\int_{-1}^{1}\frac{x^2}{2}\,dx=\frac13$, আর $\mathbb P(Y\le\tfrac14)=\mathbb P(\lvert X\rvert\le\tfrac12)=\frac12$ (কারণ $X$ uniform, আর $[-\tfrac12,\tfrac12]$-এর দৈর্ঘ্য $1$ = মোট দৈর্ঘ্য $2$-এর অর্ধেক)। তাছাড়া $Y$-এর density হলো $f_Y(y)=\frac{1}{2\sqrt y}$ on $(0,1]$ — change-of-variable $y=x^2$-এর সরাসরি ফল; empirical histogram-density-কে এই বক্ররেখার সঙ্গে কয়েকটা বিন্দুতে মিলাই। seed বাঁধা default_rng(20260619), $N=10^6$।

def part4_pushforward():
    banner("PART 4 : pushforward law of Y = X^2,  X ~ Uniform(-1,1)")
    rng = np.random.default_rng(20260619)
    N = 1_000_000
    X = rng.uniform(-1.0, 1.0, N)                  # X ~ Uniform(-1,1)
    Y = X * X                                      # Y = X^2 in [0,1]

    EY = float(np.mean(Y))
    P_le_quarter = float(np.mean(Y <= 0.25))
    print(f"  seed            = np.random.default_rng(20260619)")
    print(f"  N               = {N:,}")
    print(f"  X ~ Uniform(-1,1),  Y = X^2\n")
    print(f"  MC  E[Y]        = {EY:.4f}     true 1/3 = {1/3:.4f}   "
          f"abs err {abs(EY - 1/3):.6f}")
    print(f"  MC  P(Y <= 1/4) = {P_le_quarter:.4f}     true 1/2 = {0.5:.4f}   "
          f"abs err {abs(P_le_quarter - 0.5):.6f}\n")

    # law of Y has density f_Y(y) = 1/(2 sqrt y) on (0,1]; histogram বনাম analytic
    print("  empirical vs analytic density of Y,  f_Y(y) = 1/(2 sqrt y):")
    print("      y0      emp. density     1/(2 sqrt y0)")
    print("    -----    --------------    --------------")
    edges = np.linspace(0.0, 1.0, 101)             # 100 bins, প্রস্থ 0.01
    counts, _ = np.histogram(Y, bins=edges)
    width = edges[1] - edges[0]
    dens = counts / (N * width)
    centers = 0.5 * (edges[:-1] + edges[1:])
    for y0 in (0.04, 0.25, 0.64):
        b = int(np.searchsorted(edges, y0, side="right") - 1)
        analytic = 1.0 / (2.0 * np.sqrt(centers[b]))
        print(f"    {centers[b]:>5.3f}      {dens[b]:>10.4f}        {analytic:>10.4f}")
    return EY, P_le_quarter

================================================================
PART 4 : pushforward law of Y = X^2,  X ~ Uniform(-1,1)
================================================================
  seed            = np.random.default_rng(20260619)
  N               = 1,000,000
  X ~ Uniform(-1,1),  Y = X^2

  MC  E[Y]        = 0.3335     true 1/3 = 0.3333   abs err 0.000172
  MC  P(Y <= 1/4) = 0.4997     true 1/2 = 0.5000   abs err 0.000292

  empirical vs analytic density of Y,  f_Y(y) = 1/(2 sqrt y):
      y0      emp. density     1/(2 sqrt y0)
    -----    --------------    --------------
    0.045          2.3664            2.3570
    0.255          0.9955            0.9901
    0.645          0.6240            0.6226

পাঠোদ্ধার। $10^6$ নমুনায় MC $\mathbb E[Y]=0.3335$ — analytic $1/3=0.3333$-এর গা-ঘেঁষা (পরম ত্রুটি $0.00017$), আর $\mathbb P(Y\le\tfrac14)=0.4997$ — analytic $0.5$-এর প্রায় গায়ে (ত্রুটি $0.00029$)। এটাই pushforward law-এর মূর্ত রূপ: $X$-এর সমান-ভর uniform বণ্টন $Y=X^2$ চিত্রণের মধ্য দিয়ে $\mathbb R$-এ ঠেলে দিলে যে নতুন বণ্টন $P_Y$ পাই, তার গড় ও CDF-মান গণনা করেও সঠিক analytic মানে ফেরে — অর্থাৎ "$\Omega$-তে গড়" আর "$Y$-জগতে গড়" একই (এটাই 7.4-এর change-of-variables/LOTUS-এর বীজ)। density-ছকে empirical মান $2.366,\,0.996,\,0.624$ আর analytic $\frac{1}{2\sqrt y}$-এর $2.357,\,0.990,\,0.623$ তিনটে বিন্দুতেই মেলে — দেখায় $Y$-এর law-এর ঘনত্ব ঠিক $\frac{1}{2\sqrt y}$, $0$-এর কাছে অসীমাভিমুখী (কারণ $X^2$ ছোট মানগুলোয় ভিড় জমায়)। লক্ষণীয়, $Y$-এর এই density কখনো আমরা হাতে integrate করিনি — Monte-Carlo স্রেফ preimage-গুনে $P_Y$-কেই ফিরিয়ে এনেছে, যা pushforward-এর সংজ্ঞা $P_Y(B)=\mathbb P(X^{-1}(\{Y\in B\}))$-এরই সংখ্যা-প্রতিচ্ছবি।

================================================================
SUMMARY OF KEY NUMBERS
================================================================
  dyadic sup error at n=8     ~ 2^-8 = 0.003906
  ladder monotone f_n<=f_n+1  : True
  |sigma(X)| for k=2,3,4      : [4, 8, 16]   (expected [4, 8, 16])
  pushforward  E[Y]           = 0.3335   (true 1/3 = 0.3333)
  pushforward  P(Y<=1/4)      = 0.4997   (true 1/2)

সারসংক্ষেপ¶

এই ল্যাব §৪-এর চারটে মূল উপপাদ্যকে যাচাইযোগ্য সংখ্যায় নামিয়ে আনল, এবং প্রতিটা সংখ্যাই canonically মিলেছে। §৫.১ approximation theorem-এর dyadic নির্মাণ চালিয়ে দেখাল $\sup\lvert f-f_n\rvert\to 2^{-n}$ ($n=8$-এ $0.003906$) এবং সিঁড়িটা monotone ($0\le f_n\uparrow f$) — যা 7.4-এর Lebesgue integral-এর সরাসরি simple-function সেতু; বাঁকানো $\sqrt x$-এও একই হার দেখাল নির্মাণটা যেকোনো অঋণাত্মক measurable $f$-এর তলায় বসে। §৫.২ finite Ω-তে level-set-closure গুনে $\lvert\sigma(X)\rvert=4,8,16$ ($k=2,3,4$) প্রতিষ্ঠা করল — $\sigma(X)$ "$X$-এর তথ্য", আর তার আকার নির্ভর করে কেবল কয়টা স্তরে $X$ পার্থক্য টের পায় তার উপর, $X$ কী মান নেয় তার উপর নয়। §৫.৩ দেখাল closure ভাঙে না: তিনটে step-এর sup আবার step (measurable), আর continuous $g$-এর জন্য $g\circ X$ আবার একটা simple RV — composition স্তর মেলাতে পারে কিন্তু বাড়ায় না ($\sigma(g\circ X)\subseteq\sigma(X)$)। আর §৫.৪ pushforward law-কে মূর্ত করল: $X\sim\text{Uniform}(-1,1)$ থেকে $Y=X^2$-এর MC $\mathbb E[Y]=0.3335$ (সত্যি $1/3$) ও $\mathbb P(Y\le\tfrac14)=0.4997$ (সত্যি $1/2$), এবং empirical density-র $\frac{1}{2\sqrt y}$-মিল — সব দেখাল "$\Omega$-তে ভর $\to$ $\mathbb R$-এ ঠেলে $P_X$" সত্যিই একটা সুসংগত probability measure। মূল সংখ্যাগুলো — $0.003906$, $[4,8,16]$, $0.3335$, $0.4997$ — সবই পুনরুৎপাদনযোগ্য, তাই উপরের measurability / $\sigma(X)$ / pushforward / simple-function সেতু — চারটে স্তম্ভই সংখ্যায় দাঁড়িয়ে গেল।

৬ · ভিজ্যুয়ালাইজেশন¶

এই অধ্যায়ের চারটে মূল ধারণা — simple function-দিয়ে approximation, measurability-র preimage-সংজ্ঞা, একটা random variable-এর বহন-করা তথ্য $\sigma(X)$, এবং pushforward বা law $P_X$ — প্রতিটাই এমন এক অমূর্ততা বহন করে যা সমীকরণের সারিতে সহজে ধরা দেয় না, কিন্তু একটা ছবিতে হঠাৎ স্বচ্ছ হয়ে ওঠে। dyadic simple function কীভাবে নিচ থেকে একটা মসৃণ $f$-কে "ধাপে ধাপে" ছুঁয়ে ফেলে, measurability-র অদ্ভুত-শোনা "প্রতিটা Borel set-এর preimage $\mathcal F$-এ থাকতে হবে" শর্তটা জ্যামিতিকভাবে আসলে কী দাবি করছে, $\sigma(X)$-কে "$X$-এর জ্ঞাত তথ্য" বললে সেটা set-এর ভাষায় ঠিক কী রূপ নেয়, আর একটা probability measure $X$-এর মধ্য দিয়ে real line-এ ঠেলে দিলে কোন বণ্টন জন্ম নেয় — এই চারটে প্রশ্নই এই অংশের চারটে ছবির বিষয়।

ছবিগুলোর সব text ইংরেজিতে (matplotlib-এ বাংলা glyph tofu হয়ে যায়), তাই concept-এর ব্যাখ্যা থাকছে এই prose-এ, আর figure-এ থাকছে কেবল গাণিতিক চিহ্ন ও সংক্ষিপ্ত label। প্রতিটি ছবি curriculum-এর সাধারণ figure-style ব্যবহার করে (figstyle.set_style()), dpi=150-এ আঁকা, এবং _assets/ ফোল্ডারে সংরক্ষিত। নিচের প্রতিটি উপ-বিভাগে concept-এর সঙ্গে ছবিটার সংযোগ, তারপর তা তৈরির core code-এর একটা অংশ, এবং সবশেষে embed-করা ছবিটা দেওয়া হলো। চারটে ছবির সম্পূর্ণ script আছে _code/figs_7-3.py-তে।

৬.১ · Dyadic simple function: নিচ থেকে $f$-কে ছুঁয়ে ফেলা¶

প্রথম ছবিটা এই অধ্যায়ের সবচেয়ে শক্তিশালী যন্ত্রকে দৃশ্যমান করে — যে কৌশলে যেকোনো nonnegative measurable function $f$-কে simple function-এর একটা ঊর্ধ্বগামী sequence $f_1\le f_2\le f_3\le\cdots$ দিয়ে আঁটঘাঁট বেঁধে ফেলা যায়, যারা বিন্দু-বিন্দুতে $f$-এ উঠে যায়: $f_n\uparrow f$। এটাই Lebesgue integral-এর সেতু: integral-কে আগে কেবল simple function-এর জন্য (level-গুলোর measure দিয়ে weighted যোগফল হিসেবে) সংজ্ঞায়িত করা হয়, তারপর monotone limit নিয়ে সাধারণ $f$-এ বাড়ানো হয় — আর সেই limit-এর বৈধতা পুরোপুরি দাঁড়িয়ে আছে এই approximation-এর উপর।

ছবিতে একটা মসৃণ nonnegative bump $f$ (নীল মোটা curve) আঁকা হয়েছে $[0,1]$-এ, আর তার নিচে তিনটে rising staircase — $f_1,f_2,f_3$ — ক্রমশ সূক্ষ্ম হতে হতে $f$-কে নিচ থেকে চেপে ধরছে। এদের তৈরির recipe-টা চোখে আঙুল দিয়ে দেখায় কেন এটা domain নয়, range-কে কাটার গল্প: Riemann যেখানে $x$-অক্ষকে (domain) সরু পট্টিতে ভাগ করে, Lebesgue সেখানে $y$-অক্ষকে (range) dyadic স্তরে ভাগ করে। $n$-তম ধাপে range-কে $2^n$টা সমান টুকরোয় কাটা হয়, আর প্রতিটা $x$-এর জন্য $f_n(x)$ হলো $f(x)$-এর ঠিক নিচের dyadic level: $f_n(x)=k/2^n$ যখন $k/2^n\le f(x)<(k+1)/2^n$। এই সংজ্ঞা থেকেই তিনটে ধর্ম সঙ্গে সঙ্গে আসে — $f_n\le f$ (সবসময় নিচের level নিচ্ছি), $f_n$ ঊর্ধ্বগামী ($n$ বাড়লে level সূক্ষ্ম হয়, approximation কখনো খারাপ হয় না), এবং সবচেয়ে গুরুত্বপূর্ণ error $\le 2^{-n}$ — কারণ $f(x)$ ও $f_n(x)$ একই dyadic ব্যবধানে, যার প্রস্থ $2^{-n}$।

এই $2^{-n}$ ত্রুটি-সীমাই ছবিটার আসল বার্তা: approximation-এর মান সর্বত্র সমান হারে ভালো হচ্ছে (uniform on the part where $f$ is bounded), কোনো এক জায়গায় ভালো আর অন্যত্র খারাপ নয়। তাই ছবির $y$-অক্ষে $1/8, 2/8,\dots$ dyadic গ্রিড আঁকা — $f_3$-এর প্রতিটা ধাপ ঠিক এই $1/8$-চওড়া স্তরে বসে, আর deep-blue staircase-টা $f$-এর সঙ্গে কত আঁটসাঁট তা এক নজরেই বোঝা যায়। কেন এই কৌশলে $f_n$ স্বয়ংক্রিয়ভাবে measurable simple function হয়, তারও বীজ এখানে: প্রতিটা level set $\{k/2^n\le f<(k+1)/2^n\}=f^{-1}\big([k/2^n,(k+1)/2^n)\big)$ একটা half-open interval-এর preimage, আর $f$ measurable বলে এটা $\mathcal F$-এ — যা ঠিক পরের ছবির বিষয়।

import numpy as np

def f(x):                                    # smooth nonneg bump on [0,1]
    return 0.9 * np.sin(np.pi * x) ** 1.4

xs = np.linspace(0, 1, 1000)
ax.plot(xs, f(xs), lw=2.6, label=r"$f$  (target)")   # the target curve

for n in (1, 2, 3):                          # dyadic simple f_1, f_2, f_3
    step = 2.0 ** (-n)                        # slice the RANGE into 2^n levels
    fn = np.floor(f(xs) / step) * step        # f_n(x) = k/2^n  (the level below f)
    ax.step(xs, fn, where="post",
            label=fr"$f_{{{n}}}$  ($2^{{{n}}}$ levels)")
ax.annotate(r"simple $f_n\uparrow f$,   error $\leq 2^{-n}$", ...)

$নীল মোটা curve $f$ (একটা মসৃণ nonnegative bump) $[0,1]$-এ, আর তার নিচে তিনটে rising staircase $f_1$ (হালকা), $f_2$ (মাঝারি), $f_3$ (গাঢ় নীল), যারা ক্রমশ সূক্ষ্ম হতে হতে $f$-কে নিচ থেকে ছুঁয়ে ফেলছে; $y$-অক্ষে $0,\tfrac18,\tfrac28,\dots,1$ dyadic level-grid আঁকা, $f_3$-এর প্রতিটা ধাপ ঠিক এই $1/8$-চওড়া স্তরে বসে আছে। উপরে box-এ লেখা: simple $f_n\uparrow f$, error $\le 2^{-n}$ — অর্থাৎ range-কে dyadic level-এ কাটার এই কৌশলে simple function-গুলো একসঙ্গে monotonically এবং uniformly $f$-এ উঠে যায়, যা Lebesgue integral-এর সংজ্ঞার ভিত্তি।$

৬.২ · Measurability একটা pull-back শর্ত: $X^{-1}(B)\in\mathcal F$¶

দ্বিতীয় ছবিটা এই অধ্যায়ের সংজ্ঞাগত হৃৎপিণ্ড — measurability-র preimage-শর্তকে একটা schematic-এ দাঁড় করায়। একটা map $X:\Omega\to\mathbb R$-কে measurable বলা হয় তখনই, যখন প্রতিটা Borel set $B\subseteq\mathbb R$-এর জন্য তার preimage $X^{-1}(B)=\{\omega:X(\omega)\in B\}$ source space-এর σ-algebra $\mathcal F$-এ থাকে। শর্তটা প্রথম শুনলে উল্টো-মুখী মনে হয়: $X$ যায় $\Omega$ থেকে $\mathbb R$-এ, কিন্তু measurability-র দাবি উঠছে উল্টো দিকে — target-এর set টেনে নিয়ে source-এ ফেরত আনলে সে যেন σ-algebra-র সদস্য হয়।

ছবিতে বাঁ দিকে একটা blob $\Omega$ আঁকা (তার নিজস্ব σ-algebra $\mathcal F$ সহ), ডান দিকে real line $\mathbb R$, আর তাদের জুড়ছে একটা বড় তীর $X:\Omega\to\mathbb R$। ডান লাইনে একটা Borel interval $B=[a,b]$ লাল রঙে চিহ্নিত। এখন measurability-র প্রশ্নটা হলো: $B$-কে "পিছনে টেনে" আনলে — অর্থাৎ যেসব $\omega$-এর $X(\omega)$ মান $B$-র ভেতরে পড়ে, তাদের সংগ্রহ $X^{-1}(B)$ — সেই সবুজ ছায়া-অঞ্চলটা কি $\mathcal F$-এ আছে? ছবির ভাঙা সবুজ তীরটা ঠিক এই "pull back $B$" ক্রিয়াটাই দেখায়, $B$ থেকে তার preimage-এ ফিরে। caption-টা সম্পূর্ণ equivalence-টা বলে: $X$ measurable $\Longleftrightarrow$ $X^{-1}(B)\in\mathcal F$ সব Borel $B$-র জন্য।

কেন এই preimage-সংজ্ঞা এত সুবিধাজনক, তার একটা গভীর কারণ ছবিটা ইঙ্গিত করে: preimage set-operation-গুলোর সঙ্গে নিখুঁতভাবে commute করে — $X^{-1}(B^c)=X^{-1}(B)^c$, $X^{-1}(\bigcup_n B_n)=\bigcup_n X^{-1}(B_n)$। ফলে $\{B:X^{-1}(B)\in\mathcal F\}$ নিজেই একটা σ-algebra, আর তা যদি সব open interval ধারণ করে, তবে σ-algebra-বদ্ধতার জোরে গোটা Borel $\mathcal B(\mathbb R)$-কেই ধারণ করে। এটাই §-এর মূল সরলীকরণ: measurability যাচাই করতে অগুনতি Borel set ঘাঁটতে হয় না — কেবল একটা generating class-এর (যেমন সব $(-\infty,a]$, বা সব open interval) preimage $\mathcal F$-এ আছে কিনা দেখলেই যথেষ্ট। তাই বাস্তবে $\{X\le a\}\in\mathcal F$ সব $a$-র জন্য — এই একটামাত্র শর্তই পুরো measurability নিশ্চিত করে দেয়।

এই ছবিটা একই সঙ্গে একটা ভুল ধারণা ভাঙে: measurability $X$-এর continuity বা মসৃণতা নিয়ে কিছু বলে না, বলে কেবল $X$ ও দুই σ-algebra-র মধ্যে সামঞ্জস্য নিয়ে। একটা ভয়ানক discontinuous function-ও measurable হতে পারে (যেমন indicator $\mathbf 1_A$, যদি $A\in\mathcal F$), আবার "তথ্য" কম থাকলে অনেক function non-measurable হয়ে পড়ে। আসল কথা হলো: $\mathcal F$ যেন $X$-এর প্রতিটা "প্রশ্ন" ($X$ কি $B$-তে পড়ল?)-এর উত্তর ধারণ করার মতো যথেষ্ট সমৃদ্ধ হয় — measurability মানে $X$ সেই σ-algebra-র তুলনায় "পাঠযোগ্য"। এই পাঠযোগ্যতার সূক্ষ্মতম পরিমাপই পরের ছবির বিষয়: $X$ ঠিক কতটা তথ্য বহন করে।

from matplotlib.patches import Ellipse, Rectangle, FancyArrowPatch

ax.add_patch(Ellipse((Ocx, Ocy), Ow, Oh, facecolor=C_OUT))     # blob Omega (with F)
ax.add_patch(Ellipse((Pcx, Pcy), Pw, Ph, facecolor=C_PRE,      # the preimage X^{-1}(B)
                     alpha=0.32))                               #   shaded green inside Omega
ax.add_patch(Rectangle((bL, lineY-0.16), bR-bL, 0.32,          # Borel set B on the real line
                       facecolor=C_B))
ax.annotate("", xy=(7.3, 4.8), xytext=(4.7, 4.8))             # the map  X: Omega -> R
ax.add_patch(FancyArrowPatch(..., ls="--", color=C_PRE))      # dashed "pull back B" arrow
ax.text(6.0, 0.55, r"$X$ measurable  $\Longleftrightarrow$  "
        r"$X^{-1}(B)\in\mathcal{F}$  for all Borel $B$")       # the caption

$Schematic: বাঁয়ে একটা ধূসর blob $\Omega$ (σ-algebra $\mathcal F$ সহ), যার ভেতরে একটা সবুজ ছায়া-অঞ্চল $X^{-1}(B)$; ডানে real line $\mathbb R$, তার উপর একটা লাল Borel interval $B=[a,b]$ চিহ্নিত; মাঝখানে বড় তীর $X:\Omega\to\mathbb R$, আর $B$ থেকে তার preimage-এ ফেরা একটা ভাঙা সবুজ "pull back $B$" তীর। নিচে box-এ caption: $X$ measurable $\Longleftrightarrow$ $X^{-1}(B)\in\mathcal F$ for all Borel $B$ — অর্থাৎ target-এর প্রতিটা Borel set পিছনে টানলে তার preimage source-এর σ-algebra-য় থাকতে হবে।$

৬.৩ · $\sigma(X)$: একটা random variable-এর বহন-করা তথ্য¶

তৃতীয় ছবিটা probability-র সবচেয়ে সূক্ষ্ম ধারণাগুলোর একটাকে concrete করে — একটা random variable $X$-এর generated σ-algebra $\sigma(X)$-কে "$X$-এর জ্ঞাত তথ্য" হিসেবে পড়া। বিমূর্ত সংজ্ঞায় $\sigma(X)$ হলো সবচেয়ে ছোট σ-algebra যার সাপেক্ষে $X$ measurable, অর্থাৎ $\sigma(X)=\{X^{-1}(B):B\in\mathcal B(\mathbb R)\}$। কিন্তু $X$ যখন একটা simple function — কেবল কয়েকটা মান $a_1,\dots,a_k$ নেয় — তখন এই বিমূর্ত বস্তুটা একটা চমৎকার সসীম, গোনা-যায় এমন রূপ পায়, আর ছবিটা ঠিক সেটাই দেখায়।

বাঁ panel-এ $X$ গোটা $\Omega$-কে $k=3$টা level set বা atom-এ ভাগ করছে: $\{X=a_1\}$, $\{X=a_2\}$, $\{X=a_3\}$ — এমন তিনটে পরস্পর-বিচ্ছিন্ন টুকরো, যাদের প্রত্যেকটার উপর $X$ একটামাত্র ধ্রুব মান নেয়। এই atom-গুলোই $X$-এর "দৃষ্টির রেজোলিউশন": একই atom-এর দুটো বিন্দু $X$-এর চোখে অভিন্ন, কারণ $X$ তাদের একই মান দেয়। ডান panel-এ দেখানো হয়েছে $\sigma(X)$ আসলে কী — এই atom-গুলোর সব সম্ভাব্য union: খালি union (∅) থেকে শুরু করে একক atom, atom-জোড়া, এবং সব atom মিলে $\Omega$ পর্যন্ত। $k=3$ atom-এর জন্য তাই ঠিক $2^3=8$টা set, প্রতিটা set-এর একটা "atom নেব/নেব না" সিদ্ধান্ত-সমষ্টির সঙ্গে এক-এক সম্পর্কে।

"$\sigma(X)$ = তথ্য" রূপকটা এই ছবিতে নিখুঁতভাবে ফুটে ওঠে। $\sigma(X)$-এর একটা set জানা মানে $X$-এর মান পর্যবেক্ষণ করে যে প্রশ্নের উত্তর দেওয়া যায়, তা জানা। যদি কেউ আমাদের $X(\omega)$-এর মান বলে দেয়, আমরা ঠিক বলতে পারব $\omega$ কোন atom-এ — কিন্তু atom-এর ভেতরে কোথায়, তা পারব না। তাই $\sigma(X)$ ঠিক সেই event-গুলোর সংগ্রহ যাদের ঘটা-না-ঘটা $X$-এর মান থেকে নিশ্চিতভাবে নির্ণয় করা যায়। কম atom (মোটা partition) মানে $X$ কম তথ্য বহন করে, $\sigma(X)$ ছোট; বেশি atom (সূক্ষ্ম partition) মানে বেশি তথ্য, $\sigma(X)$ বড়। চরম দুই প্রান্ত শিক্ষণীয়: $X$ ধ্রুবক হলে atom একটাই ($\Omega$ নিজেই), $\sigma(X)=\{\varnothing,\Omega\}$ — কোনো তথ্য নেই; আর $X$ injective হলে প্রতিটা বিন্দু আলাদা atom, $\sigma(X)$ পুরো power set-এর সমান — সর্বোচ্চ তথ্য।

এই information-as-σ-algebra ভাষাটাই Part VII-এর বাকি অংশের মেরুদণ্ড। Conditional expectation $\mathbb E[Y\mid X]$ মানে $Y$-এর সেরা অনুমান যা কেবল $\sigma(X)$-এর তথ্য ব্যবহার করে — আর সেটা সবসময় প্রতিটা atom-এর উপর ধ্রুবক একটা function (atom-এর ভেতরের গড়)। Filtration $\mathcal F_1\subseteq\mathcal F_2\subseteq\cdots$ মানে সময়ের সঙ্গে atom-গুলো সূক্ষ্ম হতে থাকা, তথ্য জমতে থাকা। তাই এই সরল তিন-atom ছবিটা আসলে martingale, Markov property, ও তথ্য-প্রবাহের পুরো তত্ত্বের বীজ-চিত্র — যেখানে "জানা" আর "একটা σ-algebra-measurable হওয়া" সমার্থক হয়ে যায়।

from matplotlib.patches import Rectangle, FancyBboxPatch

bounds = [0.4, 3.6, 6.7, 9.6]                       # LEFT: three atoms of a simple X
for i in range(3):                                  #   {X=a_1}, {X=a_2}, {X=a_3}
    ax.add_patch(Rectangle((bounds[i], 0.4),
                 bounds[i+1]-bounds[i], 7.6, facecolor=ATOM_COLORS[i]))
    ax.text(..., r"$\{X=a_%d\}$" % (i+1))            #   X is constant (= a_i) on each atom

members = ["∅", "{X=a1}", ..., "Omega"]            # RIGHT: sigma(X) = ALL unions of atoms
for m in members:                                   #   2^k = 8 sets for k = 3 atoms
    ax.add_patch(FancyBboxPatch(...)); ax.text(..., m)
ax.text(..., r"$\sigma(X)=$ information in $X$  ($2^{k}$ sets for $k$ atoms)")

$দুই-panel ছবি। বাঁয়ে: $\Omega$-box তিনটে রঙিন atom-এ ভাগ — $\{X=a_1\},\{X=a_2\},\{X=a_3\}$ — প্রতিটার উপরে তার মান $a_1,a_2,a_3$ (লাল) লেখা, কারণ এই simple $X$ প্রতিটা atom-এ একটামাত্র ধ্রুব মান নেয়। ডানে: $\sigma(X)$-এর সব $2^3=8$টা সদস্য তালিকা করা — ∅, তিনটে একক atom, তিনটে atom-জোড়া, এবং $\Omega$ — অর্থাৎ atom-গুলোর সব সম্ভাব্য union। পাশে box-এ: $\sigma(X)$ = information in $X$ ($2^k$ sets for $k$ atoms) — কম atom মানে কম তথ্য, বেশি atom মানে বেশি তথ্য।$

৬.৪ · Pushforward / law: $P_X(B)=\mathbb P(X\in B)$¶

চতুর্থ ছবিটা এই অধ্যায়ের গন্তব্য — একটা random variable-কে কীভাবে তার law বা distribution $P_X$-এ রূপান্তর করা হয় — তাকে একসঙ্গে schematic ও বাস্তব data দিয়ে দেখায়। ধারণাটা হলো pushforward: source space-এ একটা probability measure $\mathbb P$ আছে, আর measurable map $X$ সেই measure-কে real line-এ "ঠেলে দেয়", জন্ম দেয় $\mathbb R$-এর উপর একটা নতুন measure $P_X$, যার সংজ্ঞা $P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)$। এই একটা সংজ্ঞাই গোটা probability-র "ভাষা পরিবর্তন": মূল space $(\Omega,\mathcal F,\mathbb P)$ যত জটিল বা বিমূর্তই হোক, $X$-সংক্রান্ত সব probability-প্রশ্নের উত্তর এখন real line-এর উপর একটামাত্র measure $P_X$ থেকে পাওয়া যায় — distribution-ই হয়ে ওঠে $X$-এর সম্পূর্ণ probabilistic পরিচয়।

বাঁ panel-এ এই pushforward-ক্রিয়াটা schematically আঁকা: blob $(\Omega,\mathcal F,\mathbb P)$ থেকে measure $\mathbb P$, একটা তীর $X$ বেয়ে নেমে real line-এ, আর সেখানে জন্ম-নেওয়া law $P_X$ (লাল)। নিচের box-এ মূল সংজ্ঞাটা: $P_X(B)=\mathbb P(X\in B)$ — অর্থাৎ "$X$ set $B$-তে পড়ার সম্ভাবনা"-ই হলো $B$-তে pushforward measure-এর ভর। ডান panel-এ এই বিমূর্ত ধারণাটা একটা concrete উদাহরণে ধরা: $X\sim\text{Uniform}(-1,1)$ নিয়ে $Y=X^2$ গঠন করা হয়েছে, এবং বড় sample ($N=400{,}000$, seed default_rng(20260619)) থেকে $Y$-এর histogram আঁকা হয়েছে, তার উপর analytic density $p_Y(y)=\frac{1}{2\sqrt y}$ (লাল curve) চাপানো হয়েছে $(0,1)$-এ।

কেন density-টা ঠিক $\frac{1}{2\sqrt y}$, সেটাই pushforward-এর গণিত। $X$ uniform on $(-1,1)$ হলে তার density $\tfrac12$ on $[-1,1]$। $Y=X^2$-এর CDF বের করতে: $0<y<1$-এর জন্য $\mathbb P(Y\le y)=\mathbb P(-\sqrt y\le X\le\sqrt y)=\tfrac12\cdot 2\sqrt y=\sqrt y$। density হলো এর derivative, $p_Y(y)=\frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y}$। লক্ষণীয় ব্যাপার — $y\to 0^+$-এ density অসীমে ছুটে যায়, কারণ uniform $X$-এর ভর শূন্যের কাছে ঘন হয়ে জমে ($X\approx 0$-এর ছোট ব্যবধান $Y$-এর আরও ছোট ব্যবধানে চাপা পড়ে); আর $y\to 1$-এ density সমতল $\tfrac12$-এর দিকে নামে। ছবির histogram এই দুই আচরণই নিখুঁতভাবে অনুসরণ করছে — বাঁ প্রান্তে আকাশছোঁয়া, ডান প্রান্তে চাপা — যা analytic curve-এর সঙ্গে প্রায় হুবহু মিলে যায়।

এই simulation একটা গভীর সত্য চোখে দেখায়: law $P_X$ সম্পূর্ণভাবে $X$-এর "আকৃতি"-নির্ধারিত, source space-এর কোনো বিবরণ আর লাগে না। দুটো একদম আলাদা probability space-এ সংজ্ঞায়িত দুটো random variable-এর law এক হতে পারে — তখন distribution-গত সব প্রশ্নে তারা অভিন্ন (equal in distribution), যদিও pointwise তারা সম্পূর্ণ ভিন্ন। histogram-এর analytic curve-এর সঙ্গে এই নিবিড় মিল সেটাই ব্যবহারিকভাবে যাচাই করে: $400{,}000$টা নমুনার empirical বণ্টন প্রায় হুবহু $\frac{1}{2\sqrt y}$-তে বসে যাচ্ছে (যাচাইযোগ্য সংখ্যায় empirical $\mathbb E[Y]\approx 0.3335$, যা analytic $\int_0^1 y\cdot\tfrac{1}{2\sqrt y}\,dy=\tfrac13$-এর সঙ্গে মেলে), কারণ law-ই বণ্টনের একমাত্র সত্য, আর simulation কেবল সেই law থেকে নমুনা টানছে। এই pushforward-নীতিই পরে CDF, density, ও সব distribution-উপপাদ্যকে একই measure-theoretic ভিত্তিতে দাঁড় করায়।

import numpy as np

rng = np.random.default_rng(20260619)            # fixed seed for reproducibility
X = rng.uniform(-1.0, 1.0, size=400_000)         # X ~ Uniform(-1, 1)
Y = X ** 2                                        # the pushforward target Y = X^2

ax.hist(Y, bins=np.linspace(0, 1, 61),           # empirical law of Y  (the histogram)
        density=True, label=r"empirical  $Y=X^{2}$")
yy = np.linspace(1e-3, 1.0, 800)
ax.plot(yy, 1.0 / (2.0 * np.sqrt(yy)),           # analytic density  p_Y(y) = 1/(2 sqrt y)
        label=r"$p_Y(y)=\dfrac{1}{2\sqrt{y}}$")
# caption (left schematic):  P_X(B) = P(X in B)  -- the law

$দুই-panel ছবি। বাঁয়ে: pushforward-এর schematic — blob $(\Omega,\mathcal F,\mathbb P)$ থেকে measure $\mathbb P$, একটা তীর $X$ বেয়ে real line $\mathbb R$-এ নেমে জন্ম নিচ্ছে law $P_X$ (লাল), নিচে box-এ সংজ্ঞা $P_X(B)=\mathbb P(X\in B)$। ডানে: $X\sim\text{Uniform}(-1,1)$ থেকে $Y=X^2$-এর histogram ($N=400{,}000$), যার উপর analytic density $p_Y(y)=\frac{1}{2\sqrt y}$ (লাল curve) চাপানো; histogram $y\to0$-এ আকাশছোঁয়া আর $y\to1$-এ চাপা, curve-এর সঙ্গে প্রায় হুবহু মিলে। caption: $P_X(B)=\mathbb P(X\in B)$ — the law।$

৭ · অনুশীলনী¶

প্রতিটি প্রশ্নে difficulty tag (★ সহজ · ★★ মাঝারি · ★★★ চ্যালেঞ্জিং) ও একটি Hint: আছে। পূর্ণ সমাধান _solutions/07-03-measurable-maps-random-variables-solutions.md-এ। চেষ্টা না করে সমাধান দেখবেন না — নিজে হোঁচট খেয়ে তারপর মিলিয়ে নেওয়াটাই শেখার আসল অংশ। প্রশ্নগুলো চার দলে — ক ধারণাগত, খ গণনামূলক, গ প্রমাণভিত্তিক, ঘ কোডিং।

ক · ধারণাগত¶

প্রশ্ন ১ (★). "একটা ফাংশন $X:\Omega\to\mathbb R$ measurable হওয়ার অর্থ — তার সম্পর্কে তোলা ঘটনাগুলোর probability থাকে" — এই বাক্যটি এক অনুচ্ছেদে ব্যাখ্যা করুন। বিশেষত দেখান কেন measurability ঠিক সেই শর্ত যা "$\mathbb P(X\le x)$" বা "$\mathbb P(X\in B)$"-কে অর্থবহ করে, এবং একটা non-measurable $X$-এর জন্য কোন বাক্যটা ভেঙে যায়। (এক লাইনে বলুন: probability measure $\mathbb P$ কোথায় সংজ্ঞায়িত, আর তার সঙ্গে $X^{-1}(B)$-এর সম্পর্ক কী।) Hint: $\mathbb P$ কেবল $\mathcal F$-এর সদস্যদের (ঘটনা) উপর সংজ্ঞায়িত। "$X\in B$" আসলে set $\{X\in B\}=X^{-1}(B)$; তাই $\mathbb P(X\in B)$ লিখতে হলে আগে $X^{-1}(B)\in\mathcal F$ লাগবে — measurability হলো "সব Borel $B$-র জন্য $X^{-1}(B)\in\mathcal F$"। কোনো Borel $B$-র preimage $\mathcal F$-এ না থাকলে $\mathbb P(X\in B)$ বাক্যটাই অর্থহীন।

প্রশ্ন ২ (★). "$\sigma(X)$ ধরে $X$-এর মধ্যেকার তথ্য (information)" — এই কথাটার মানে কী, ব্যাখ্যা করুন। $X$ পর্যবেক্ষণ করার পর কোন প্রশ্নগুলোর উত্তর জানা যায় আর কোনগুলোর যায় না — এটা $\sigma(X)$-এর সদস্যপদের সঙ্গে কীভাবে মেলে? একটা constant random variable $X\equiv c$ আর একটা injective (এক-এক) $X$-এর $\sigma(X)$ তুলনা করে চরম দুই প্রান্ত দেখান। Hint: $\sigma(X)=X^{-1}(\mathcal B)=\{X^{-1}(B):B\in\mathcal B\}$ = $X$-কে measurable করা সবচেয়ে ছোট σ-algebra। একটা ঘটনা $A\in\sigma(X)$ মানে "$X$-এর মান জানলেই $A$ ঘটেছে কি না বলা যায়"। $X\equiv c$ কিছুই আলাদা করে না, তাই $\sigma(X)=\{\varnothing,\Omega\}$ (সর্বনিম্ন তথ্য); $X$ injective হলে প্রতিটি $\omega$ আলাদা মান পায়, তাই $\sigma(X)$ সম্পূর্ণ $\mathcal F$ পর্যন্ত পৌঁছাতে পারে (সর্বোচ্চ তথ্য)।

প্রশ্ন ৩ (★). এক লাইনে (কিন্তু সঠিক যুক্তিতে) ব্যাখ্যা করুন কেন measurable ফাংশনদের একটা ক্রমের $\sup_n X_n$ এবং $\limsup_n X_n$ আবার measurable থাকে। key সূত্রটা কী, এবং কেন সেখানে শুধু গণনাযোগ্য union/intersection লাগে (তাই σ-algebra-র অস্ত্রই যথেষ্ট)? Hint: মূল identity: $\{\sup_n X_n\le x\}=\bigcap_n\{X_n\le x\}$ — ডান পাশ গণনাযোগ্য intersection of events, তাই $\in\mathcal F$; এতে $\sup_n X_n$ measurable। আর $\limsup_n X_n=\inf_m\sup_{n\ge m}X_n$ — sup/inf-এর গণনাযোগ্য রচনা, তাই বদ্ধতা টিকে থাকে। σ-algebra ঠিক গণনাযোগ্য operation-এ বদ্ধ বলেই এটা কাজ করে।

খ · গণনামূলক¶

প্রশ্ন ৪ (★). $\Omega=\{1,2,3,4,5,6\}$ (একটা ছক্কা), $\mathbb P$ uniform। একটা simple random variable $X$ নিন যা তিনটি মান ধরে — level set $A_1=X^{-1}(\{0\})=\{1,2\}$, $A_2=X^{-1}(\{1\})=\{3,4\}$, $A_3=X^{-1}(\{5\})=\{5,6\}$ (অর্থাৎ $X=0,1,5$ যথাক্রমে)। $\sigma(X)$-এর সব উপাদান হাতে লিখে তালিকা করুন এবং মোট সংখ্যা গুনুন। দেখান $\sigma(X)$ ঠিক তিন atom $A_1,A_2,A_3$ দিয়ে গড়া, এবং ব্যাখ্যা করুন কেন $k$টি ভিন্ন মানের simple $X$-এর $\sigma(X)$-এর আকার ঠিক $2^k$। ($k=2,3,4$-এর জন্য আকার লিখুন।) Hint: $X$-এর atom-গুলো হলো তার level set $A_i=X^{-1}(\{a_i\})$; $\sigma(X)$ হলো এদের সব union, তাই $k$ atom-এ $2^k$ সদস্য। এখানে $k=3$, তাই $\lvert\sigma(X)\rvert=2^3=8$ — অর্থাৎ $\varnothing,A_1,A_2,A_3,A_1\cup A_2,A_1\cup A_3,A_2\cup A_3,\Omega$। সাধারণভাবে $k=2,3,4\to 4,8,16$।

প্রশ্ন ৫ (★★). $X\sim U(-1,1)$ (Uniform on $(-1,1)$, density $\tfrac12$ on $(-1,1)$) এবং $Y=g(X)=X^2$। (ক) $Y$-এর support কী, এবং CDF $F_Y(y)=\mathbb P(Y\le y)$ বের করুন $0\le y\le 1$-এর জন্য (পথে $\{X^2\le y\}=\{-\sqrt y\le X\le\sqrt y\}$ ব্যবহার করুন)। (খ) তা differentiate করে density $f_Y(y)$ বের করুন। (গ) $\mathbb E[Y]$ এবং $\mathbb P(Y\le\tfrac14)$ গণনা করুন। (সংখ্যাগুলো মনে রাখার মতো সরল।) Hint: $F_Y(y)=\mathbb P(-\sqrt y\le X\le\sqrt y)=\tfrac12\cdot 2\sqrt y=\sqrt y$, তাই $f_Y(y)=F_Y'(y)=\dfrac{1}{2\sqrt y}$ ($0<y<1$)। $\mathbb E[Y]=\mathbb E[X^2]=\int_{-1}^{1}x^2\cdot\tfrac12\,dx=\tfrac13$; আর $\mathbb P(Y\le\tfrac14)=\sqrt{\tfrac14}=\tfrac12$।

প্রশ্ন ৬ (★). dyadic approximation-এ $n$-তম ধাপের সর্বোচ্চ approximation-error হলো $2^{-n}$ (অর্থাৎ যেখানে $f$ bounded ও $f_n\uparrow f$, সেখানে $0\le f-f_n\le 2^{-n}$)। $n=1,2,3,4$-এর জন্য $2^{-n}$ মান একটা টেবিলে লিখুন এবং দেখান প্রতিধাপে error ঠিক অর্ধেক হচ্ছে, তাই $n\to\infty$-এ $f_n\to f$। ($n$ এক বাড়লে error-অনুপাত কত?) Hint: $2^{-1}=0.5$, $2^{-2}=0.25$, $2^{-3}=0.125$, $2^{-4}=0.0625$। প্রতিধাপে $2^{-(n+1)}/2^{-n}=\tfrac12$ — error geometric ভাবে $\tfrac12$ হারে নামে, তাই $\to 0$। dyadic সিঁড়ির ধাপ-উচ্চতা $2^{-n}$ বলেই সর্বোচ্চ ফাঁক $2^{-n}$।

গ · প্রমাণভিত্তিক¶

প্রশ্ন ৭ (★★). একটা ফাংশন $X:\Omega\to\mathbb R$ ($(\Omega,\mathcal F)$ থেকে $(\mathbb R,\mathcal B)$-তে) দেওয়া। good-sets / check-on-generator যুক্তি ব্যবহার করে প্রমাণ করুন: $$ X \text{ random variable (measurable)} \iff {X\le x}\in\mathcal F \ \ \forall x\in\mathbb R. $$ অর্থাৎ পুরো Borel $\mathcal B$-তে পরীক্ষা না করে শুধু generator $\{(-\infty,x]:x\in\mathbb R\}$-এ preimage যাচাই করাই যথেষ্ট। প্রতিটি দিক স্পষ্টভাবে দেখান। Hint: ($\Rightarrow$) সহজ — $(-\infty,x]\in\mathcal B$, তাই measurable $X$-এ $X^{-1}((-\infty,x])=\{X\le x\}\in\mathcal F$। ($\Leftarrow$) good-sets: $\mathcal D=\{B\subseteq\mathbb R:X^{-1}(B)\in\mathcal F\}$ ধরুন; preimage union/complement/intersection সংরক্ষণ করে বলে $\mathcal D$ একটা σ-algebra। ধরে নেওয়া শর্ত মানে $(-\infty,x]\in\mathcal D\ \forall x$, তাই $\mathcal G=\{(-\infty,x]\}\subseteq\mathcal D$, ফলে $\mathcal B=\sigma(\mathcal G)\subseteq\mathcal D$ — অর্থাৎ সব Borel $B$-র preimage $\in\mathcal F$।

প্রশ্ন ৮ (★★). $X,Y:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ দুটি random variable। প্রমাণ করুন $\max(X,Y)$ (যার মান প্রতিটি $\omega$-তে $\max\{X(\omega),Y(\omega)\}$) আবার একটা random variable। এক লাইনে যোগ করুন কীভাবে একই যুক্তি $\min(X,Y)$-তেও খাটে। Hint: generator-এ পরীক্ষা যথেষ্ট (প্রশ্ন ৭)। লক্ষ করুন $\{\max(X,Y)\le x\}=\{X\le x\}\cap\{Y\le x\}$ — কারণ দুটোর সর্বোচ্চ $\le x$ হওয়া মানে দুটোই $\le x$। ডান পাশ দুই event-এর intersection, তাই $\in\mathcal F$; সব $x$-এ তাই, তাই $\max(X,Y)$ measurable। $\min$-এর জন্য $\{\min(X,Y)\ge x\}=\{X\ge x\}\cap\{Y\ge x\}$ (বা $\min(X,Y)=-\max(-X,-Y)$)।

প্রশ্ন ৯ (★★★). অঋণাত্মক measurable $f\ge 0$-এর জন্য approximation theorem-এর dyadic নির্মাণ: $$ f_n(\omega)=\sum_{k=0}^{n2^n-1}\frac{k}{2^n}\,\mathbf 1_{{k/2^n\le f<(k+1)/2^n}}(\omega)\;+\;n\,\mathbf 1_{{f\ge n}}(\omega). $$ প্রমাণ করুন এই ক্রম monotone increasing, অর্থাৎ $f_n(\omega)\le f_{n+1}(\omega)$ প্রতিটি $\omega$-তে। (অর্থাৎ সিঁড়ি কখনো নামে না, শুধু সূক্ষ্মতর হয়।) Hint: মূল কথা — $n$ থেকে $n+1$-এ গেলে প্রতিটি dyadic ব্যবধান $[\tfrac{k}{2^n},\tfrac{k+1}{2^n})$ ঠিক দুই অর্ধে ভাগ হয় $[\tfrac{2k}{2^{n+1}},\tfrac{2k+1}{2^{n+1}})$ ও $[\tfrac{2k+1}{2^{n+1}},\tfrac{2k+2}{2^{n+1}})$, আর $f_{n+1}$-এর floor-মান বাঁ-প্রান্ত ব্যবহার করে $\ge f_n$-এর মান দেয়; আবার range-ও $n\to n+1$ পর্যন্ত প্রসারিত হয়। যেখানে $f\ge n$ ছিল সেখানে নতুন ধাপে হয় floor-মান $\ge n$, নয় $f\ge n+1$ হলে $n+1\ge n$ — সব ক্ষেত্রে $f_{n+1}\ge f_n$।

ঘ · কোডিং¶

প্রশ্ন ১০ (★). একটা $\sigma(X)$ closure-builder লিখুন: input একটা সসীম $\Omega$ আর $X$-এর level set-গুলো (অর্থাৎ $X$-এর atom-পরিবার, একটা partition); output হলো $\sigma(X)$ — atom-গুলোর সব সম্ভাব্য union ($\varnothing,\Omega$ সহ)। দিয়ে যাচাই করুন: ২টি atom → আকার ৪, ৩টি atom → আকার ৮, ৪টি atom → আকার ১৬ — অর্থাৎ $k$ atom-এ ঠিক $2^k$। Hint: atom-গুলোকে list-of-frozenset হিসেবে নিন; তারপর itertools দিয়ে সব subset-of-atoms-এর union গড়ুন (একটা subset-of-atoms ↔ একটা σ(X)-সদস্য, তাই মোট $2^k$টি)। চাইলে complement+pairwise-union closure লুপও চলবে — দুই পথেই একই উত্তর।

প্রশ্ন ১১ (★★). $X\sim U(-1,1)$, $Y=X^2$-এর law-টা Monte-Carlo-তে যাচাই করুন। default_rng(20260619), $N=10^6$ নিয়ে (ক) $\mathbb E[Y]$-এর আনুমান বের করে analytic $\tfrac13$-এর সঙ্গে মিলিয়ে দেখুন; (খ) $\mathbb P(Y\le\tfrac14)$-এর আনুমান বের করে analytic $\tfrac12$-এর সঙ্গে মিলান; (গ) $Y$-এর histogram-কে analytic density $\dfrac{1}{2\sqrt y}$-এর সঙ্গে চোখে মিলিয়ে দেখুন। (প্রত্যাশিত আনুমান $\approx 0.3335$ ও $0.4997$।) Hint: x = rng.uniform(-1, 1, N); y = x**2; তারপর y.mean() ($\to 0.3335$) আর (y <= 0.25).mean() ($\to 0.4997$)। density-তুলনায় plt.hist(y, bins=100, density=True)-এর উপর f = lambda yy: 1/(2*np.sqrt(yy)) plot করুন (যেখানে $y\to 0$-এ density $\to\infty$, তাই বাঁ-প্রান্ত খুব খাড়া)।

প্রশ্ন ১২ (★★). approximation theorem-এর dyadic $f_n$ implement করুন এবং error $\to 2^{-n}$ দেখান। একটা bounded $f$ নিন (যেমন $f(t)=t$ on $[0,1]$); $f_n(t)=\min\!\big(n,\ \lfloor 2^n f(t)\rfloor/2^n\big)$ গড়ে $n=1,2,3,4$-এর জন্য সর্বোচ্চ error $\sup_t\big(f(t)-f_n(t)\big)$ মাপুন এবং দেখান তা ঠিক $2^{-n}$ ($=0.5,0.25,0.125,0.0625$), প্রতিধাপে অর্ধেক। Hint: def f_n(f, t, n): return np.minimum(n, np.floor((2**n)*f(t))/2**n); এরপর ঘন grid t = np.linspace(0,1,2_000_001)-এ err = np.max(f(t) - f_n(f, t, n)) ছাপান। প্রতিটি $n$-এ err ≈ $2^{-n}$ পাবেন; অনুপাত $\tfrac12$ দেখাতে পরপর দুই error-এর ভাগফল দিন।

৮ · সারসংক্ষেপ ও সংযোগ¶

মূল পয়েন্ট (recap):

Random variable = measurable function। একটা random variable কোনো রহস্যময় বস্তু নয় — সে একটা ফাংশন $X:\Omega\to\mathbb R$ যা $(\Omega,\mathcal F)$ থেকে $(\mathbb R,\mathcal B)$-তে measurable: সব Borel $B$-র জন্য $X^{-1}(B)=\{X\in B\}\in\mathcal F$। এই শর্তই "$\mathbb P(X\le x)$" বা "$\mathbb P(X\in B)$"-কে অর্থবহ করে, কারণ $\mathbb P$ কেবল ঘটনায় (∈ $\mathcal F$) সংজ্ঞায়িত। আর সংজ্ঞাটা যাচাই করা সহজ — check-on-generator (good-sets / সুসেট-নীতি): পুরো $\mathcal B$ নয়, শুধু $\{(-\infty,x]\}$-এ preimage $\mathcal F$-এ থাকলেই $X$ measurable, কারণ $\{B:X^{-1}(B)\in\mathcal F\}$ নিজেই একটা σ-algebra। এর সরাসরি ফল continuous ⇒ Borel, এবং closure: measurable-দের $f+g,\,fg,\,\max,\min,\,\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n$ ও composition $g\circ X$ ($g$ Borel) আবার measurable।
$\sigma(X)$ = "$X$-এর মধ্যে কতটা তথ্য"। generated σ-algebra $\sigma(X)=X^{-1}(\mathcal B)$ = $X$-কে measurable করা সবচেয়ে ছোট σ-algebra = "$X$ পর্যবেক্ষণ করলে যেসব প্রশ্নের উত্তর জানা যায়" তাদের পরিবার। চরম দুই প্রান্ত: $X\equiv c$ দিলে $\sigma(X)=\{\varnothing,\Omega\}$ (তথ্য শূন্য), $X$ injective দিলে $\sigma(X)$ পুরো $\mathcal F$ পর্যন্ত। simple $X$-এর ক্ষেত্রে $k$টি ভিন্ন মান (= $k$ atom) দিলে $\lvert\sigma(X)\rvert=2^k$ ($k=2,3,4\to 4,8,16$)। এই "σ-algebra = তথ্য" ছবিই conditioning (7.7) ও filtration (7.8)-এর বীজ।
Pushforward law ও CDF — বণ্টন rigorous। $X$ তার মাধ্যমে $\Omega$-র ভর $\mathbb P$-কে $\mathbb R$-এ ঠেলে দেয় (push forward), তৈরি হয় $(\mathbb R,\mathcal B)$-এর উপর একটা probability measure — $X$-এর law $P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)$; আর $F_X(x)=P_X((-\infty,x])$, এবং π–λ (7.2) দিয়ে CDF একাই law-কে সম্পূর্ণ pin করে। উদাহরণ $X\sim U(-1,1),\,Y=X^2$: density $\dfrac{1}{2\sqrt y}$ ($0<y<1$), $\mathbb E[Y]=\tfrac13$, $\mathbb P(Y\le\tfrac14)=\tfrac12$ (Monte-Carlo: $0.3335$, $0.4997$; seed default_rng(20260619), $N=10^6$)।
Simple function ও approximation — integration-এর সেতু। simple function $s=\sum_{i=1}^n a_i\mathbf 1_{A_i}$; আর approximation theorem: প্রতিটি অঋণাত্মক measurable $f\ge 0$ হলো simple function-দের একটা ক্রমবর্ধমান point-wise limit ($0\le f_n\uparrow f$, dyadic সিঁড়ি, সর্বোচ্চ error $2^{-n}$ — $n=1,2,3,4\to 0.5,0.25,0.125,0.0625$), সাধারণ $f=f^+-f^-$। এটাই 7.4-এর Lebesgue integral-এর সরাসরি প্রবেশদ্বার; সঙ্গে a.e. (almost everywhere, প্রায়-সর্বত্র) সমতা — null set বাদ দিয়ে সমান হলে integration-এর চোখে সমান।

মূল সংজ্ঞা/তথ্য (এক নজরে):

বস্তু	সংজ্ঞা/তথ্য
measurable map	$f:(\Omega,\mathcal F)\to(E,\mathcal E)$ measurable iff $f^{-1}(B)\in\mathcal F\ \forall B\in\mathcal E$
random variable	$X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)$ measurable; $\{X\in B\}=X^{-1}(B)$
check-on-generator	$X$ RV iff $\{X\le x\}\in\mathcal F\ \forall x$ (good-sets: $\{B:X^{-1}(B)\in\mathcal F\}$ σ-algebra)
$\sigma(X)$ (তথ্য)	$\sigma(X)=X^{-1}(\mathcal B)$ = $X$-কে measurable করা smallest σ-algebra; simple $X$, $k$ মান $\Rightarrow\lvert\sigma(X)\rvert=2^k$
closure	$f+g,\,fg,\,\max,\min,\,\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n,\ g\circ X$ ($g$ Borel) সব measurable
pushforward / law	$P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)$ — $(\mathbb R,\mathcal B)$-এর উপর probability measure
CDF ⟺ law	$F_X(x)=P_X((-\infty,x])$; π–λ দিয়ে CDF law-কে সম্পূর্ণ নির্ধারণ করে
simple function	$s=\sum_{i=1}^n a_i\mathbf 1_{A_i}$ ($a_i\in\mathbb R,\ A_i\in\mathcal F$)
approximation theorem	$f\ge 0$ measurable $\Rightarrow\exists$ simple $0\le f_n\uparrow f$ (dyadic, error $\le 2^{-n}$); সাধারণ $f=f^+-f^-$
canonical সংখ্যা	dyadic $2^{-n}$ ($0.5,0.25,0.125,0.0625$); $\lvert\sigma(X)\rvert=2^k$ ($4,8,16$); $Y=X^2$: $\tfrac{1}{2\sqrt y},\ \mathbb E=\tfrac13,\ \mathbb P(Y\le\tfrac14)=\tfrac12$; MC $0.3335/0.4997$

পূর্ববর্তী সংযোগ:

← 7.2 (σ-Algebra, Measure ও Extension): এই অধ্যায়ের সরাসরি ভিত্তি। measurable map-এর সংজ্ঞা $\mathcal F$-এর উপর দাঁড়ায়; check-on-generator-এর বৈধতা Borel-এর generator-রূপ $\mathcal B=\sigma((-\infty,x])$-এর উপর; আর pushforward law-এর well-defined হওয়া ও law⟺CDF correspondence সরাসরি π–λ uniqueness-এর উপর — π-system-এ মিললেই দুই measure সর্বত্র মেলে।
← 7.1 (Why Measure Theory?): Dirichlet function $\mathbf 1_{\mathbb Q}$ — Riemann-integrable নয় অথচ measurable — এখানে measurability-র উদারতা দেখানোর কেন্দ্রীয় উদাহরণ; আর 7.1-এর "measure zero" / null set-স্বজ্ঞা এখানে a.e.-সমতার ভিত্তি।
← 2.3 / 2.4 (RV স্বজ্ঞাগত; CDF/density): 2.3-এর অনানুষ্ঠানিক "$X$ মানে ফলাফলকে সংখ্যায় অনুবাদ" আর 2.4-এর $F_X(x)=\mathbb P(X\le x)$ এখানে rigorous রূপ পায় — $X:\Omega\to\mathbb R$ measurable, এবং $F_X(x)=P_X((-\infty,x])$ pushforward law-এর সঙ্গে বাঁধা।
← 3.2 (a.e. / প্রায়-সর্বত্র): "প্রায় নিশ্চিতভাবে" ধারণাটাই এখানে measure-তাত্ত্বিক a.e. সমতা ($X=Y$ except a null set) হিসেবে আনুষ্ঠানিক হয়।

পরবর্তী সংযোগ:

→ 7.4 (Lebesgue integral): approximation theorem-এর $0\le f_n\uparrow f$ ঠিক এখানে কাজে লাগে — Lebesgue integral সংজ্ঞায়িত হয় simple function থেকে শুরু করে $\int f\,d\mu=\lim\int f_n\,d\mu$ রূপে, তারপর MCT/Fatou/DCT।
→ 7.7 (Conditional expectation): "$\sigma(X)$ = তথ্য" ছবিই এখানে $\mathbb E[Y\mid X]=\mathbb E[Y\mid\sigma(X)]$ — "$X$ জানা থাকলে $Y$-এর সেরা অনুমান" — রূপে পরিণত হয়।
→ 7.8 (Filtration ও martingale): একটা random variable-এর $\sigma(X)$ থেকে সময়ের সঙ্গে বেড়ে চলা তথ্যের শৃঙ্খল $(\mathcal F_n)$ — filtration — গড়া হয়, যার উপর martingale দাঁড়ায়।

সূত্র (source): Klenke, Probability Theory: A Comprehensive Course — §1.3 (Measurable Maps) ও §1.5 (Random Variables): measurable map-এর সংজ্ঞা, generator-এ measurability-পরীক্ষা, generated σ-algebra $\sigma(X)$, measurable ফাংশনদের closure, image measure (pushforward) $\mathbb P\circ X^{-1}$, distribution/law ও CDF correspondence; simple-function-এর dyadic approximation §1.5–§4.1-এর সংযোগস্থলে (Lebesgue integral-এর প্রস্তুতি)।

এক বাক্যে। এই অধ্যায় 7.2-এর মঞ্চ $(\Omega,\mathcal F,\mathbb P)$-এ মূল চরিত্রটিকে নামায় — random variable = measurable function $X:\Omega\to\mathbb R$ ($X^{-1}(B)\in\mathcal F$, generator-এ যাচাইযোগ্য) — আর তার হাত ধরে আসে তিন প্রাপ্তি: $\sigma(X)$ = তথ্য, pushforward law $P_X$ ও CDF, এবং simple-function approximation ($f_n\uparrow f$) যা 7.4-এর Lebesgue integral-এর সরাসরি সেতু।

পরিমাণ	বিশ্লেষণী	Monte-Carlo (\(N=10^6\))
\(\mathbb E[Y]\)	\(\tfrac13\approx0.3333\)	\(0.3335\)
\(\mathbb P(Y\le 0.25)\)	\(0.5\)	\(0.4997\)

\(n\)	টুকরোর সংখ্যা \(2^n\)	\(\sup\lvert f-f_n\rvert\le 2^{-n}\)
\(1\)	\(2\)	\(0.5\)
\(2\)	\(4\)	\(0.25\)
\(3\)	\(8\)	\(0.125\)
\(4\)	\(16\)	\(0.0625\)

অংশ	function	কী দেখায়	মূল ধারণা
১	`part1_dyadic()`	\(\sup\lvert f-f_n\rvert\approx 2^{-n}\), ও \(f_n\le f_{n+1}\)	approximation
২	`part2_sigma_of_X()`	\(\lvert\sigma(X)\rvert=4,8,16\) (\(k=2,3,4\))	generated σ-algebra
৩	`part3_closure()`	step-গুলোর sup আবার step; \(g\circ X\) আবার RV	closure
৪	`part4_pushforward()`	\(\mathbb E[Y]=0.3335\), \(\mathbb P(Y\le\tfrac14)=0.4997\)	pushforward law

বস্তু	সংজ্ঞা/তথ্য
measurable map	\(f:(\Omega,\mathcal F)\to(E,\mathcal E)\) measurable iff \(f^{-1}(B)\in\mathcal F\ \forall B\in\mathcal E\)
random variable	\(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) measurable; \(\{X\in B\}=X^{-1}(B)\)
check-on-generator	\(X\) RV iff \(\{X\le x\}\in\mathcal F\ \forall x\) (good-sets: \(\{B:X^{-1}(B)\in\mathcal F\}\) σ-algebra)
\(\sigma(X)\) (তথ্য)	\(\sigma(X)=X^{-1}(\mathcal B)\) = \(X\)-কে measurable করা smallest σ-algebra; simple \(X\), \(k\) মান \(\Rightarrow\lvert\sigma(X)\rvert=2^k\)
closure	\(f+g,\,fg,\,\max,\min,\,\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n,\ g\circ X\) (\(g\) Borel) সব measurable
pushforward / law	\(P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)\) — \((\mathbb R,\mathcal B)\)-এর উপর probability measure
CDF ⟺ law	\(F_X(x)=P_X((-\infty,x])\); π–λ দিয়ে CDF law-কে সম্পূর্ণ নির্ধারণ করে
simple function	\(s=\sum_{i=1}^n a_i\mathbf 1_{A_i}\) (\(a_i\in\mathbb R,\ A_i\in\mathcal F\))
approximation theorem	\(f\ge 0\) measurable \(\Rightarrow\exists\) simple \(0\le f_n\uparrow f\) (dyadic, error \(\le 2^{-n}\)); সাধারণ \(f=f^+-f^-\)
canonical সংখ্যা	dyadic \(2^{-n}\) (\(0.5,0.25,0.125,0.0625\)); \(\lvert\sigma(X)\rvert=2^k\) (\(4,8,16\)); \(Y=X^2\): \(\tfrac{1}{2\sqrt y},\ \mathbb E=\tfrac13,\ \mathbb P(Y\le\tfrac14)=\tfrac12\); MC \(0.3335/0.4997\)

7.3 — Measurable Maps ও Random Variables (যে ফাংশনদের পরিমাপ করা যায়)¶

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶

১.১ যেখানে 7.2 থেমেছিল — আর এই অধ্যায়ের নতুন বস্তু¶

১.২ কেন প্রতিটি ফাংশন চলবে না — measurability-র জন্ম¶

১.৩ তিনটি প্রাপ্তি — তথ্য, বণ্টন, ও integration-এর সেতু¶

১.৪ এই অধ্যায়ের পথরেখা¶

২ · মূল ধারণা ও সংজ্ঞা¶

২.১ Preimage — যে ভাষায় measurability লেখা হয়¶

২.২ Measurable Map ও Random Variable — কেন্দ্রীয় সংজ্ঞা¶

২.৩ Check-on-Generator ও Good-Sets Principle — সংজ্ঞা যাচাইযোগ্য করার চাবি¶

২.৪ Generated σ-Algebra \(\sigma(X)\) — "\(X\)-এর মধ্যে কতটা তথ্য"¶

২.৫ Borel Function ও Continuous ⇒ Borel — measurable-দের প্রাচুর্য¶

২.৬ Closure Properties — measurable থেকে measurable¶

২.৭ Pushforward Measure, Law ও CDF — বণ্টন rigorous¶

২.৮ Simple Function — integration-এর মৌলিক ইট¶

২.৯ Approximation Theorem ও a.e. সমতা — Lebesgue integral-এর প্রবেশদ্বার¶

৩ · পূর্ণাঙ্গ উদাহরণ¶

উদাহরণ ১ — indicator কখন random variable (★)¶

উদাহরণ ২ — simple function ও \(\sigma(X)\) (★)¶

কংক্রিট: \(k=3\)¶

উদাহরণ ৩ — check-on-generator (★★)¶

প্রয়োগ ১: \(X=\max(Y,c)\)¶

প্রয়োগ ২: একটা monotone \(X\)¶

উদাহরণ ৪ — continuous ও Borel function of a RV (★)¶

উদাহরণ ৫ — pushforward / law of \(Y=X^2\) (★★)¶

Monte-Carlo মিলিয়ে দেখা¶

উদাহরণ ৬ — dyadic approximation by simple functions (★★)¶

সংখ্যায়: error টেবিল¶

৪ · প্রমাণ ও উৎপাদন¶

প্রমাণ ১ — good-sets principle: generator-এ পরীক্ষাই যথেষ্ট (★★)¶

প্রমাণ ২ — \(\sigma(X)\) সুসংজ্ঞায়িত ও ক্ষুদ্রতম (★)¶

প্রমাণ ৩ — continuous ⇒ Borel measurable (★)¶

প্রমাণ ৪ — closure under \(\sup,\inf,\limsup,\liminf,\lim\) (★★)¶

প্রমাণ ৫ — sums ও products measurable (★★)¶

প্রমাণ ৬ — approximation theorem (★★★, 7.4-এর সেতু)¶

প্রমাণ ৭ — pushforward \(P_X\) একটি probability measure (★)¶

৫ · কোড ল্যাব (Python)¶

স্ক্রিপ্টের কাঠামো¶

৫.১ · Dyadic staircase — \(f_n\uparrow f\) এবং \(\sup\lvert f-f_n\rvert\approx 2^{-n}\)¶

৫.২ · σ(X) — simple function থেকে জেনারেট-করা σ-algebra, \(\lvert\sigma(X)\rvert=2^k\)¶

৫.৩ · Closure — step-গুলোর sup আবার step, এবং \(g\circ X\) আবার RV¶

৫.৪ · Pushforward — \(Y=X^2\)-এর law, \(\mathbb E[Y]=0.3335\), \(\mathbb P(Y\le\tfrac14)=0.4997\)¶

সারসংক্ষেপ¶

৬ · ভিজ্যুয়ালাইজেশন¶

৬.১ · Dyadic simple function: নিচ থেকে \(f\)-কে ছুঁয়ে ফেলা¶

৬.২ · Measurability একটা pull-back শর্ত: \(X^{-1}(B)\in\mathcal F\)¶

৬.৩ · \(\sigma(X)\): একটা random variable-এর বহন-করা তথ্য¶

৬.৪ · Pushforward / law: \(P_X(B)=\mathbb P(X\in B)\)¶