7.3 — Measurable Maps ও Random Variables (যে ফাংশনদের পরিমাপ করা যায়)¶
১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶
১.১ যেখানে 7.2 থেমেছিল — আর এই অধ্যায়ের নতুন বস্তু¶
আগের অধ্যায়ে (7.2) আমরা অনেক পরিশ্রমে একটা দৃঢ় বস্তু গড়েছিলাম — probability space \((\Omega,\mathcal F,\mathbb P)\): একটা নমুনাক্ষেত্র \(\Omega\), ঘটনার একটা σ-algebra \(\mathcal F\) (complement ও গণনাযোগ্য union-বদ্ধ পরিবার), আর তার উপর একটা measure \(\mathbb P\) যা প্রতিটি ঘটনাকে \([0,1]\)-এ একটা আকার দেয়। Carathéodory extension আর π–λ uniqueness মিলিয়ে আমরা নিশ্চিত হয়েছিলাম — এই মঞ্চটা সুসংগত ও unambiguous।
কিন্তু এই মঞ্চে এখনও একটা প্রধান চরিত্র অনুপস্থিত। বাস্তব পরিসংখ্যানে আমরা \(\Omega\)-এর কোনো বিমূর্ত ফলাফল \(\omega\) নিয়ে সরাসরি কাজ করি না — আমরা কাজ করি সংখ্যা নিয়ে: একটা পরিমাপ, একটা গণনা, একটা উচ্চতা, একটা ক্ষতি। অর্থাৎ আমরা প্রতিটি ফলাফল \(\omega\)-কে একটা বাস্তব সংখ্যায় অনুবাদ করি — এটাই random variable (দৈব চলক)। 2.3-এ আমরা একে অনানুষ্ঠানিকভাবে চিনেছিলাম: "একটা random variable মানে ফলাফলকে সংখ্যায় রূপান্তরের নিয়ম"। কিন্তু সেই অধ্যায়ে আমরা একটা সূক্ষ্ম প্রশ্ন এড়িয়ে গিয়েছিলাম, যা এখন আর এড়ানো চলে না।
মূল উপলব্ধি: একটা random variable আসলে কোনো রহস্যময় নতুন বস্তু নয় — সে স্রেফ একটা ফাংশন
প্রতিটি ফলাফল \(\omega\) ঢোকে, একটা সংখ্যা \(X(\omega)\) বেরোয়। কিন্তু \(\Omega\) থেকে \(\mathbb R\)-এ যাওয়া সব ফাংশন কি random variable হিসেবে চলবে? এই প্রশ্নই এ অধ্যায়ের সূচনা — আর উত্তরটা "না", এবং সেই "না"-এর পেছনের শর্তটাই measurability।
এক বাক্যে সূচনা। 7.2 দিয়েছিল মঞ্চ \((\Omega,\mathcal F,\mathbb P)\); এই অধ্যায় সেই মঞ্চে মূল চরিত্রটিকে নামায় — random variable হলো একটা ফাংশন \(X:\Omega\to\mathbb R\), আর প্রশ্ন: কোন ফাংশনগুলো বৈধ?
১.২ কেন প্রতিটি ফাংশন চলবে না — measurability-র জন্ম¶
random variable নিয়ে আমরা যা-ই করতে চাই, তার গোড়ায় একটা দাবি আছে: আমরা জিজ্ঞেস করতে চাই সম্ভাব্যতা-প্রশ্ন —
এগুলোই তো random variable-এর গোটা উপযোগিতা — CDF, density, প্রত্যাশা, সব এদের উপরই দাঁড়ায়। কিন্তু একটু থামি: \(\mathbb P(\cdot)\) তো শুধু ঘটনার উপর সংজ্ঞায়িত — অর্থাৎ \(\mathcal F\)-এর সদস্যদের উপর (7.2)। তাহলে "\(\mathbb P(X\in B)\)" লিখতে গেলে আগে নিশ্চিত হতে হবে যে "\(X\in B\)" নিজে একটা ঘটনা, অর্থাৎ \(\mathcal F\)-এর সদস্য।
"\(X\in B\)" বলতে আসলে কোন set বোঝায়? ঠিক সেই ফলাফলগুলোর সংগ্রহ যাদের \(X\)-মান \(B\)-তে পড়ে:
অর্থাৎ \(B\)-এর preimage (পূর্বপ্রতিচ্ছবি — \(X\) দিয়ে \(B\)-তে পৌঁছানো সব input)। তাহলে দাবিটা দাঁড়াল:
এবং আমরা চাই এটা শুধু একটা-দুটো \(B\)-র জন্য নয়, যথেষ্ট-বড় একটা শ্রেণির সব \(B\)-র জন্য সত্য হোক — যাতে \((-\infty,x]\), \((a,b]\), open set, এবং তাদের থেকে গড়া সবকিছু ধরা পড়ে। সেই "যথেষ্ট-বড় শ্রেণি" হলো ঠিক Borel \(\mathcal B(\mathbb R)\) (7.2)। আর "\(X^{-1}(B)\in\mathcal F\) সব Borel \(B\)-র জন্য" — এই শর্তটারই নাম measurability (পরিমাপযোগ্যতা)।
এখন স্পষ্ট কেন সব ফাংশন চলবে না: যদি কোনো ফাংশন \(X\)-এর জন্য কোনো Borel \(B\) পাওয়া যায় যার preimage \(X^{-1}(B)\) মোটেই \(\mathcal F\)-এর সদস্য নয় (Vitali-ধরনের একটা "অগম্য" set, 7.2-এর §১.১ মনে করুন), তবে "\(\mathbb P(X\in B)\)" বাক্যটাই অর্থহীন — \(\mathbb P\) ওই set-এ সংজ্ঞায়িতই নয়। এমন ফাংশনকে random variable বলা যায় না। measurability হলো ঠিক সেই ছাঁকনি যা কেবল সেই ফাংশনদের ছাড়ে যাদের নিয়ে সম্ভাব্যতা-প্রশ্ন তোলা যায়।
এক বাক্যে measurability। \(\mathbb P\) শুধু ঘটনায় (∈ \(\mathcal F\)) সংজ্ঞায়িত, তাই \(\mathbb P(X\in B)\) অর্থবহ হতে হলে \(\{X\in B\}=X^{-1}(B)\)-কে ঘটনা হতে হবে — "সব Borel \(B\)-র জন্য \(X^{-1}(B)\in\mathcal F\)" এই শর্তই measurability, এবং এটিই বৈধ random variable-এর ছাঁকনি।
১.৩ তিনটি প্রাপ্তি — তথ্য, বণ্টন, ও integration-এর সেতু¶
measurability-র সংজ্ঞাটা প্রথমে কারিগরি মনে হলেও, এর হাত ধরে তিনটে গভীর ও কাজের বস্তু আসে — এই অধ্যায়ের আসল পুরস্কার, আর Part VII-এর বাকিটার বীজ।
-
প্রাপ্তি ১ — \(\sigma(X)\): "\(X\)-এর মধ্যে কতটা তথ্য"। একটা random variable \(X\) পর্যবেক্ষণ করলে আমরা কেবল কিছু প্রশ্নের উত্তর জানতে পারি — যেমন "\(X\le 3\) কি?" — কিন্তু \(\omega\)-এর অন্য সূক্ষ্ম খুঁটিনাটি জানতে পারি না। \(X\) যেসব ঘটনাকে "দৃশ্যমান" করে, তাদের সবার সংগ্রহই generated σ-algebra \(\sigma(X)=X^{-1}(\mathcal B)\) — \(X\)-কে measurable করা সবচেয়ে ছোট σ-algebra, অর্থাৎ "\(X\)-এ ধরা তথ্যের পরিমাণ"-এর গাণিতিক রূপ। এই "σ-algebra = তথ্য" ছবিটাই পরে conditional expectation (7.7 — "\(\sigma(X)\) জানা থাকলে প্রত্যাশা") ও filtration (7.8 — সময়ের সঙ্গে বেড়ে চলা তথ্য)-এর ভিত্তি।
-
প্রাপ্তি ২ — law হিসেবে pushforward। এতদিন "\(X\)-এর বণ্টন" বলতে আমরা pmf/pdf-এর অনানুষ্ঠানিক ছবি বুঝতাম (2.3–2.4)। এখন একে rigorous করি: \(X\) তার মাধ্যমে \(\Omega\)-র উপরকার ভর \(\mathbb P\)-কে \(\mathbb R\)-এ "ঠেলে দেয়" (push forward) — তৈরি হয় \((\mathbb R,\mathcal B)\)-এর উপর একটা নতুন probability measure
$$ P_X(B)\;=\;\mathbb P\big(X^{-1}(B)\big)\;=\;\mathbb P(X\in B), $$
যার নাম law বা distribution (বণ্টন) — এটাই pushforward / image measure (সম্মুখ-ঠেলা পরিমাপ)। এবং \(F_X(x)=P_X((-\infty,x])\) রূপে CDF আবির্ভূত হয়; 7.2-এর π–λ uniqueness বলে দেয় — CDF একাই এই law-কে সম্পূর্ণ নির্ধারণ করে।
- প্রাপ্তি ৩ — simple-function সেতু (integration-এর দিকে)। measurable ফাংশনদের সবচেয়ে শক্তিশালী structural সত্য: প্রতিটি অঋণাত্মক measurable \(f\)-কে simple function (\(s=\sum a_i\mathbf 1_{A_i}\), কেবল কয়েকটা মান নেয়) দিয়ে নিচ থেকে ক্রমবর্ধমানভাবে ছোঁয়া যায় — \(f_n\uparrow f\), একটা "dyadic সিঁড়ি"। এই approximation theorem-ই হবে পরের অধ্যায়ের (7.4) Lebesgue integral-এর সরাসরি প্রবেশদ্বার: integral প্রথমে simple function-এ সংজ্ঞায়িত (সহজ — ভর × আকার), তারপর limit নিয়ে সব measurable \(f\)-এ প্রসারিত।
এক বাক্যে প্রাপ্তি। measurability তিন উপহার দেয় — \(\sigma(X)\) ("\(X\)-এর তথ্য", ⇒ 7.7/7.8), pushforward law \(P_X\) ("বণ্টন rigorous", CDF ⟺ law via π–λ), আর simple-function approximation \(f_n\uparrow f\) (⇒ 7.4-এর Lebesgue integral)।
১.৪ এই অধ্যায়ের পথরেখা¶
- §২ সব মূল ধারণার precise সংজ্ঞা — measurable map ও random variable; check-on-generator ও good-sets principle; \(\sigma(X)\) ও তথ্য; Borel function ও continuous⇒Borel; closure properties (যোগ/গুণ/\(\max\)/\(\sup\)/\(\limsup\)/\(\lim\) ও composition); pushforward measure / law / CDF correspondence; simple function; approximation theorem; এবং a.e. সমতা — প্রতিটির স্বজ্ঞাসহ, ভারী প্রমাণ §৪-এ স্থগিত রেখে।
- §৪ ভারী প্রমাণ — good-sets principle ও তা থেকে check-on-generator-এর বৈধতা; continuous ⇒ Borel; closure-এর derivation (\(\{f+g<a\}\)-কে rational দিয়ে খোলা, \(\{\sup_n f_n\le a\}=\bigcap_n\{f_n\le a\}\), \(\limsup\)/\(\lim\)-এর measurability); \(\sigma(X)\) যে ক্ষুদ্রতম তা; \(P_X\) যে probability measure; law ⟺ CDF (π–λ দিয়ে); এবং approximation theorem-এর dyadic-staircase নির্মাণ।
- §৫–৬ simulation ও চিত্র (seed 20260619) — 7-3-dyadic-approximation (অঋণাত্মক \(f\)-এর নিচে dyadic simple সিঁড়ি \(f_n\uparrow f\) কীভাবে চেপে ওঠে), 7-3-preimage-measurability (\(X^{-1}(B)\)-কে \(\{X\in B\}\) ঘটনা হিসেবে, বিশেষত \(X^{-1}((-\infty,x])\)), 7-3-sigma-generated-by-X (\(\sigma(X)=X^{-1}(\mathcal B)\)-কে "\(X\)-এর তথ্য-পরিবার" হিসেবে), এবং 7-3-pushforward-law (\(\Omega\)-র ভরকে \(\mathbb R\)-এ ঠেলে \(P_X\) ও তার CDF তৈরি)।
এর পরে Part VII এগোয়: 7.4 এই measurable ফাংশনদের উপরই Lebesgue integral \(\int X\,d\mu\) গড়ে (approximation theorem-কে ভিত্তি করে) এবং MCT/Fatou/DCT প্রমাণ করে; 7.5 \(L^p\) space, Hilbert space ও Radon–Nikodym theorem; 7.6 σ-algebra-দের independence; 7.7 এই \(\sigma(X)\)-কেই "শর্তসাপেক্ষ তথ্য" ধরে conditional expectation; 7.8 filtration ও martingale — শেষে rigorous CLT-র দিকে।
এক বাক্যে পথরেখা। §২ precise সংজ্ঞা → §৪ প্রমাণ → §৫–৬ চার চিত্র (seed 20260619); আর এই measurable-ফাংশন ভিত্তির উপর Part VII গড়ে 7.4 (Lebesgue integral) → 7.7 (\(\sigma(X)\)-ভিত্তিক conditional expectation) → 7.8 (filtration), rigorous CLT-র পথে।
২ · মূল ধারণা ও সংজ্ঞা¶
এই বিভাগে এ অধ্যায়ের সব formal বস্তুর precise সংজ্ঞা দিই — প্রতিটি প্রতীক প্রথম ব্যবহারেই খুলে। কাঠামো §১-এর সুতো ধরে: প্রথমে কোন ফাংশন বৈধ (measurable map, random variable, check-on-generator — ২.১–২.৩); তারপর তথ্যের ভাষা (\(\sigma(X)\) — ২.৪); তারপর কোন ফাংশন measurable (Borel function, continuous⇒Borel, closure — ২.৫–২.৬); তারপর বণ্টন rigorous (pushforward / law / CDF — ২.৭); শেষে integration-এর সেতু (simple function ও approximation theorem, a.e. — ২.৮–২.৯)। ভারী প্রমাণগুলো §৪-এ — এখানে কেবল বিবৃতি ও স্বজ্ঞা, স্পষ্ট forward pointer সহ।
২.১ Preimage — যে ভাষায় measurability লেখা হয়¶
সব সংজ্ঞার গোড়ায় একটাই অপারেশন — preimage (পূর্বপ্রতিচ্ছবি)। একটা ফাংশন \(f:\Omega\to E\) ও target-এর একটা subset \(B\subseteq E\) দিলে,
হলো ঠিক সেই input-গুলো যাদের output \(B\)-তে পড়ে। (সাবধান: এখানে \(f^{-1}\) মানে inverse function নয় — \(f\) উল্টানো-যোগ্য না হলেও preimage সবসময় সংজ্ঞায়িত; এটা শুধু একটা set।)
preimage-কে measurability-র ভাষা বানায় তার একটা অসাধারণ গুণ: সে set-অপারেশনের সঙ্গে নিখুঁতভাবে অদলবদল করে (commute) — যেকোনো (এমনকি গণনাযোগ্য-অসীম) সংগ্রহের জন্য
অর্থাৎ preimage union, intersection ও complement — তিনটেই অবিকৃত রাখে। ঠিক এই তিন সংরক্ষণই পরে good-sets principle (২.৩) ও closure-প্রমাণগুলোকে (§৪) প্রায় আপনাআপনি চালিয়ে দেবে — কারণ σ-algebra-র axiom-ও তো এই তিন অপারেশন নিয়েই।
এক বাক্যে। \(f^{-1}(B)=\{f\in B\}\) হলো \(B\)-তে অবতরণকারী input-দের set, আর সে union/intersection/complement সংরক্ষণ করে — এই সংরক্ষণই গোটা অধ্যায়ের কারিগরি ইঞ্জিন।
২.২ Measurable Map ও Random Variable — কেন্দ্রীয় সংজ্ঞা¶
এবার মূল সংজ্ঞা। দুটো measurable space নিই — \((\Omega,\mathcal F)\) (source, 7.2-এর σ-algebra) ও \((E,\mathcal E)\) (target, তার নিজের σ-algebra)।
সংজ্ঞা (measurable map, পরিমাপযোগ্য চিত্রণ)। একটা ফাংশন \(f:\Omega\to E\)-কে \(\mathcal F\text{–}\mathcal E\) measurable বলা হয় যদি target-এর প্রতিটি measurable set-এর preimage source-এ measurable হয়: $$ f^{-1}(B)\in\mathcal F\qquad\text{সব }B\in\mathcal E\text{-র জন্য}. $$ (একে \(f:(\Omega,\mathcal F)\to(E,\mathcal E)\) লেখা হয়।)
বিশেষ ও সবচেয়ে গুরুত্বপূর্ণ ক্ষেত্রে target হলো বাস্তব রেখা তার Borel σ-algebra সহ — \((E,\mathcal E)=(\mathbb R,\mathcal B)\), যেখানে \(\mathcal B=\mathcal B(\mathbb R)\) হলো 7.2-এর Borel σ-algebra (\(=\sigma(\text{open sets})\))।
সংজ্ঞা (random variable, দৈব চলক)। একটা probability space \((\Omega,\mathcal F,\mathbb P)\)-এর উপর একটা random variable হলো একটা measurable map $$ X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B), \qquad\text{অর্থাৎ}\qquad X^{-1}(B)\in\mathcal F\ \ \forall B\in\mathcal B. $$ এই শর্ত মানার সুবাদেই প্রতিটি Borel \(B\)-র জন্য \(\{X\in B\}=X^{-1}(B)\) একটা ঘটনা, তাই \(\mathbb P(X\in B)\) সর্বদা অর্থবহ।
দুটো টীকা স্বচ্ছতার জন্য:
- পরিভাষা। \(\Omega\)-তে কোনো probability না বসিয়ে কেবল \((\Omega,\mathcal F)\)-এর কাঠামোয় measurable হলে অনেকে \(X\)-কে measurable function বলেন; "random variable" শব্দটা সাধারণত একটা probability measure \(\mathbb P\)-এর প্রেক্ষাপটে ব্যবহৃত। গাণিতিক শর্তটা একই — measurability।
- বর্ধিত মান। অনেক সময় \(X\) মান নেয় \(\overline{\mathbb R}=[-\infty,+\infty]\)-এ (যেমন \(\sup_n X_n\) অসীম হতে পারে); তখন target \((\overline{\mathbb R},\mathcal B(\overline{\mathbb R}))\), আর \(X\)-কে বলা হয় extended-valued (বর্ধিত-মান) random variable। সংজ্ঞা অপরিবর্তিত।
এক বাক্যে। random variable = measurable map \(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\), অর্থাৎ প্রতিটি Borel \(B\)-র preimage \(X^{-1}(B)\) একটা ঘটনা — এটিই \(\mathbb P(X\in B)\)-কে সর্বদা অর্থবহ করে।
২.৩ Check-on-Generator ও Good-Sets Principle — সংজ্ঞা যাচাইযোগ্য করার চাবি¶
সংজ্ঞাটা শুনতে ভয়ংকর: "প্রতিটি Borel \(B\)-র জন্য \(X^{-1}(B)\in\mathcal F\)" — কিন্তু Borel set অগণিত ও বিদঘুটে রকমের জটিল হতে পারে; এক-এক করে সবার preimage যাচাই অসম্ভব। সৌভাগ্যবশত যাচাই করতে হয় না — একটামাত্র সহজ generator-পরিবারে দেখলেই যথেষ্ট।
উপপাদ্য (check-on-generator, জনিত্রে যাচাই — বিবৃতি)। ধরা যাক target σ-algebra \(\mathcal E=\sigma(\mathcal G)\), অর্থাৎ \(\mathcal G\) হলো \(\mathcal E\)-এর একটা generator (7.2)। তাহলে \(f:(\Omega,\mathcal F)\to(E,\mathcal E)\) measurable iff কেবল generator-এর সদস্যদের preimage measurable: $$ f^{-1}(G)\in\mathcal F\qquad\text{সব }G\in\mathcal G\text{-র জন্য}. $$
random variable-এর ক্ষেত্রে \(\mathcal B=\sigma\big(\{(-\infty,x]:x\in\mathbb R\}\big)\) (7.2), তাই এই উপপাদ্য দেয় একটা অত্যন্ত ব্যবহারিক পরীক্ষা:
ফল (RV-পরীক্ষা)। \(X:\Omega\to\mathbb R\) একটা random variable iff $$ {X\le x}=X^{-1}\big((-\infty,x]\big)\in\mathcal F\qquad\text{সব }x\in\mathbb R\text{-র জন্য}. $$ অর্থাৎ শুধু "\(\{X\le x\}\) ঘটনা কি না" — এইটুকু সব \(x\)-এর জন্য দেখলেই \(X\)-এর measurability সম্পূর্ণ নিশ্চিত। (সমতুল্যভাবে \(\{X<x\}\), বা \(\{X>x\}\), বা \(\{X\ge x\}\) দিয়েও চলে — এরা একই Borel σ-algebra generate করে।)
কেন একটা generator-এই চলে — good-sets principle। এর পেছনের যুক্তিটা এত মৌলিক ও বারবার ফিরে আসে যে এর নিজস্ব নাম আছে — good-sets principle (সুসেট-নীতি)। ধারণাটা: target-এর যেসব set-এর preimage "ভালো" (অর্থাৎ \(\mathcal F\)-এ পড়ে), তাদের সংগ্রহটা নিজেই একটা σ-algebra গড়ে।
good-sets principle (স্বজ্ঞা — প্রমাণ §৪)। \(f:\Omega\to E\) যেকোনো ফাংশনের জন্য $$ \mathcal A\;:=\;{B\subseteq E:\ f^{-1}(B)\in\mathcal F} $$ ("good sets"-এর সংগ্রহ) একটা σ-algebra — কারণ preimage union/intersection/complement সংরক্ষণ করে (২.১), তাই \(\mathcal F\)-এর σ-algebra-গুণগুলো হুবহু \(\mathcal A\)-তে অনূদিত হয়।
এখন তর্কটা এক লাইনে দাঁড়ায়: ধরা যাক \(\mathcal G\subseteq\mathcal A\) (অর্থাৎ generator-এর সব preimage ভালো)। যেহেতু \(\mathcal A\) একটা σ-algebra আর \(\sigma(\mathcal G)\) হলো \(\mathcal G\)-ধারণকারী ক্ষুদ্রতম σ-algebra (7.2), তাই \(\sigma(\mathcal G)\subseteq\mathcal A\) — অর্থাৎ পুরো \(\sigma(\mathcal G)=\mathcal E\)-এর প্রতিটি set-ই ভালো, সব \(B\in\mathcal E\)-র জন্য \(f^{-1}(B)\in\mathcal F\)। এটাই measurability। (এই "একটা generator-এ মিললে গোটা σ-algebra-তে মেলে" কৌশলটা 7.2-এর π–λ-যুক্তির সরাসরি জ্ঞাতি — মনে রাখার মতো।)
এক বাক্যে। "good sets" \(\{B:f^{-1}(B)\in\mathcal F\}\) নিজেই একটা σ-algebra, তাই generator \(\mathcal G\)-এর preimage-গুলো \(\mathcal F\)-এ থাকলেই পুরো \(\sigma(\mathcal G)\) ঢাকা পড়ে — RV-এর জন্য শুধু "\(\{X\le x\}\) ঘটনা সব \(x\)-এ" যাচাই করাই যথেষ্ট।
২.৪ Generated σ-Algebra \(\sigma(X)\) — "\(X\)-এর মধ্যে কতটা তথ্য"¶
measurability-র সংজ্ঞা থেকে স্বাভাবিকভাবেই একটা গভীর বস্তু বেরিয়ে আসে — একটা random variable \(X\) যে তথ্য বহন করে, তার পরিমাপ।
সংজ্ঞা (generated σ-algebra, \(X\)-জনিত সিগমা-বীজগণিত)। একটা random variable \(X:\Omega\to\mathbb R\)-এর জন্য $$ \sigma(X)\;:=\;X^{-1}(\mathcal B)\;=\;\big{X^{-1}(B):B\in\mathcal B\big}\;\subseteq\;\mathcal F $$ হলো \(X\)-জনিত σ-algebra — অর্থাৎ Borel set-দের সব preimage-এর সংগ্রহ।
দুটো সত্য একে অর্থপূর্ণ করে (প্রমাণ §৪):
- \(\sigma(X)\) একটা σ-algebra, এবং good-sets-যুক্তির সুবাদে \(\sigma(X)\subseteq\mathcal F\) ঠিক যখন \(X\) measurable। (অর্থাৎ এই বস্তুটা সংজ্ঞায়িত হওয়াই measurability-র সমার্থক।)
- \(\sigma(X)\) হলো \(X\)-কে measurable করা সবচেয়ে ছোট σ-algebra — অন্য কোনো σ-algebra \(\mathcal G\)-তে \(X\) measurable হলে অবশ্যই \(\sigma(X)\subseteq\mathcal G\)।
"তথ্য" ব্যাখ্যাটা। \(\sigma(X)\)-কে ভাবুন "\(X\) পর্যবেক্ষণ করলে যে প্রশ্নগুলোর উত্তর জানা যায়" তার পুরো তালিকা। যদি আমরা কেবল \(X(\omega)\)-এর মান দেখি (কিন্তু \(\omega\) নিজে নয়), তবে আমরা "\(X\le 3\) কি?" বা "\(X\in[1,2]\) কি?"-এর উত্তর দিতে পারি — এরা সবই \(\sigma(X)\)-এর সদস্য, কারণ এরা \(X^{-1}(B)\)-আকারের। কিন্তু \(X\) যদি অনেক \(\omega\)-কে একই মানে পাঠায় (যেমন একটা coarse \(X\)), তবে সেই \(\omega\)-গুলোকে \(X\) আলাদা করতে পারে না — সংশ্লিষ্ট সূক্ষ্ম ঘটনা \(\sigma(X)\)-এ থাকে না। সুতরাং:
- বড় \(\sigma(X)\) ⟺ \(X\) বেশি তথ্য খোলে (যেমন \(X=\mathrm{id}\) হলে \(\sigma(X)=\mathcal B\), সব দেখা যায়);
- ছোট \(\sigma(X)\) ⟺ \(X\) কম তথ্য খোলে (যেমন \(X\equiv c\) ধ্রুবক হলে \(\sigma(X)=\{\varnothing,\Omega\}\), কিছুই আলাদা করা যায় না)।
এই "σ-algebra = তথ্যের পরিমাণ" ছবিটাই Part VII-এর সবচেয়ে ফলদায়ক রূপকগুলোর একটা — 7.7-এ conditional expectation \(\mathbb E[Y\mid\sigma(X)]\) মানে হবে "\(X\)-এর তথ্য জানা থাকলে \(Y\)-এর সেরা অনুমান", আর 7.8-এ filtration \((\mathcal F_t)\) মানে হবে "সময়ের সঙ্গে ক্রমে বেড়ে চলা তথ্য"।
এক বাক্যে। \(\sigma(X)=X^{-1}(\mathcal B)\) হলো \(X\)-কে measurable করা ক্ষুদ্রতম σ-algebra — "\(X\) পর্যবেক্ষণে যত প্রশ্নের উত্তর মেলে" তার সংগ্রহ, অর্থাৎ "\(X\)-এর মধ্যেকার তথ্য" — যা 7.7 ও 7.8-এর ভিত্তি।
২.৫ Borel Function ও Continuous ⇒ Borel — measurable-দের প্রাচুর্য¶
সংজ্ঞা তো হলো, কিন্তু বাস্তবে এত measurable ফাংশন আদৌ আছে কি? — যাতে measurability একটা সংযত-অথচ-সমৃদ্ধ শ্রেণি হয়, না অতি-সংকীর্ণ? উত্তর: হ্যাঁ, প্রায় যা-কিছু আমরা স্বাভাবিকভাবে লিখি, সবই measurable। শুরু একটা নাম দিয়ে।
সংজ্ঞা (Borel function, বোরেল অপেক্ষক)। একটা ফাংশন \(g:\mathbb R\to\mathbb R\) (বা \(g:\mathbb R^d\to\mathbb R\))-কে Borel-measurable বা সংক্ষেপে Borel function বলা হয় যদি সে \((\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)\) measurable হয়, অর্থাৎ \(g^{-1}(B)\in\mathcal B\) সব Borel \(B\)-র জন্য।
আর measurable-দের প্রাচুর্যের প্রথম বড় উৎস:
উপপাদ্য (continuous ⇒ Borel — বিবৃতি)। প্রতিটি continuous (অবিচ্ছিন্ন) ফাংশন \(g:\mathbb R\to\mathbb R\) Borel। আরও সাধারণভাবে, যেকোনো metric space-এর মধ্যে continuous map Borel–Borel measurable।
স্বজ্ঞা ও যুক্তির বীজ (পূর্ণ প্রমাণ §৪): continuity-র topological সংজ্ঞা বলে — open set-এর preimage সবসময় open। আর \(\mathcal B=\sigma(\text{open sets})\)। তাই continuous \(g\)-র জন্য প্রতিটি open \(B\)-র preimage open ⟹ Borel; এখন good-sets principle (২.৩) লাগালেই generator (open set) থেকে গোটা \(\mathcal B\)-তে ছড়িয়ে পড়ে — সব Borel \(B\)-র preimage Borel। সুতরাং বহুপদী, \(\exp,\sin,\cos\), যেকোনো continuous রূপান্তর — সবই Borel।
কিন্তু Borel শ্রেণি continuity-র চেয়ে অনেক বড়: এতে আছে indicator \(\mathbf 1_A\) (\(A\in\mathcal B\)), step function, monotone function, এবং — 7.1-এর সেই নায়ক — Dirichlet function \(\mathbf 1_{\mathbb Q}\) (যা সর্বত্র discontinuous, Riemann-integrable নয়, তবু measurable: \(\mathbf 1_{\mathbb Q}^{-1}(B)\) সর্বদা \(\varnothing,\mathbb Q,\mathbb Q^c,\) বা \(\mathbb R\) — সবই Borel)। এটাই measurability-র উদারতার প্রতীক: Riemann-তত্ত্ব যাকে বাতিল করে, measure-তত্ত্ব তাকে অনায়াসে ধরে।
এক বাক্যে। continuous ⇒ Borel (open-preimage-open + good-sets), কিন্তু Borel শ্রেণি ঢের বড় — indicator, step, monotone, এমনকি সর্বত্র-অবিচ্ছিন্ন Dirichlet \(\mathbf 1_{\mathbb Q}\)-ও Borel; measurability Riemann-integrability-র চেয়ে অনেক উদার।
২.৬ Closure Properties — measurable থেকে measurable¶
measurability-র আসল ব্যবহারিক শক্তি এর বদ্ধতা (closure)-য়: পরিচিত operation দিয়ে measurable ফাংশন জোড়া দিলে ফল আবার measurable — তাই একবার মৌলিক ব্লকগুলো measurable জানলে, তা থেকে গড়া সবকিছুর measurability আর আলাদা করে যাচাই করতে হয় না।
ধরা যাক \(f,g\) এবং \((f_n)_{n\ge 1}\) সবাই \((\Omega,\mathcal F)\)-এর উপর measurable real-valued (বা extended-valued) ফাংশন।
উপপাদ্য (closure properties — বিবৃতি; প্রমাণ §৪)। 1. বীজগাণিতিক: \(f+g\), \(f-g\), \(cf\) (\(c\in\mathbb R\)), \(fg\), এবং \(f/g\) (যেখানে \(g\ne 0\)) — সবই measurable। 2. জালক (lattice): \(\max(f,g)\), \(\min(f,g)\), \(\lvert f\rvert\), এবং বিশেষত ধনাত্মক/ঋণাত্মক অংশ \(f^+=\max(f,0)\), \(f^-=\max(-f,0)\) — measurable (লক্ষ্য করুন \(f=f^+-f^-\) ও \(\lvert f\rvert=f^++f^-\))। 3. ক্রমিক সীমা (sequential limits): \(\displaystyle\sup_n f_n\), \(\displaystyle\inf_n f_n\), \(\displaystyle\limsup_{n} f_n\), \(\displaystyle\liminf_{n} f_n\) — সবই measurable; এবং যেখানে point-wise limit \(\displaystyle\lim_n f_n\) বিদ্যমান, সেখানে তা-ও measurable।
এই তিন নম্বর ধর্মটিই measure-তত্ত্বকে Riemann-তত্ত্বের চেয়ে এত শক্তিশালী করে: measurable ফাংশনদের শ্রেণি point-wise সীমার অধীনে বদ্ধ — limit নিলে measurability ভাঙে না। (তুলনায় continuity বা Riemann-integrability point-wise limit-এ সহজেই ভেঙে পড়ে।)
যুক্তির বীজ (পূর্ণ §৪): বীজগাণিতিক বদ্ধতার চাবি — \(\{f+g<a\}=\bigcup_{q\in\mathbb Q}\big(\{f<q\}\cap\{g<a-q\}\big)\), একটা গণনাযোগ্য union, তাই \(\mathcal F\)-এ; আর \(fg=\tfrac14\big[(f+g)^2-(f-g)^2\big]\) ও "\(f^2\) measurable" (যেহেতু \(t\mapsto t^2\) continuous, ২.৫) মিলিয়ে গুণফল। ক্রমিক সীমার চাবি আরও সরাসরি: \(\{\sup_n f_n\le a\}=\bigcap_n\{f_n\le a\}\) — গণনাযোগ্য intersection — তাই measurable; আর \(\limsup,\liminf\) এদের থেকে গড়া (\(\limsup_n f_n=\inf_k\sup_{n\ge k}f_n\))।
একটা বিশেষ ও অতি-ব্যবহৃত রূপ আলাদা করে রাখি — composition (যৌগিকীকরণ):
ফল (composition, \(g\circ X\))। যদি \(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) একটা random variable এবং \(g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)\) একটা Borel function হয়, তবে যৌগিক \(g\circ X:\Omega\to\mathbb R\), \(\omega\mapsto g(X(\omega))\), আবার একটা random variable। (যুক্তি এক লাইন: \((g\circ X)^{-1}(B)=X^{-1}\big(g^{-1}(B)\big)\) — ভেতরে \(g^{-1}(B)\in\mathcal B\), বাইরে তার preimage \(\in\mathcal F\)।)
ফলত \(X^2,\ e^{X},\ \lvert X\rvert,\ \max(X,c)\) — যেকোনো Borel রূপান্তরে random variable আবার random variable; এটাই পরে expectation (প্রত্যাশা), moment, রূপান্তর-নিয়ম ইত্যাদির ভিত্তি।
এক বাক্যে। measurable ফাংশনদের যোগ/গুণ/\(\max\)/\(\min\)/\(\lvert\cdot\rvert\) ও — সবচেয়ে গুরুত্বপূর্ণভাবে — \(\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n\) আবার measurable, আর Borel-\(g\) দিয়ে composition \(g\circ X\)-ও measurable; তাই measurability স্বাভাবিক operation-এর অধীনে বদ্ধ।
২.৭ Pushforward Measure, Law ও CDF — বণ্টন rigorous¶
এবার \(\mathbb P\)-কে আবার দৃশ্যে আনি (এতক্ষণ কেবল \(\mathcal F\)-এর কাঠামো লাগছিল)। একটা random variable \(X\) measurable হওয়ায় প্রতিটি Borel \(B\)-র জন্য \(\mathbb P(X\in B)\) অর্থবহ — তাহলে \(B\mapsto\mathbb P(X\in B)\) ফাংশনটাই কি \(\mathbb R\)-এর উপর একটা নতুন measure? হ্যাঁ — এবং এটাই "\(X\)-এর বণ্টন"-এর rigorous সংজ্ঞা।
সংজ্ঞা (pushforward / image measure, law)। random variable \(X:(\Omega,\mathcal F,\mathbb P)\to(\mathbb R,\mathcal B)\)-এর law (বা distribution, বণ্টন) হলো \((\mathbb R,\mathcal B)\)-এর উপর সংজ্ঞায়িত set-function $$ P_X(B)\;:=\;\mathbb P\big(X^{-1}(B)\big)\;=\;\mathbb P(X\in B),\qquad B\in\mathcal B. $$ একে pushforward বা image measure (সম্মুখ-ঠেলা / প্রতিচ্ছবি-পরিমাপ) বলা হয় এবং প্রায়ই \(P_X=\mathbb P\circ X^{-1}\) বা \(\mu_X\) লেখা হয়।
উপপাদ্য (law একটা probability measure — বিবৃতি; প্রমাণ §৪)। \(P_X\) হলো \((\mathbb R,\mathcal B)\)-এর উপর একটা probability measure: \(P_X(B)\ge 0\), \(P_X(\mathbb R)=\mathbb P(X\in\mathbb R)=1\), এবং disjoint \(B_1,B_2,\dots\in\mathcal B\)-র জন্য countable additivity — সবই \(\mathbb P\)-এর সংশ্লিষ্ট ধর্ম ও preimage-এর union/disjointness-সংরক্ষণ (২.১) থেকে সরাসরি আসে।
এর তাৎপর্য গভীর: \(X\) আসলে \(\Omega\)-র উপরকার ভর \(\mathbb P\)-কে \(X\)-এর মাধ্যমে \(\mathbb R\)-এ ঠেলে দেয় — \(\Omega\)-র যে অংশ \(B\)-তে map হয়, তার সম্পূর্ণ ভর গিয়ে জমা হয় \(\mathbb R\)-এর \(B\)-অঞ্চলে। ফলে মূল space \(\Omega\) যত জটিল-বিমূর্তই হোক, \(X\)-এর সব সম্ভাব্যতা-প্রশ্নের উত্তর এখন শুধু \((\mathbb R,\mathcal B,P_X)\)-এই খোঁজা যায় — বিশ্লেষণ পুরোপুরি বাস্তব রেখায় নেমে আসে।
CDF-এর সঙ্গে সংযোগ। 2.4-এর পরিচিত CDF এখন এই law-এর একটা বিশেষ মান মাত্র:
এখন একটা চমৎকার uniqueness প্রশ্ন: CDF তো law-এর তথ্যের কেবল একটা সরু অংশ (শুধু \((-\infty,x]\)-আকার set-এ মান); তবু কি \(F_X\) পুরো law \(P_X\)-কে নির্ধারণ করে?
ফল (law ⟺ CDF correspondence — বিবৃতি; প্রমাণ §৪)। \(F_X\) একাই law \(P_X\)-কে সম্পূর্ণ নির্ধারণ করে: দুটো random variable-এর CDF সর্বত্র সমান হলে তাদের law অভিন্ন। কারণ \(\{(-\infty,x]:x\in\mathbb R\}\) একটা π-system যা \(\mathcal B\) generate করে, আর দুই probability measure এই π-system-এ মিললে — 7.2-এর π–λ (Dynkin) uniqueness অনুসারে — তারা গোটা \(\mathcal B\)-তে মেলে।
এটাই 7.2-এর uniqueness-যন্ত্রের সবচেয়ে দৃশ্যমান লভ্যাংশ: পরিসংখ্যানে "বণ্টন জানা" আর "CDF জানা" একই কথা — π–λ এই সমতাকে কঠোরভাবে প্রতিষ্ঠা করে।
এক বাক্যে। law \(P_X(B)=\mathbb P(X\in B)\) হলো \(\mathbb P\)-কে \(X\) দিয়ে \(\mathbb R\)-এ ঠেলে পাওয়া একটা probability measure, আর \(F_X(x)=P_X((-\infty,x])\) — π–λ uniqueness (7.2) বলে CDF একাই law-কে সম্পূর্ণ pin করে।
২.৮ Simple Function — integration-এর মৌলিক ইট¶
এবার অধ্যায়ের শেষ থিম — measurable ফাংশনের একটা structural উপপাদ্য যা সরাসরি পরের অধ্যায়ের (7.4) Lebesgue integral-এর ভিত্তি গড়ে। শুরু সবচেয়ে সরল measurable ফাংশন দিয়ে।
সংজ্ঞা (simple function, সরল অপেক্ষক)। একটা measurable ফাংশন \(s:\Omega\to\mathbb R\)-কে simple বলা হয় যদি সে কেবল সসীম-সংখ্যক ভিন্ন মান নেয়। সমতুল্যভাবে, \(s\) লেখা যায় $$ s\;=\;\sum_{i=1}^{n} a_i\,\mathbf 1_{A_i}, $$ যেখানে \(a_1,\dots,a_n\in\mathbb R\) স্বতন্ত্র মান, \(A_i=\{s=a_i\}\in\mathcal F\) পরস্পর-বিচ্ছিন্ন (disjoint) measurable set, \(\bigcup_i A_i=\Omega\), এবং \(\mathbf 1_{A}\) হলো indicator (নির্দেশক): \(\mathbf 1_A(\omega)=1\) যদি \(\omega\in A\), নয়তো \(0\)।
simple function-রাই integration-এর "পরমাণু": এদের integral সংজ্ঞায়িত করা তুচ্ছ-স্বাভাবিক — প্রতিটা মান \(a_i\)-কে তার set-এর আকার \(\mu(A_i)\) দিয়ে গুণ করে যোগ, অর্থাৎ স্বজ্ঞাগতভাবে "\(\int s\,d\mu=\sum_i a_i\,\mu(A_i)\)" (উচ্চতা × আকার-এর যোগফল)। 7.4-এ Lebesgue integral এখান থেকেই শুরু হবে। কিন্তু তার আগে চাই একটা সেতু — সাধারণ measurable ফাংশনকে এই পরমাণু দিয়ে ছোঁয়ার উপায়।
এক বাক্যে। simple function \(s=\sum_i a_i\mathbf 1_{A_i}\) কেবল সসীম মান নেয় (measurable disjoint \(A_i\)-র উপর ধ্রুবক), আর এদের "উচ্চতা × আকার" integral তুচ্ছ — এরাই Lebesgue integration-এর মৌলিক ইট।
২.৯ Approximation Theorem ও a.e. সমতা — Lebesgue integral-এর প্রবেশদ্বার¶
এই অধ্যায়ের চূড়ান্ত উপপাদ্য — এবং Part VII-এর গোটা integration-তত্ত্বের ভিত্তিপ্রস্তর: যত জটিলই হোক, প্রতিটি অঋণাত্মক measurable ফাংশনকে simple function দিয়ে নিচ থেকে ক্রমবর্ধমানভাবে ছোঁয়া যায়।
উপপাদ্য (approximation / simple-function approximation — বিবৃতি; নির্মাণ §৪)। ধরা যাক \(f:\Omega\to[0,\infty]\) একটা অঋণাত্মক measurable ফাংশন। তবে এমন simple function-দের একটা ক্রম \((s_n)_{n\ge 1}\) আছে যা $$ 0\;\le\;s_1\;\le\;s_2\;\le\;\cdots\;\le\;f, \qquad\text{এবং}\qquad s_n(\omega)\;\uparrow\;f(\omega)\ \ \text{প্রতিটি }\omega\in\Omega\text{-তে} $$ (অর্থাৎ point-wise ক্রমবর্ধমান limit, \(s_n\uparrow f\))। আরও — \(f\) bounded হলে এই অভিসরণ uniform।
dyadic-সিঁড়ির ধারণা (পূর্ণ নির্মাণ §৪): \(n\)-তম ধাপে \(y\)-অক্ষকে \(1/2^n\) মাপের ধাপে কাটা হয় এবং উচ্চতাকে \(n\)-এ থামিয়ে দেওয়া হয় —
প্রতিটি \(A=\{k/2^n\le f<(k+1)/2^n\}\) measurable (কারণ \(f\) measurable, ২.৬), তাই \(s_n\) সত্যিই simple; \(n\) বাড়লে ধাপ অর্ধেক হয় ও ছাদ ওঠে, তাই \(s_n\) বাড়ে ও \(f\)-কে নিচ থেকে চেপে ধরে — একটা ক্রমশ-সূক্ষ্ম "সিঁড়ি" \(f\)-এর গায়ে উঠে যায়।
সাধারণ (চিহ্নযুক্ত) \(f\)। যেকোনো measurable \(f:\Omega\to\mathbb R\)-কে ধনাত্মক ও ঋণাত্মক অংশে ভাঙি — \(f=f^+-f^-\) যেখানে \(f^+=\max(f,0)\ge 0\) ও \(f^-=\max(-f,0)\ge 0\) (দুটোই measurable, ২.৬) — তারপর প্রতিটি অংশে আলাদা করে উপরের theorem লাগাই। 7.4-এ Lebesgue integral ঠিক এভাবেই সংজ্ঞায়িত হবে: simple-এ integral → অঋণাত্মক \(f\)-এ \(\sup\)/limit → সাধারণ \(f\)-এ \(\int f=\int f^+-\int f^-\)।
a.e. সমতা। integration-তত্ত্বে একটা শিথিলতা অপরিহার্য — যা "প্রায় সর্বত্র" একই, তাকে একই গণ্য করা। 3.2 ও 7.1-এর null-set স্বজ্ঞা স্মরণ করে:
সংজ্ঞা (almost everywhere, প্রায়-সর্বত্র / a.e.)। একটা ধর্ম "\(\mu\)-প্রায়-সর্বত্র" (\(\mu\)-a.e.) সত্য বলা হয় যদি যেখানে সে ব্যর্থ সেই set-টি একটা null set-এ ধরা পড়ে — অর্থাৎ \(N\in\mathcal F\) যার \(\mu(N)=0\), এবং ধর্মটি \(\Omega\setminus N\)-এর সর্বত্র সত্য। বিশেষত \(f=g\) a.e. মানে \(\mu(\{f\ne g\})=0\); probability-প্রেক্ষাপটে একে almost surely (প্রায়-নিশ্চিতভাবে, a.s.) বলা হয়।
কেন এই ধারণা জরুরি: Lebesgue integral measure-zero set-এ ফাংশনের মান গায়ে মাখে না — \(f=g\) a.e. হলে \(\int f\,d\mu=\int g\,d\mu\)। তাই integration-তত্ত্বে ফাংশন আসলে তার a.e.-সমতা-শ্রেণি হিসেবে আচরণ করে; এটিই 7.4-এর integral, 7.9-এর \(L^p\) space ও সর্বত্র "a.s. convergence"-এর ভাষাগত ভিত্তি।
এক বাক্যে। প্রতিটি অঋণাত্মক measurable \(f\) হলো simple function-দের ক্রমবর্ধমান point-wise limit (\(s_n\uparrow f\), dyadic সিঁড়ি), সাধারণ \(f=f^+-f^-\) — এটিই 7.4-এর Lebesgue integral-এর প্রবেশদ্বার, আর a.e. (null-set বাদে) সমতা সেই integral-এর স্বাভাবিক শিথিলতা।
৩ · পূর্ণাঙ্গ উদাহরণ¶
§১–২-এ আমরা measurable map (মাপযোগ্য চিত্রণ)-এর সংজ্ঞা — \(f^{-1}(B)\in\mathcal F\) প্রতিটি \(B\in\mathcal B\)-এর জন্য — random variable (এলোমেলো চলক), generated σ-algebra \(\sigma(X)\), pushforward law (অগ্রগামী বণ্টন) \(P_X\), "continuous ⇒ Borel", এবং sup/limsup/sum-এর আবদ্ধতা ও simple function (সরল ফাংশন)-এর dyadic approximation theorem (দ্বিভাজিত আসন্নীকরণ উপপাদ্য) — সবই কিছুটা বিমূর্ত ভাষায় গড়েছি। এই অংশের উদ্দেশ্য সেই কাঠামোকে হাতে-কলমে, কংক্রিট set ও কংক্রিট সংখ্যা দিয়ে ছুঁয়ে দেখা। ছয়টি উদাহরণে প্রতিটি ধাপ ধৈর্য ধরে কষব — কোনো ধাপ লুকানো থাকবে না — তারপর প্রতিটির শেষে "কী শিখলাম" বলে মূল শিক্ষাটা গুটিয়ে আনব। কষ্টের স্তর শিরোনামে তারা দিয়ে চিহ্নিত: ★ = সরাসরি, সংজ্ঞা প্রয়োগ করলেই হয় · ★★ = কিছু কৌশল বা সতর্ক যুক্তি লাগে। প্রতিটি ইংরেজি পরিভাষা প্রথম ব্যবহারে বাংলায় খুলে দেওয়া হবে।
উদাহরণ ১ — indicator কখন random variable (★)¶
সেটআপ। কোনো set \(A\subseteq\Omega\)-এর indicator (নির্দেশক) ফাংশন \(\mathbf 1_A:\Omega\to\mathbb R\) হলো $$ \mathbf 1_A(\omega)=\begin{cases}1,& \omega\in A,\[2pt] 0,& \omega\notin A.\end{cases} $$ প্রশ্ন: কখন \(\mathbf 1_A\) একটা random variable, অর্থাৎ \((\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) measurable? সংজ্ঞা বলছে — প্রতিটি Borel set \(B\)-এর জন্য pre-image (পূর্বপ্রতিচ্ছবি) \(\mathbf 1_A^{-1}(B)\) যেন \(\mathcal F\)-এ থাকে। যেহেতু \(\mathbf 1_A\) মাত্র দুটো মান নেয় (\(0\) ও \(1\)), এর pre-image-এর হিসাব সম্পূর্ণরূপে নির্ভর করে \(B\) কেবল \(0\) আর \(1\)-এর কোনটিকে ধরে তার উপর — বাকি বিন্দু \(B\)-তে থাকুক না-থাকুক, কিছু যায়-আসে না, কারণ \(\mathbf 1_A\) সে-মান কখনো নেয় না।
চারটি ক্ষেত্র গুনে ফেলা। \(0\in B\) কি না এবং \(1\in B\) কি না — দুটো হ্যাঁ/না, মোট চারটি সম্ভাবনা। প্রতিটির জন্য \(\mathbf 1_A^{-1}(B)=\{\omega:\mathbf 1_A(\omega)\in B\}\) কষি:
- ক্ষেত্র ১ — \(0\notin B\), \(1\notin B\)। \(\mathbf 1_A\) কখনো \(B\)-তে পড়ে না; তাই \(\mathbf 1_A^{-1}(B)=\emptyset\)।
- ক্ষেত্র ২ — \(0\notin B\), \(1\in B\)। শুধু "\(\mathbf 1_A=1\)" বিন্দুগুলো গোনা হয়, অর্থাৎ \(\{\omega:\mathbf 1_A(\omega)=1\}=A\)। তাই \(\mathbf 1_A^{-1}(B)=A\)।
- ক্ষেত্র ৩ — \(0\in B\), \(1\notin B\)। শুধু "\(\mathbf 1_A=0\)" বিন্দু, অর্থাৎ \(A^c\)। তাই \(\mathbf 1_A^{-1}(B)=A^c\)।
- ক্ষেত্র ৪ — \(0\in B\), \(1\in B\)। দুটো মানই ধরা; সব \(\omega\) পড়ে। তাই \(\mathbf 1_A^{-1}(B)=\Omega\)।
সংক্ষেপে, \(B\)-ভেদে \(\mathbf 1_A\)-এর সম্ভাব্য pre-image-এর তালিকা মাত্র চারটি set: $$ \mathbf 1_A^{-1}(B)\;\in\;{\,\emptyset,\;A,\;A^c,\;\Omega\,}. $$ এদের মধ্যে \(\emptyset,\Omega\) এবং \(A^c\) (\(=A\) থাকলে complement-আবদ্ধতায়) সবসময় যেকোনো σ-algebra-তে থাকে। তাই measurability-র গোটা প্রশ্নটা একটিমাত্র সদস্যে গিয়ে দাঁড়ায়: \(A\) নিজে \(\mathcal F\)-এ আছে কি না।
উপসংহার (iff)। $$ \mathbf 1_A \text{ measurable} \quad\Longleftrightarrow\quad A\in\mathcal F . $$ ডান-থেকে-বাঁ: \(A\in\mathcal F\) হলে চারটি pre-image-ই (\(\emptyset,A,A^c,\Omega\)) \(\mathcal F\)-এ — তাই সব Borel \(B\)-এর pre-image \(\mathcal F\)-এ, অর্থাৎ measurable। বাঁ-থেকে-ডান: \(\mathbf 1_A\) measurable হলে বিশেষভাবে \(B=\{1\}\) (একটা Borel set) নিলে \(\mathbf 1_A^{-1}(\{1\})=A\in\mathcal F\)।
কী শিখলাম। একটা random variable-এর সংজ্ঞা "প্রতিটি Borel \(B\)-এর জন্য \(f^{-1}(B)\in\mathcal F\)" শুনতে যতই ভারী হোক, indicator-এর ক্ষেত্রে তা ভেঙে দাঁড়ায় একটিমাত্র শর্তে: \(A\) যেন একটা event হয়, অর্থাৎ \(A\in\mathcal F\)। এতে measurability ও "ঘটনার ভাষা" এক হয়ে যায় — "\(\mathbf 1_A\) পরিমাপ করা যায়" আর "\(A\) একটা বৈধ ঘটনা যার সম্ভাবনা \(\mathbb P(A)\) বলা যায়" আসলে একই কথা। তাই σ-algebra \(\mathcal F\) ঠিক সেইসব \(A\)-ই ধরে যাদের indicator random variable, আর এই ছোট উদাহরণটাই random variable-এর গোটা তত্ত্বের গোড়ার ইট।
উদাহরণ ২ — simple function ও \(\sigma(X)\) (★)¶
সেটআপ। simple function (সরল ফাংশন) হলো সসীম-অনেক মান নেওয়া measurable ফাংশন, যাকে indicator-এর ভারিত যোগফলে লেখা যায়: $$ X=\sum_{i=1}^{k} a_i\,\mathbf 1_{A_i}, $$ যেখানে \(a_1,\dots,a_k\) পরস্পর-আলাদা বাস্তব মান, আর \(A_1,\dots,A_k\) পরস্পর-বিচ্ছিন্ন (disjoint) set যারা মিলে \(\Omega\)-কে ঢাকে — অর্থাৎ \(\{A_i\}\) হলো \(\Omega\)-এর একটা partition (বিভাজন)। এখানে \(A_i=\{X=a_i\}=X^{-1}(\{a_i\})\) হলো level set (স্তর-সেট): একই মান নেওয়া \(\omega\)-দের ঝাঁক। প্রশ্ন: \(X\)-এর তৈরি করা তথ্য — \(\sigma(X)\) — দেখতে কেমন, আর তাতে কতগুলো set?
\(\sigma(X)\) মানে \(X\)-বহন-করা তথ্য। সংজ্ঞা: \(\sigma(X)=\{X^{-1}(B):B\in\mathcal B\}\) — যত রকম Borel-প্রশ্ন "\(X\in B\)?" করা যায়, তাদের answer-set-এর সংগ্রহ। যেহেতু \(X\) মাত্র \(k\)টি মান নেয়, যেকোনো Borel \(B\) এই \(k\)টি মানের কোন-কোনটি ধরে কেবল সেটাই গুরুত্বপূর্ণ। যদি \(B\) ধরে মানগুলোর উপসেট \(S\subseteq\{a_1,\dots,a_k\}\), তবে $$ X^{-1}(B)=\bigcup_{i:\,a_i\in S} A_i , $$ অর্থাৎ level set-গুলোর একটা union। উল্টোভাবে, যেকোনো level set-উপসংগ্রহের union-কে এক উপযুক্ত \(B\) (সেই মানগুলোর set) দিয়ে পাওয়া যায়। তাই $$ \sigma(X)=\Big{\textstyle\bigcup_{i\in I}A_i : I\subseteq{1,\dots,k}\Big} =\text{level set-গুলোর সব union}. $$ এখানে level set \(A_i\)-গুলোই হলো \(\sigma(X)\)-এর atom (পরমাণু) — আর-ভাঙা-যায়-না সবচেয়ে ছোট দানা।
গোনা। \(k\)টি atom-এর প্রতিটিকে union-এ "রাখি / রাখি না" — স্বাধীন দুই-পথ বাছাই \(k\) বার: $$ \lvert\sigma(X)\rvert = 2^{k}. $$ (দুই প্রান্ত-কেস ধরা: কোনো atom না নিলে \(\emptyset\), সব নিলে \(\Omega\)।) তাই \(k=2,3,4\) হলে যথাক্রমে \(4,\;8,\;16\)টি set।
কংক্রিট: \(k=3\)¶
ধরা যাক \(\Omega=\{1,2,3,4,5,6\}\) (একটা ছক্কা), আর $$ X=\;\underbrace{0}{a_1}\cdot\mathbf 1}+\underbrace{1{a_2}\cdot\mathbf 1}+\underbrace{2{a_3}\cdot\mathbf 1, $$ অর্থাৎ level set \(A_1=\{1\},\;A_2=\{2,3\},\;A_3=\{4,5,6\}\)। এই তিনটি atom থেকে \(2^3=8\)টি union: $$ \emptyset,\;{1},\;{2,3},\;{4,5,6},\;{1,2,3},\;{1,4,5,6},\;{2,3,4,5,6},\;{1,2,3,4,5,6}. $$ ঠিক আটটি — এটাই \(\sigma(X)\)। লক্ষণীয়, \(\sigma(X)\) গোটা power set \(2^\Omega\) (\(=2^6=64\) set) নয়: যেমন \(\{2\}\) আলাদা করে \(\sigma(X)\)-এ নেই, কারণ \(X\) "\(2\)" আর "\(3\)"-কে একই মান \(1\) দেয় বলে এ-দুটোকে আলাদা করার তথ্য \(X\) বহন করে না।
কী শিখলাম। \(\sigma(X)\) হলো "\(X\) দেখে যত প্রশ্নের উত্তর জানা যায়" — তার গাণিতিক রূপ। simple \(X\)-এর জন্য এই তথ্য পুরোপুরি গোনা যায়: তার level set-গুলোই atom, আর \(\sigma(X)\) ঠিক সেই atom-গুলোর সব union — \(k\)টি আলাদা মান থাকলে \(2^k\)টি set (\(k=2,3,4\to4,8,16\))। মূল insight (অন্তর্দৃষ্টি): একই মান-পাওয়া বিন্দুদের \(X\) আলাদা করতে পারে না, তাই \(\sigma(X)\) সাধারণত পুরো power set-এর চেয়ে মোটা (coarser) — এই "তথ্যের সূক্ষ্মতা = σ-algebra-র সূক্ষ্মতা" ছবিটাই পরে conditional expectation ও sufficiency-র ভিত্তি হবে।
উদাহরণ ৩ — check-on-generator (★★)¶
সেটআপ। measurability যাচাইয়ে "প্রতিটি Borel \(B\)-এর জন্য \(X^{-1}(B)\in\mathcal F\)" পরীক্ষা করা অসম্ভব — Borel set অগুনতি। সুসংবাদ: \(\mathcal B(\mathbb R)\)-কে জন্ম দেয় এমন একটা ছোট generator family-তে শর্তটা মিললেই যথেষ্ট। বিশেষভাবে half-line (অর্ধরেখা) \((-\infty,x]\)-রা \(\mathcal B(\mathbb R)\) জন্ম দেয়, তাই — $$ X \text{ একটা RV} \quad\Longleftrightarrow\quad {X\le x}\in\mathcal F\ \ \forall x\in\mathbb R . $$ আরও কম খাটুনিতে, \(x\)-কে শুধু rational (\(x\in\mathbb Q\)) ধরলেও চলে, কারণ \(\mathbb Q\) ঘন (dense) বলে \(\{X\le x\}=\bigcap_{q\in\mathbb Q,\,q>x}\{X\le q\}\) — গণনাযোগ্য ছেদে যেকোনো বাস্তব \(x\) পুনর্গঠিত হয়।
কেন জেনারেটরে যাচাই-ই যথেষ্ট — good-sets নীতি। যুক্তির কঙ্কাল: ধরি \(\mathcal D=\{B\subseteq\mathbb R:X^{-1}(B)\in\mathcal F\}\) — "ভালো" Borel-target-দের সংগ্রহ, যাদের pre-image সত্যিই \(\mathcal F\)-এ। pre-image অপারেশন set-অপারেশন রক্ষা করে: \(X^{-1}(B^c)=\big(X^{-1}(B)\big)^c\) এবং \(X^{-1}\!\big(\bigcup_n B_n\big)=\bigcup_n X^{-1}(B_n)\)। যেহেতু \(\mathcal F\) complement ও গণনাযোগ্য union-এ আবদ্ধ, \(\mathcal D\)ও তাই — অর্থাৎ \(\mathcal D\) একটা σ-algebra। এখন যদি জেনারেটর (সব half-line) \(\mathcal D\)-তে থাকে, তবে তাদের জন্মানো গোটা \(\mathcal B(\mathbb R)\subseteq\mathcal D\) — অর্থাৎ প্রতিটি Borel target ভালো, \(X\) measurable। এটাই good-sets principle: "যেখানে শর্ত মেলে" সেই সংগ্রহ একটা σ-algebra; জেনারেটর তাতে থাকলে গোটা generated σ-algebra ঢেকে যায়।
প্রয়োগ ১: \(X=\max(Y,c)\)¶
ধরা যাক \(Y\) একটা RV আর \(c\) ধ্রুবক; \(X(\omega)=\max\big(Y(\omega),c\big)\)। দাবি: \(X\)ও RV। half-line যাচাই করি — কোন \(\omega\)-তে \(\max(Y,c)\le x\)? max ছোট-বা-সমান হতে গেলে দুটোই ছোট-বা-সমান হতে হবে, তাই $$ {X\le x}={Y\le x}\cap{c\le x}. $$ দুই ক্ষেত্র: যদি \(x\ge c\), তবে \(\{c\le x\}=\Omega\), তাই \(\{X\le x\}=\{Y\le x\}\in\mathcal F\) (\(Y\) RV বলে)। যদি \(x<c\), তবে \(\{c\le x\}=\emptyset\), তাই \(\{X\le x\}=\emptyset\in\mathcal F\)। দু-ক্ষেত্রেই \(\{X\le x\}\in\mathcal F\) — সুতরাং \(X=\max(Y,c)\) একটা RV।
প্রয়োগ ২: একটা monotone \(X\)¶
ধরা যাক \(\Omega=\mathbb R\) একটা Borel σ-algebra-সহ, আর \(X:\mathbb R\to\mathbb R\) non-decreasing (অ-হ্রাসমান)। তখন প্রতিটি \(x\)-এর জন্য sub-level set \(\{X\le x\}\) একটা interval (অন্তর) — হয় \((-\infty,b]\), নয় \((-\infty,b)\), নয় খালি, নয় গোটা \(\mathbb R\) (monotonicity-র কারণে: \(\omega\) এতে থাকলে তার বাঁ-দিকের সবও থাকে)। প্রতিটি interval একটা Borel set, তাই \(\{X\le x\}\in\mathcal B(\mathbb R)\) সব \(x\)-এর জন্য — জেনারেটর-যাচাই মিলে গেল, \(X\) measurable (Borel)। অর্থাৎ প্রতিটি monotone ফাংশন Borel — অসংখ্য বিন্দুতে আলাদা করে পরীক্ষা না করেই।
কী শিখলাম। measurability প্রমাণে আসল কৌশল হলো জেনারেটরে নেমে আসা: গোটা Borel σ-algebra না ঘেঁটে শুধু \(\{X\le x\}\) (এমনকি কেবল \(x\in\mathbb Q\)) \(\mathcal F\)-এ আছে কি না দেখলেই চলে — কারণ half-line-রা \(\mathcal B(\mathbb R)\) জন্ম দেয়। এর পিছনে good-sets principle: "শর্ত-মানা" target-দের সংগ্রহ একটা σ-algebra, তাই জেনারেটরে শর্ত মিললে সব Borel set-এ আপনাআপনি মেলে। এই একটা চাল দিয়ে \(\max(Y,c)\)-জাতীয় গড়ন আর গোটা monotone শ্রেণিকে এক ঝটকায় RV বানিয়ে ফেলা যায়।
উদাহরণ ৪ — continuous ও Borel function of a RV (★)¶
সেটআপ। \(X\) একটা RV হলে তাকে একটা continuous (অবিচ্ছিন্ন) ফাংশন \(g\) দিয়ে রূপান্তর করলে \(g(X)\) কি আবার RV? উত্তর: হ্যাঁ — এর গোড়া দুটো তথ্য: (i) প্রতিটি continuous \(g:\mathbb R\to\mathbb R\) Borel measurable, আর (ii) দুটো measurable map-এর composition (যৌগ) measurable।
(i) continuous ⇒ Borel কেন। \(g\) continuous হলে যেকোনো open set \(U\)-এর pre-image \(g^{-1}(U)\)ও open (topology-র সংজ্ঞা), তাই Borel। কিন্তু open set-রা \(\mathcal B(\mathbb R)\) জন্ম দেয়, আর উদাহরণ ৩-এর good-sets যুক্তিতে \(\{B:g^{-1}(B)\in\mathcal B\}\) একটা σ-algebra যাতে সব open set আছে — সুতরাং গোটা \(\mathcal B\subseteq\) সেই সংগ্রহ, অর্থাৎ \(g^{-1}(B)\in\mathcal B\) প্রতিটি Borel \(B\)-এর জন্য। তাই \(g\) Borel measurable।
(ii) composition measurable কেন। \(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) আর \(g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)\) — দুটোই measurable। তখন \(g\circ X\)-এর pre-image দু-ধাপে খোলে: $$ (g\circ X)^{-1}(B)=X^{-1}\big(g^{-1}(B)\big). $$ \(B\) Borel ⇒ \(g^{-1}(B)\) Borel ((i) থেকে) ⇒ \(X^{-1}\big(g^{-1}(B)\big)\in\mathcal F\) (\(X\) RV বলে)। সুতরাং \(g(X)\) একটা RV।
কংক্রিট: \(g(t)=t^2\)। \(g(t)=t^2\) continuous, তাই Borel; ফলে \(X\) RV হলে \(X^2=g(X)\)ও RV। সরাসরি যাচাইও মেলে: \(y\ge 0\)-এর জন্য $$ {X^2\le y}={-\sqrt y\le X\le \sqrt y}={X\le\sqrt y}\setminus{X<-\sqrt y}\in\mathcal F, $$ আর \(y<0\)-এর জন্য \(\{X^2\le y\}=\emptyset\in\mathcal F\) — half-line যাচাই খাটে।
আরও যা RV থেকে যায়। §২-এর আবদ্ধতা-ধর্ম মনে রেখে: \(X,Y\) RV হলে \(X+Y\), \(XY\), \(\max(X,Y)\), \(\min(X,Y)\), \(\lvert X\rvert\), \(cX\) — সবই RV। কারণ যোগ ও গুণ \((s,t)\mapsto s+t\) এবং \((s,t)\mapsto st\) continuous \(\mathbb R^2\to\mathbb R\), আর \((X,Y):\Omega\to\mathbb R^2\) একটা measurable map; তাই continuous ফাংশন দিয়ে composition করলে আবার RV। (এটাই উদাহরণ ৫-এ \(Y=X^2\) নেওয়ার বৈধতা দেয় — \(X^2\) যে একটা RV তা এখানেই নিশ্চিত হলো।)
কী শিখলাম। RV-এর শ্রেণি রূপান্তরে অত্যন্ত স্থিতিশীল: যেকোনো continuous (এমনকি যেকোনো Borel) \(g\) দিয়ে \(g(X)\) আবার RV, কারণ "continuous ⇒ Borel" আর "measurable ∘ measurable = measurable"। এর ফল — \(X^2\), \(X+Y\), \(XY\), \(\max(X,Y)\) ইত্যাদি গড়ন আলাদা করে প্রমাণ ছাড়াই RV, যা পরিসংখ্যানের প্রায় সব statistic (mean, variance, order statistic …) কে বৈধ random variable হিসেবে দাঁড় করায়। মূল বার্তা: pre-image দু-ধাপে \(X^{-1}\big(g^{-1}(B)\big)\) হিসেবে খোলে — তাই দুই measurable ধাপ জুড়লে measurability টিকে থাকে।
উদাহরণ ৫ — pushforward / law of \(Y=X^2\) (★★)¶
সেটআপ। ধরা যাক \(X\sim\text{Uniform}(-1,1)\), অর্থাৎ \(X\)-এর density \(f_X(t)=\tfrac12\) for \(t\in(-1,1)\) (নাহলে \(0\))। ধরি \(Y=X^2\) (উদাহরণ ৪-এ দেখেছি এটা RV)। প্রশ্ন: \(Y\)-এর law / distribution (বণ্টন) — অর্থাৎ pushforward measure (অগ্রগামী পরিমাপ) \(P_Y=P_X\circ(X^2)^{-1}\) — কেমন? সংজ্ঞা মনে করি: যেকোনো Borel \(B\)-এর জন্য \(P_Y(B)=\mathbb P(Y\in B)=\mathbb P\big(X\in (X^2)^{-1}(B)\big)=P_X\big((X^2)^{-1}(B)\big)\)। সবচেয়ে পরিষ্কার পথ — CDF বের করা।
ধাপ ১ — CDF। \(Y=X^2\ge 0\), তাই \(F_Y(y)=0\) for \(y\le 0\)। আর যেহেতু \(\lvert X\rvert\le 1\), \(Y\le 1\), তাই \(F_Y(y)=1\) for \(y\ge 1\)। মাঝের অংশ \(y\in(0,1)\)-এর জন্য: $$ F_Y(y)=\mathbb P(X^2\le y)=\mathbb P\big(-\sqrt y\le X\le\sqrt y\big)=\int_{-\sqrt y}^{\sqrt y}\tfrac12\,dt=\tfrac12\big(2\sqrt y\big)=\sqrt y . $$ অর্থাৎ $$ F_Y(y)=\begin{cases}0,& y\le 0,\[2pt]\sqrt y,& 0<y<1,\[2pt]1,& y\ge 1.\end{cases} $$
ধাপ ২ — density। \((0,1)\)-এ \(F_Y\) অবকলনযোগ্য, তাই density হলো $$ f_Y(y)=F_Y'(y)=\frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y},\qquad y\in(0,1). $$ লক্ষণীয়, \(y\to 0^+\)-এ \(f_Y(y)\to\infty\) — density অসীমে যায় অথচ মোট ভর সসীম: \(\int_0^1\frac{1}{2\sqrt y}\,dy=\big[\sqrt y\,\big]_0^1=1\) ✓। এটাই \(Y\)-এর pushforward law: \(X\)-এর uniform ভর \(X\mapsto X^2\) চিত্রণে ঠেলে দেওয়ায় \(0\)-এর কাছে জমা হয় (কারণ ছোট \(X\) আরও ছোট \(X^2\) দেয়)।
ধাপ ৩ — \(\mathbb E[Y]\)। density দিয়ে সরাসরি: $$ \mathbb E[Y]=\int_0^1 y\cdot\frac{1}{2\sqrt y}\,dy=\int_0^1\tfrac12\,y^{1/2}\,dy=\tfrac12\cdot\frac{y^{3/2}}{3/2}\Big\rvert_0^1=\tfrac12\cdot\tfrac23=\frac13 . $$ (মিলিয়ে দেখা যায় change-of-variable ছাড়াই, মূল \(X\)-এ: \(\mathbb E[X^2]=\int_{-1}^1 t^2\cdot\tfrac12\,dt=\tfrac12\cdot\tfrac{2}{3}=\tfrac13\) — pushforward-এর মূল সুবিধা যে দু-পথে একই উত্তর।)
ধাপ ৪ — একটা probability। $$ \mathbb P!\big(Y\le\tfrac14\big)=F_Y!\big(\tfrac14\big)=\sqrt{\tfrac14}=\tfrac12 . $$ স্বজ্ঞায়ও মেলে: \(Y\le\tfrac14\iff\lvert X\rvert\le\tfrac12\), আর uniform \(X\)-এর অর্ধেক ভর \([-\tfrac12,\tfrac12]\)-এ — তাই \(\tfrac12\)।
Monte-Carlo মিলিয়ে দেখা¶
বিশ্লেষণী মান যাচাই করতে একটা simulation: numpy-তে rng = default_rng(20260619), \(X\)-এর \(N=10^6\) নমুনা rng.uniform(-1, 1, N), তারপর \(Y=X^2\)। ফল কাছাকাছি বসে—
| পরিমাণ | বিশ্লেষণী | Monte-Carlo (\(N=10^6\)) |
|---|---|---|
| \(\mathbb E[Y]\) | \(\tfrac13\approx0.3333\) | \(0.3335\) |
| \(\mathbb P(Y\le 0.25)\) | \(0.5\) | \(0.4997\) |
দু-ক্ষেত্রেই simulation বিশ্লেষণী মানের তিন-দশমিক-ঘরে মিলছে — pushforward-এর হিসাব নিশ্চিত।
কী শিখলাম। একটা RV-কে রূপান্তর করলে তার law নিজে থেকেই বদলায়, আর সেই নতুন law-ই pushforward measure \(P_Y=P_X\circ(X^2)^{-1}\)। ব্যবহারিক চাবিকাঠি: target-এর CDF \(F_Y(y)=\mathbb P(g(X)\le y)\) বের করে অবকলনে density পাওয়া — এখানে \(\text{Uniform}(-1,1)\)-এর \(X^2\) দিল \(f_Y(y)=\frac{1}{2\sqrt y}\) on \((0,1)\), \(\mathbb E[Y]=\tfrac13\), \(\mathbb P(Y\le\tfrac14)=\tfrac12\) (Monte-Carlo: \(0.3335,\,0.4997\))। গভীর বার্তা: \(\mathbb E[g(X)]\) হিসাব করতে দু-পথ সমান — হয় নতুন density \(f_Y\)-তে, নয় মূল \(f_X\)-এ — কারণ pushforward ঠিক এই "ভর বহন করে নিয়ে যাওয়া" কে আনুষ্ঠানিক করে; এটাই পরের change-of-variable ও \(\int g\,dP_X=\int y\,dP_Y\) সূত্রের ভিত্তি।
উদাহরণ ৬ — dyadic approximation by simple functions (★★)¶
সেটআপ। §২-এর সবচেয়ে দামি যন্ত্র — dyadic approximation theorem: যেকোনো অঋণাত্মক measurable \(f\)-কে নিচ থেকে বেড়ে-ওঠা (increasing) simple function-এর ক্রম \(f_n\uparrow f\) দিয়ে আসন্ন করা যায়। এখানে সরল কেস \(f(x)=x\) on \([0,1]\)-এ যন্ত্রটা হাতে চালিয়ে দেখি।
নির্মাণ — dyadic staircase (দ্বিভাজিত সিঁড়ি)। স্তর \(n\)-এ \([0,1)\)-কে \(2^n\)টি সমান \(2^{-n}\)-চওড়া টুকরোয় কাটি, আর প্রতিটি টুকরোয় \(f\)-এর মান নিচের দিকে গোল করি নিকটতম \(2^{-n}\)-গুণিতকে: $$ f_n(x)=\frac{\lfloor 2^n x\rfloor}{2^n}\qquad(x\in[0,1),\ \text{ক্যাপ করা }f_n(1)=1). $$ এটা simple function: এটা মাত্র \(2^n\)টি মান \(\{0,\tfrac{1}{2^n},\tfrac{2}{2^n},\dots,\tfrac{2^n-1}{2^n}\}\) নেয়, প্রতিটি একটা dyadic interval \(\big[\tfrac{k}{2^n},\tfrac{k+1}{2^n}\big)\)-এ ধ্রুবক — অর্থাৎ \(f_n=\sum_{k=0}^{2^n-1}\tfrac{k}{2^n}\mathbf 1_{[k/2^n,\,(k+1)/2^n)}\)।
ধর্ম ১ — error bound (ত্রুটি-সীমা)। floor-এর সংজ্ঞা থেকে \(\lfloor 2^n x\rfloor\le 2^n x<\lfloor 2^n x\rfloor+1\), \(2^n\) দিয়ে ভাগ করলে $$ f_n(x)\le x< f_n(x)+2^{-n}\quad\Longrightarrow\quad 0\le f(x)-f_n(x)<2^{-n}. $$ তাই sup-দূরত্ব নিয়ন্ত্রিত: $$ \sup_{x\in[0,1]}\lvert f(x)-f_n(x)\rvert\le 2^{-n}\xrightarrow[n\to\infty]{}0, $$ অর্থাৎ \(f_n\to f\) uniformly (সমভাবে) — শুধু বিন্দুভিত্তিক নয়।
ধর্ম ২ — monotone (একঘেয়ে বৃদ্ধি) \(f_n\uparrow f\)। স্তর \(n\) থেকে \(n+1\)-এ প্রতিটি টুকরো ঠিক দু-ভাগ হয়, তাই \(\lfloor 2^{n+1}x\rfloor/2^{n+1}\ge\lfloor 2^n x\rfloor/2^n\) — নতুন সিঁড়ি কখনো নামে না, প্রায়ই উঠে আসে \(x\)-এর আরও কাছে। ফলে \(f_n(x)\le f_{n+1}(x)\le x\) প্রতিটি \(x\)-এ, এবং ধর্ম ১ থেকে \(f_n(x)\to x=f(x)\)। অর্থাৎ \(f_n\uparrow f\)।
সংখ্যায়: error টেবিল¶
\(\sup\)-error \(=2^{-n}\) ধরে \(n=1,2,3,4\):
| \(n\) | টুকরোর সংখ্যা \(2^n\) | \(\sup\lvert f-f_n\rvert\le 2^{-n}\) |
|---|---|---|
| \(1\) | \(2\) | \(0.5\) |
| \(2\) | \(4\) | \(0.25\) |
| \(3\) | \(8\) | \(0.125\) |
| \(4\) | \(16\) | \(0.0625\) |
প্রতি স্তরে error ঠিক অর্ধেক হয় — সিঁড়ির ধাপ যত সরু, \(f_n\) তত \(f\)-এর গা ঘেঁষে ওঠে। একটা বিন্দুতে মিলিয়ে দেখা: \(x=0.7\), \(n=2\) হলে \(f_2(0.7)=\lfloor 4\cdot 0.7\rfloor/4=\lfloor 2.8\rfloor/4=2/4=0.5\), ত্রুটি \(0.7-0.5=0.2\le 0.25\) ✓; \(n=3\) হলে \(f_3(0.7)=\lfloor 5.6\rfloor/8=5/8=0.625\), ত্রুটি \(0.075\le 0.125\) ✓ — এবং \(0.5\le 0.625\), বৃদ্ধি নিশ্চিত।
কী শিখলাম। dyadic staircase \(f_n(x)=\lfloor 2^n x\rfloor/2^n\) যেকোনো (এখানে \(f(x)=x\)) অঋণাত্মক measurable ফাংশনকে নিচ থেকে simple function দিয়ে চেপে ধরে: \(0\le f-f_n<2^{-n}\), তাই \(\sup\)-error \(n=1,2,3,4\to0.5,0.25,0.125,0.0625\), এবং \(f_n\uparrow f\) (এমনকি uniformly)। কেন এটা এত গুরুত্বপূর্ণ — simple function-এর integral গোনা তুচ্ছ (মান × measure-এর যোগফল); তাই "\(f_n\uparrow f\)" থাকলে \(\int f\)-কে সংজ্ঞায়িত করা যায় \(\lim_n\int f_n\) হিসেবে। এই একটিমাত্র নির্মাণই §৭.৪-এর Lebesgue integral-এর ইঞ্জিন — যেকোনো measurable ফাংশনের অখণ্ডন এই বেড়ে-ওঠা সিঁড়ির সীমা।
৪ · প্রমাণ ও উৎপাদন¶
এই অংশে §২-এর সংজ্ঞাগুলো থেকে আমরা measurable map (পরিমাপযোগ্য চিত্রণ) ও random variable (এলোমেলো চলক)-এর মূল কাঠামোগত ফলাফলগুলো ধাপে ধাপে উৎপাদন (derive) করব। প্রতিটি প্রমাণে কেন প্রতিটি পদক্ষেপ বৈধ — কোন সংজ্ঞা, কোন পূর্ববর্তী ফল, বা কোন set-অভেদ ব্যবহৃত হচ্ছে — তা স্পষ্ট করে বলা হবে। প্রতিটি প্রমাণের শিরোনামে কঠিনতা-চিহ্ন (difficulty tag) দেওয়া আছে:
- ★ — মৌলিক, প্রথম পাঠেই বোঝা উচিত।
- ★★ — মাঝারি, একটু কৌশল লাগে।
- ★★★ — গভীর, প্রথম পাঠে কিছু অংশ এড়িয়ে যাওয়া যায় (যথাস্থানে চিহ্নিত)।
স্মরণ করি, দুটি measurable space \((\Omega,\mathcal F)\) ও \((E,\mathcal E)\)-এর মধ্যে একটি ফাংশন \(f:\Omega\to E\)-কে বলা হয় measurable (পরিমাপযোগ্য) যদি প্রতিটি \(B\in\mathcal E\)-এর জন্য তার preimage (পূর্বপ্রতিচ্ছবি) \(f^{-1}(B):=\{\omega\in\Omega:f(\omega)\in B\}\) সদস্য হয় \(\mathcal F\)-এর:
বিশেষ ক্ষেত্রে \((E,\mathcal E)=(\mathbb R,\mathcal B)\) (\(\mathcal B\) = Borel σ-algebra) হলে এমন \(X:\Omega\to\mathbb R\)-কে বলা হয় random variable (RV)। গোটা অংশজুড়ে আমরা preimage-এর তিনটি মৌলিক commutation (বিনিময়) ধর্ম বারবার ব্যবহার করব, যা যেকোনো ফাংশন \(f\)-এর জন্য সত্য (σ-algebra-র প্রয়োজন নেই):
এই তিনটি অভেদই preimage-কে set-অপারেশনের সাথে নিখুঁত সামঞ্জস্যে রাখে; এদের প্রমাণ স্রেফ সদস্যপদ যাচাই (যেমন \(\omega\in f^{-1}(B^c)\iff f(\omega)\notin B\iff\omega\notin f^{-1}(B)\)), এবং Part VII-এর 7.2-এ এগুলো ধরে নেওয়া আছে।
প্রমাণ ১ — good-sets principle: generator-এ পরীক্ষাই যথেষ্ট (★★)¶
দাবি। ধরা যাক \(f:(\Omega,\mathcal F)\to(E,\mathcal E)\), যেখানে target σ-algebra-টি একটি সংগ্রহ \(\mathcal G\) থেকে উৎপন্ন: \(\mathcal E=\sigma(\mathcal G)\)। তাহলে
অর্থাৎ measurability যাচাই করতে গোটা (প্রায়শই অগণনীয়) \(\mathcal E\)-র উপর পরীক্ষা চালানোর দরকার নেই; শুধু generator \(\mathcal G\)-তে preimage যাচাই করলেই হয়।
কৌশলের নাম — good-sets principle. যেসব target-set "ভালো আচরণ" করে (এখানে: যাদের preimage \(\mathcal F\)-এ পড়ে) তাদের সংগ্রহটিকে আলাদা করে নাম দিই, দেখাই সেটি একটি σ-algebra এবং generator-কে ধারণ করে; তখন σ-algebra-র ন্যূনতমতা থেকে সংগ্রহটি গোটা \(\sigma(\mathcal G)\)-কেই গিলে ফেলে। measure theory-তে এই ছাঁচ বারবার ফিরে আসে।
নির্মাণ — good sets-এর সংগ্রহ। সংজ্ঞা করি
এটি হলো target-জগৎ \(E\)-এর সেই সব subset, যাদের preimage source σ-algebra \(\mathcal F\)-এ থাকে।
ধাপ ১ — \(\mathcal D\) একটি σ-algebra (target \(E\)-এর উপর)। তিনটি স্বীকার্য যাচাই করি।
(A1) সম্পূর্ণ সেট। \(f^{-1}(E)=\{\omega:f(\omega)\in E\}=\Omega\), কারণ প্রতিটি \(f(\omega)\) অবশ্যই \(E\)-তে থাকে। আর \(\Omega\in\mathcal F\) (σ-algebra-র (A1))। সুতরাং \(E\in\mathcal D\)।
(A2) complement-এ বদ্ধ। ধরা যাক \(B\in\mathcal D\), অর্থাৎ \(f^{-1}(B)\in\mathcal F\)। preimage complement-এর সাথে বিনিময় করে: \(f^{-1}(B^c)=\bigl(f^{-1}(B)\bigr)^c\)। যেহেতু \(\mathcal F\) complement-এ বদ্ধ (σ-algebra-র (A2)) এবং \(f^{-1}(B)\in\mathcal F\), তাই \(\bigl(f^{-1}(B)\bigr)^c\in\mathcal F\)। সুতরাং \(f^{-1}(B^c)\in\mathcal F\), অর্থাৎ \(B^c\in\mathcal D\)।
(A3) গণনাযোগ্য সংযোগে বদ্ধ। ধরা যাক \(B_1,B_2,\dots\in\mathcal D\), অর্থাৎ প্রতিটি \(f^{-1}(B_n)\in\mathcal F\)। preimage গণনাযোগ্য সংযোগের সাথে বিনিময় করে:
ডান পাশের প্রতিটি পদ \(\mathcal F\)-এ, আর \(\mathcal F\) গণনাযোগ্য সংযোগে বদ্ধ (σ-algebra-র (A3)), তাই গোটা সংযোগটি \(\mathcal F\)-এ। সুতরাং \(f^{-1}\bigl(\bigcup_n B_n\bigr)\in\mathcal F\), অর্থাৎ \(\bigcup_n B_n\in\mathcal D\)।
তিনটি স্বীকার্য মিলল, তাই \(\mathcal D\) একটি σ-algebra (target \(E\)-এর উপর)। ∎(ধাপ ১)
ধাপ ২ — দিক (⇐): generator-এ পরীক্ষাই যথেষ্ট। ধরা যাক ডান পক্ষ সত্য: প্রতিটি \(G\in\mathcal G\)-র জন্য \(f^{-1}(G)\in\mathcal F\)। এর মানে ঠিক \(\mathcal G\subseteq\mathcal D\) (সংজ্ঞা অনুসারে)। কিন্তু \(\mathcal D\) একটি σ-algebra (ধাপ ১), আর \(\sigma(\mathcal G)\) হলো \(\mathcal G\)-ধারণকারী ক্ষুদ্রতম σ-algebra — তাই \(\mathcal G\)-কে ধারণকারী যেকোনো σ-algebra \(\sigma(\mathcal G)\)-কে অন্তর্ভুক্ত করে। ফলে
এর অর্থ: প্রতিটি \(B\in\mathcal E\)-ও \(\mathcal D\)-তে আছে, অর্থাৎ \(f^{-1}(B)\in\mathcal F\)। সুতরাং \(f\) measurable। ∎(ধাপ ২)
ধাপ ৩ — দিক (⇒): সহজ পথ। ধরা যাক \(f\) measurable, অর্থাৎ সব \(B\in\mathcal E\)-র জন্য \(f^{-1}(B)\in\mathcal F\)। যেহেতু \(\mathcal G\subseteq\sigma(\mathcal G)=\mathcal E\), প্রতিটি \(G\in\mathcal G\)-ও \(\mathcal E\)-তে; তাই বিশেষত \(f^{-1}(G)\in\mathcal F\)। ডান পক্ষ পাওয়া গেল। ∎(ধাপ ৩)
দুই দিক মিলে দ্বিমুখী অভেদ প্রতিষ্ঠিত। ∎
অনুসিদ্ধান্ত (CDF-পরীক্ষা) — \(X\) একটি RV iff \(\{X\le x\}\in\mathcal F\) সব \(x\in\mathbb R\)-র জন্য। §১-এ (এবং 7.2-এ) দেখানো হয়েছে যে Borel σ-algebra-কে রশ্মি (ray) দিয়ে উৎপন্ন করা যায়: \(\mathcal B=\sigma\bigl(\{(-\infty,x]:x\in\mathbb R\}\bigr)\)। নিই \(\mathcal G=\{(-\infty,x]:x\in\mathbb R\}\)। তখন
উপরের উপপাদ্য সরাসরি প্রয়োগ করলে: \(X\) measurable (অর্থাৎ RV) \(\iff\) প্রতিটি \(x\)-এর জন্য \(\{X\le x\}\in\mathcal F\)। এটাই RV-যাচাইয়ের সবচেয়ে কাজের রূপ — গোটা \(\mathcal B\) নয়, কেবল "\(X\) একটা সীমার নিচে থাকার ঘটনা"-গুলো event কিনা দেখলেই চলে। (একইভাবে \((-\infty,x)\), \([x,\infty)\) বা \((x,\infty)\) generator নিলেও সমতুল্য পরীক্ষা পাওয়া যায়, কারণ এরাও \(\mathcal B\) উৎপন্ন করে।)
এক বাক্যে: "যেসব target-set-এর preimage \(\mathcal F\)-এ পড়ে" তাদের সংগ্রহটি সর্বদা একটি σ-algebra, তাই generator-কে ধারণ করলেই সেটি গোটা \(\sigma(\mathcal G)\)-কে ধারণ করে—ফলে measurability কেবল generator-এ যাচাই করাই যথেষ্ট, এবং RV-র জন্য তা \(\{X\le x\}\in\mathcal F\)-এ নেমে আসে।
প্রমাণ ২ — \(\sigma(X)\) সুসংজ্ঞায়িত ও ক্ষুদ্রতম (★)¶
দাবি। যেকোনো RV \(X:\Omega\to\mathbb R\)-এর জন্য সংগ্রহ
হলো \(\Omega\)-এর উপর একটি σ-algebra, এবং এটিই সেই ক্ষুদ্রতম σ-algebra যার সাপেক্ষে \(X\) measurable। একে বলা হয় \(X\) কর্তৃক উৎপন্ন σ-algebra (σ-algebra generated by \(X\)) — স্বজ্ঞাগতভাবে "\(X\) যে তথ্য বহন করে" তা-ই।
ধাপ ১ — \(\sigma(X)\) একটি σ-algebra। এখানে আবার preimage-এর বিনিময়-ধর্মই মূল চাবি, তবে এবার \(\mathcal F\)-এর বদলে target σ-algebra \(\mathcal B\)-র বদ্ধতা ব্যবহার করছি।
(A1) \(\Omega=X^{-1}(\mathbb R)\) এবং \(\mathbb R\in\mathcal B\), তাই \(\Omega\in\sigma(X)\)।
(A2) ধরা যাক \(A\in\sigma(X)\), অর্থাৎ \(A=X^{-1}(B)\) কোনো \(B\in\mathcal B\)-র জন্য। তখন
যেহেতু \(\mathcal B\) complement-বদ্ধ, \(B^c\in\mathcal B\), তাই \(A^c=X^{-1}(B^c)\in\sigma(X)\)।
(A3) ধরা যাক \(A_1,A_2,\dots\in\sigma(X)\), অর্থাৎ \(A_n=X^{-1}(B_n)\) কোনো \(B_n\in\mathcal B\)-র জন্য। তখন
\(\mathcal B\) গণনাযোগ্য সংযোগে বদ্ধ বলে \(\bigcup_n B_n\in\mathcal B\), তাই \(\bigcup_n A_n\in\sigma(X)\)।
তিনটি স্বীকার্য মিলল। (সাধারণ নীতি: যেকোনো σ-algebra-র preimage-চিত্র \(f^{-1}(\mathcal E)\) সর্বদা একটি σ-algebra; এখানে \(f=X\), \(\mathcal E=\mathcal B\)।) ∎(ধাপ ১)
ধাপ ২ — \(\sigma(X)\subseteq\mathcal F\) যদি \(X\) একটি RV হয়। যেহেতু \(X\) RV, প্রতিটি \(B\in\mathcal B\)-র জন্য \(X^{-1}(B)\in\mathcal F\)। অর্থাৎ \(\sigma(X)\)-এর প্রতিটি সদস্যই \(\mathcal F\)-এ। তাই \(\sigma(X)\subseteq\mathcal F\) — অর্থাৎ \(X\) কর্তৃক উৎপন্ন তথ্য মূল σ-algebra \(\mathcal F\)-এ ধরা পড়ে, যা সঙ্গত। ∎(ধাপ ২)
ধাপ ৩ — ক্ষুদ্রতমতা। ধরা যাক \(\mathcal H\) যেকোনো σ-algebra (\(\Omega\)-এর উপর) যার সাপেক্ষে \(X\) measurable, অর্থাৎ সব \(B\in\mathcal B\)-র জন্য \(X^{-1}(B)\in\mathcal H\)। তাহলে সংজ্ঞা অনুসারে \(\sigma(X)=\{X^{-1}(B):B\in\mathcal B\}\subseteq\mathcal H\)। সুতরাং \(X\)-কে measurable করা যেকোনো σ-algebra-কেই \(\sigma(X)\) অন্তর্ভুক্ত করে — অর্থাৎ \(\sigma(X)\) সেই শ্রেণির ক্ষুদ্রতম। আর \(\sigma(X)\) নিজে \(X\)-কে measurable করে (কারণ যেকোনো \(B\)-র জন্য \(X^{-1}(B)\in\sigma(X)\) স্পষ্টতই), তাই দাবি সম্পূর্ণ। ∎
ব্যাখ্যা — "\(X\) যে তথ্য বহন করে"। \(\sigma(X)\)-এর একটি সদস্য \(\{X\in B\}\) মানে "\(X\)-এর মান \(B\)-তে পড়ল কি না" — এ প্রশ্নের উত্তর শুধু \(X(\omega)\) জানলেই দেওয়া যায়। তাই \(\sigma(X)\) ঠিক সেই সব ঘটনা ধারণ করে যা "\(X\) পর্যবেক্ষণ করে" নিষ্পত্তি করা যায়, এর বেশি নয়। এই দৃষ্টিভঙ্গিই 7.6-এ independence এবং পরে conditional expectation \(\mathbb E[Y\mid\sigma(X)]\)-র ভিত্তি — যেখানে "\(X\) দেখে \(Y\) সম্পর্কে সেরা অনুমান" সংজ্ঞায়িত হয় σ-algebra-র ভাষায়।
এক বাক্যে: \(X^{-1}(\mathcal B)\) একটি σ-algebra (কারণ preimage complement ও গণনাযোগ্য সংযোগের সাথে বিনিময় করে এবং \(\mathcal B\) এ-দুটোতে বদ্ধ), আর যেহেতু \(X\)-কে measurable করা যেকোনো σ-algebra-ই \(X^{-1}(\mathcal B)\)-কে ধারণ করে, এটি ক্ষুদ্রতম—অর্থাৎ ঠিক "\(X\)-এর বহন করা তথ্য"।
প্রমাণ ৩ — continuous ⇒ Borel measurable (★)¶
দাবি। যদি \(g:\mathbb R\to\mathbb R\) একটি continuous (অবিচ্ছিন্ন) ফাংশন হয়, তবে \(g\) Borel measurable, অর্থাৎ \(g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)\) একটি measurable map। ফলস্বরূপ, \(X\) একটি RV হলে \(g(X)=g\circ X\)-ও একটি RV।
ধাপ ১ — continuity-র topological রূপ। বিশ্লেষণের একটি মৌলিক উপপাদ্য: \(g:\mathbb R\to\mathbb R\) continuous \(\iff\) প্রতিটি open set \(U\subseteq\mathbb R\)-এর জন্য \(g^{-1}(U)\)-ও open। (স্মরণ: \(\epsilon\)–\(\delta\) সংজ্ঞা থেকে এটি বেরোয় — \(g(x_0)\)-এর চারপাশের যেকোনো open ঘেরাটোপের preimage-এ \(x_0\)-এর চারপাশে একটা open ঘেরাটোপ থাকে; বিস্তারিত প্রমাণ Real Analysis-এ, এখানে ব্যবহার করছি।) এই অংশটুকুই আমাদের একমাত্র বিশ্লেষণিক ইনপুট; বাকিটা সম্পূর্ণ measure-তাত্ত্বিক।
ধাপ ২ — open set Borel। Borel σ-algebra-র সংজ্ঞাই হলো \(\mathcal B=\sigma(\mathcal O)\), যেখানে \(\mathcal O\) = \(\mathbb R\)-এর সব open set-এর সংগ্রহ। বিশেষত প্রতিটি open \(U\)-ই \(\mathcal B\)-তে: \(\mathcal O\subseteq\mathcal B\)।
ধাপ ৩ — good-sets principle প্রয়োগ। এখন প্রমাণ ১ (good-sets principle) সরাসরি খাটাই, target generator হিসেবে \(\mathcal G=\mathcal O\) নিয়ে (যেহেতু \(\mathcal B=\sigma(\mathcal O)\))। প্রমাণ ১ বলছে: \(g\) measurable হওয়ার জন্য শুধু দেখানো দরকার যে প্রতিটি generator-সদস্য \(U\in\mathcal O\)-র জন্য \(g^{-1}(U)\in\mathcal B\)।
কিন্তু ধাপ ১ দিয়ে \(g^{-1}(U)\) open, আর ধাপ ২ দিয়ে প্রতিটি open set \(\mathcal B\)-তে। সুতরাং \(g^{-1}(U)\in\mathcal B\) — generator-পরীক্ষা উত্তীর্ণ। তাই good-sets principle অনুযায়ী \(g\) Borel measurable। ∎(ধাপ ৩)
ধাপ ৪ — composition \(g(X)\) একটি RV। ধরা যাক \(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) একটি RV এবং \(g:(\mathbb R,\mathcal B)\to(\mathbb R,\mathcal B)\) measurable (ধাপ ৩ থেকে, বা যেকোনো measurable \(g\))। দেখাতে হবে \(g\circ X\) measurable। যেকোনো \(B\in\mathcal B\)-র জন্য preimage composition-নিয়ম ব্যবহার করি:
(এটি সদস্যপদ থেকে সরাসরি: \(\omega\in(g\circ X)^{-1}(B)\iff g(X(\omega))\in B\iff X(\omega)\in g^{-1}(B)\iff\omega\in X^{-1}(g^{-1}(B))\)।) এখন:
- \(g\) measurable, তাই \(g^{-1}(B)\in\mathcal B\);
- \(X\) measurable, তাই \(X^{-1}\bigl(g^{-1}(B)\bigr)\in\mathcal F\)।
সুতরাং \((g\circ X)^{-1}(B)\in\mathcal F\) সব \(B\in\mathcal B\)-র জন্য, অর্থাৎ \(g\circ X\) একটি RV। (এটি একটি স্বতন্ত্রভাবে দরকারি ফল: measurable map-এর composition আবার measurable।) ∎
এই ফলটি প্রভূত শক্তিশালী: \(X\) RV হলে \(X^2,\ \lvert X\rvert,\ e^{X},\ \sin X,\ \max(X,0)\) — সব continuous (বা আংশিক, যেমন নিচে দেখা যাবে) রূপান্তরই আবার RV। তাই দৈনন্দিন গণিতে গড়া প্রায় প্রতিটি ফাংশনই measurability ভাঙে না।
এক বাক্যে: continuity ঠিক বলে "open-এর preimage open", আর open set-রা Borel; তাই good-sets principle অনুযায়ী generator (open set)-এ পরীক্ষা উত্তীর্ণ হয় ও \(g\) Borel measurable হয়ে যায়—এবং measurable map-এর composition measurable হওয়ায় \(g(X)\)ও একটি RV।
প্রমাণ ৪ — closure under \(\sup,\inf,\limsup,\liminf,\lim\) (★★)¶
দাবি। ধরা যাক \(f_1,f_2,\dots\) একটি ক্রম, প্রতিটি \(f_n:(\Omega,\mathcal F)\to(\overline{\mathbb R},\overline{\mathcal B})\) measurable (এখানে \(\overline{\mathbb R}=[-\infty,+\infty]\) বর্ধিত বাস্তব রেখা, যেহেতু sup/inf অসীম হতে পারে)। তবে নিচের সব ফাংশনই measurable:
এবং যেখানে \(\lim_n f_n\) অস্তিত্বশীল সেখানে তা-ও measurable। (এর বিশেষ ক্ষেত্রে সসীম \(\max,\min\)-ও।)
মূল কৌশল। বর্ধিত রেখায় Borel σ-algebra \(\overline{\mathcal B}\)-কে রশ্মি \((a,+\infty]\) (বা সমতুল্যভাবে \([-\infty,a]\)) দিয়ে উৎপন্ন করা যায়; তাই প্রমাণ ১ অনুযায়ী একটি ফাংশন \(h\) measurable হওয়ার জন্য শুধু প্রতিটি \(\{h\le a\}\) (বা \(\{h>a\}\)) \(\mathcal F\)-এ পড়লেই হয়। প্রতিটি সুপ্রিমাম/ইনফিমামের জন্য আমরা এই level set-টিকে একটি গণনাযোগ্য ছেদ বা সংযোগ হিসেবে লিখব।
ধাপ ১ — \(\sup_n f_n\) measurable। মূল অভেদ:
কেন? কোনো \(\omega\)-তে \(\sup_n f_n(\omega)\le a\) ⟺ প্রতিটি পদ \(f_n(\omega)\) ঊর্ধ্বসীমা \(a\)-কে অতিক্রম করে না (কারণ \(\sup\) হলো ক্ষুদ্রতম ঊর্ধ্বসীমা — সব পদ \(\le a\) হলে এবং কেবল তখনই \(\sup\le a\)) ⟺ প্রতিটি \(n\)-এ \(f_n(\omega)\le a\) ⟺ \(\omega\in\bigcap_n\{f_n\le a\}\)। সদস্যপদ অভিন্ন, অভেদ প্রতিষ্ঠিত।
এখন প্রতিটি \(f_n\) measurable বলে \(\{f_n\le a\}\in\mathcal F\), আর \(\mathcal F\) গণনাযোগ্য ছেদে বদ্ধ (σ-algebra, প্রমাণ-অধ্যায় 7.2-এর উদ্ভূত ধর্ম), তাই \(\bigcap_n\{f_n\le a\}\in\mathcal F\)। সুতরাং \(\{\sup_n f_n\le a\}\in\mathcal F\) সব \(a\)-র জন্য, অর্থাৎ \(\sup_n f_n\) measurable। ∎(ধাপ ১)
ধাপ ২ — \(\inf_n f_n\) measurable। প্রতিসম অভেদ:
একই যুক্তিতে (\(\inf\) হলো বৃহত্তম নিম্নসীমা; সব পদ \(\ge a\) হলে এবং কেবল তখনই \(\inf\ge a\))। \(\{f_n\ge a\}=\{f_n<a\}^c\in\mathcal F\), তাই ছেদটিও \(\mathcal F\)-এ। রশ্মি \([a,+\infty]\)-ও \(\overline{\mathcal B}\) উৎপন্ন করে, তাই এই পরীক্ষাই যথেষ্ট: \(\inf_n f_n\) measurable। (সংক্ষেপে, \(\inf_n f_n=-\sup_n(-f_n)\) লিখেও ধাপ ১ থেকে পাওয়া যেত, যেহেতু \(f\mapsto -f\) measurability রক্ষা করে।) ∎(ধাপ ২)
ধাপ ৩ — \(\limsup\) ও \(\liminf\) measurable। সংজ্ঞা অনুযায়ী
ভেতরের রাশি বিশ্লেষণ করি। স্থির \(N\)-এর জন্য \(g_N:=\sup_{n\ge N} f_n\) হলো একটা গণনাযোগ্য পরিবার \(\{f_n:n\ge N\}\)-এর supremum; ধাপ ১ ঠিক এই রূপের জন্য প্রযোজ্য (গণনাযোগ্য index), তাই প্রতিটি \(g_N\) measurable। এবার \(\limsup_n f_n=\inf_{N} g_N\) — একটা গণনাযোগ্য পরিবার \(\{g_N:N\ge 1\}\)-এর infimum; ধাপ ২ দিয়ে এটিও measurable।
\(\liminf\)-এর ক্ষেত্রে ভূমিকা বদলে: \(h_N:=\inf_{n\ge N}f_n\) measurable (ধাপ ২), আর \(\liminf_n f_n=\sup_N h_N\) measurable (ধাপ ১)। ∎(ধাপ ৩)
ধাপ ৪ — \(\lim_n f_n\) (যেখানে অস্তিত্বশীল)। যে সব \(\omega\)-তে \(\lim_n f_n(\omega)\) অস্তিত্বশীল (বর্ধিত অর্থে), সেখানে বিশ্লেষণের সংজ্ঞা থেকেই
ডান পাশের দুটো ফাংশন (ধাপ ৩) measurable; তাই তাদের সাধারণ মান, অর্থাৎ \(\lim_n f_n\), ওই সব বিন্দুতে measurable। (আরও সূক্ষ্মভাবে, যে set-টিতে limit অস্তিত্বশীল তা নিজেই measurable: এটি \(\{\limsup_n f_n=\liminf_n f_n\}=\{\limsup_n f_n-\liminf_n f_n=0\}\), যা দুই measurable ফাংশনের সমতা-set, পরবর্তী প্রমাণ ৫ অনুসারে \(\mathcal F\)-এ।) ∎
সসীম \(\max,\min\)। দুটি (বা সসীম সংখ্যক) measurable \(f,g\)-র জন্য \(\max(f,g)\) ও \(\min(f,g)\) একই ছাঁচে measurable: \(\{\max(f,g)\le a\}=\{f\le a\}\cap\{g\le a\}\) এবং \(\{\min(f,g)\le a\}=\{f\le a\}\cup\{g\le a\}\) — উভয়ই \(\mathcal F\)-এ। (অথবা ক্রমকে শেষ পদে স্থির করে ধাপ ১–২ প্রয়োগ করা যায়।) এই \(\max\)-নিয়মই পরে \(f^+=\max(f,0)\) ও \(f^-=\max(-f,0)\)-কে measurable নিশ্চিত করবে, যা প্রমাণ ৬-এ ও 7.4-এর integral-সংজ্ঞায় অপরিহার্য।
এক বাক্যে: \(\{\sup_n f_n\le a\}\) একটা গণনাযোগ্য ছেদ ও \(\{\inf_n f_n\ge a\}\) একটা গণনাযোগ্য ছেদ হওয়ায় sup/inf measurable থাকে, আর \(\limsup=\inf_N\sup_{n\ge N}\), \(\liminf=\sup_N\inf_{n\ge N}\) এই দুই ধাপের পুনরাবৃত্তিমাত্র—ফলে limit (যেখানে আছে) measurable, এবং σ-algebra-র গণনাযোগ্য বদ্ধতাই এ পুরো স্থিতিশীলতার উৎস।
প্রমাণ ৫ — sums ও products measurable (★★)¶
দাবি। \(f,g:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) measurable (সসীম-মানবিশিষ্ট) হলে \(f+g\) এবং \(fg\)-ও measurable। অর্থাৎ RV-দের সংগ্রহ যোগ ও গুণের অধীনে বদ্ধ — তারা একটি বীজগণিত (algebra of functions) গঠন করে।
পথ ক (সরাসরি, rational কাটিং) — \(f+g\) measurable। প্রমাণ ১ অনুযায়ী শুধু দেখানো দরকার \(\{f+g<a\}\in\mathcal F\) সব \(a\)-র জন্য (যেহেতু রশ্মি \((-\infty,a)\) \(\mathcal B\) উৎপন্ন করে)। মূল অভেদ:
কেন? "(⊇)" সহজ: যদি কোনো \(\omega\)-তে \(f(\omega)<q\) ও \(g(\omega)<a-q\), তবে যোগ করে \(f(\omega)+g(\omega)<a\)। "(⊆)": ধরা যাক \(f(\omega)+g(\omega)<a\), অর্থাৎ \(f(\omega)<a-g(\omega)\)। বাস্তব সংখ্যার ঘনত্ব (density of \(\mathbb Q\) in \(\mathbb R\)) অনুসারে \(f(\omega)\) ও \(a-g(\omega)\)-এর মাঝে একটি মূলদ \(q\) আছে: \(f(\omega)<q<a-g(\omega)\)। তখন \(f(\omega)<q\) এবং (ডান অসমতা পুনর্বিন্যাস করে) \(g(\omega)<a-q\) — তাই \(\omega\) ডান পাশের (\(q\)-ঘরের) সদস্য। দুই অন্তর্ভুক্তি মিলে অভেদ সম্পূর্ণ।
এখন প্রতিটি \(q\in\mathbb Q\)-র জন্য \(\{f<q\}\in\mathcal F\) ও \(\{g<a-q\}\in\mathcal F\) (\(f,g\) measurable), তাই তাদের ছেদ \(\mathcal F\)-এ। মূলদ সংখ্যা গণনাযোগ্য (\(\mathbb Q\) countable) — এটাই সূক্ষ্ম বিন্দু — তাই ডান পাশ একটি গণনাযোগ্য সংযোগ, যা \(\mathcal F\)-এ। সুতরাং \(\{f+g<a\}\in\mathcal F\); \(f+g\) measurable। ∎(পথ ক)
পথ খ (vector-valued, কাঠামোগত) — একই ফল, ভিন্ন আলোয়। এই পথটি কেন গুরুত্বপূর্ণ: এটি যোগ/গুণ/যেকোনো continuous দুই-চলক ক্রিয়াকে একসাথে সামলায়।
ধাপ খ১ — \(\omega\mapsto(f(\omega),g(\omega))\) measurable into \((\mathbb R^2,\mathcal B^2)\). সংজ্ঞা করি \(F:\Omega\to\mathbb R^2\), \(F(\omega)=(f(\omega),g(\omega))\), যেখানে \(\mathcal B^2=\mathcal B\otimes\mathcal B\) হলো সমতলের Borel σ-algebra। \(\mathcal B^2\) উৎপন্ন হয় আয়তক্ষেত্র \(A\times B\) (\(A,B\in\mathcal B\)) দিয়ে, তাই প্রমাণ ১ অনুযায়ী \(F\) measurable হওয়ার জন্য শুধু
দেখলেই হয় — যা সত্য, কারণ \(\{f\in A\}=f^{-1}(A)\in\mathcal F\) ও \(\{g\in B\}=g^{-1}(B)\in\mathcal F\) এবং σ-algebra ছেদ-বদ্ধ। সুতরাং \(F\) measurable।
ধাপ খ২ — continuous ক্রিয়া আরোপ। মানচিত্র \(s:\mathbb R^2\to\mathbb R\), \(s(u,v)=u+v\) continuous; প্রমাণ ৩-এর যুক্তি (open-এর preimage open, good-sets) ঠিক একইভাবে \(\mathbb R^2\to\mathbb R\)-তেও খাটে, তাই \(s\) Borel measurable। এখন composition: \(f+g=s\circ F\), দুই measurable map-এর গঠন, তাই (প্রমাণ ৩-এর ধাপ ৪) measurable। ∎(পথ খ)
\(fg\) measurable — polarization কৌশল। আলাদা rational-অভেদ না খুঁজে আমরা ইতিমধ্যে-প্রমাণিত যোগ ও বর্গকে কাজে লাগাই। মূল পরিচয়:
(সরল বীজগণিত: \((f+g)^2-(f-g)^2=4fg\)।) এবার ধাপে ধাপে:
- \(f+g\) ও \(f-g\) measurable (পথ ক বা খ; বিয়োগ = \(f+(-1)g\), আর \(-g\) measurable কারণ \(t\mapsto -t\) continuous);
- বর্গ-মানচিত্র \(t\mapsto t^2\) continuous, তাই প্রমাণ ৩ দিয়ে Borel measurable; ফলে \((f+g)^2\) ও \((f-g)^2\) measurable (composition);
- দুই measurable ফাংশনের বিয়োগও measurable, এবং ধ্রুবক \(\tfrac14\) দিয়ে গুণও (এটিও \(t\mapsto\tfrac14 t\) continuous-এর composition)।
সুতরাং \(fg\) measurable। ∎
(বিকল্প: পথ খ-এর কাঠামোয় \(m(u,v)=uv\) continuous, তাই \(fg=m\circ F\) সরাসরি measurable — একই উপসংহার, এক লাইনে।) এই দুই ফল একত্রে দেখায় measurable ফাংশনগুলো যোগ, বিয়োগ, ধ্রুবক-গুণ ও গুণে বদ্ধ — অর্থাৎ একটি বীজগণিত; ফলে যেকোনো বহুপদী \(P(X,Y)\) দুই RV-তে আবার RV, যা পরিসংখ্যানে (নমুনা-গড়, নমুনা-ভেদাঙ্ক) ব্যবহৃত রাশিগুলোর measurability নিশ্চিত করে।
এক বাক্যে: হয় \(\{f+g<a\}=\bigcup_{q\in\mathbb Q}(\{f<q\}\cap\{g<a-q\})\) (মূলদের ঘনত্ব + গণনাযোগ্যতা), নয়তো \(\omega\mapsto(f,g)\)-কে \(\mathbb R^2\)-এ measurable দেখিয়ে continuous \(+\) আরোপ করে \(f+g\) measurable হয়; আর polarization \(fg=\tfrac14[(f+g)^2-(f-g)^2]\) ও \(t\mapsto t^2\)-এর continuity দিয়ে \(fg\)ও measurable—তাই RV-রা যোগ-গুণে বদ্ধ একটা বীজগণিত গড়ে।
প্রমাণ ৬ — approximation theorem (★★★, 7.4-এর সেতু)¶
এই প্রমাণ গভীর (★★★), কিন্তু গোটা Lebesgue integration (7.4)-এর মেরুদণ্ড। প্রথম পাঠের পরামর্শ: নির্মাণ, একঘাতিতা (ধাপ ২) ও অভিসৃতি (ধাপ ৩)-র বিবৃতি ভালো করে বুঝুন; দরকারে ধাপ ২-এর কেস-বিশ্লেষণের সূক্ষ্ম হিসাব প্রথমবার দ্রুত পড়ে নিন।
দাবি। ধরা যাক \(f:(\Omega,\mathcal F)\to[0,\infty]\) একটি অঋণাত্মক (non-negative) measurable ফাংশন। প্রতিটি \(n\in\mathbb N\)-এর জন্য সংজ্ঞা করি dyadic truncation (দ্বিমিক কর্তন)
স্বজ্ঞা: \([0,n)\) পরিসরকে \(2^{-n}\) মাপের ছোট ছোট ধাপে কাটা হয়েছে, প্রতিটি ধাপে \(f\)-এর মানকে নিচের প্রান্ত \(k/2^n\)-এ গোল করা হয়; আর \(f\ge n\) হলে মান \(n\)-এ ছেঁটে দেওয়া (ceiling)। তখন:
(ক) প্রতিটি \(f_n\) একটি simple function (সরল ফাংশন — সসীম সংখ্যক মান, প্রতিটি measurable set-এ ধ্রুব) এবং measurable; (খ) ক্রমটি monotone (একঘাতী) বর্ধমান: \(0\le f_n\le f_{n+1}\) সর্বত্র; (গ) বিন্দুভিত্তিক convergence (অভিসৃতি) \(f_n\to f\), এবং \(\{f\le n\}\)-এ \(0\le f-f_n\le 2^{-n}\) (যেখানে \(f\) সীমাবদ্ধ সেখানে সমভাবে — uniform)।
ধাপ ০ — মানগুলো কোথায় বসে। স্থির \(\omega\)-তে ঠিক দুই রকম: হয় \(f(\omega)\ge n\), তখন \(f_n(\omega)=n\); নয়তো \(f(\omega)<n\), তখন একটি অনন্য \(k\in\{0,1,\dots,n2^n-1\}\) আছে যার জন্য \(k/2^n\le f(\omega)<(k+1)/2^n\), এবং তখন \(f_n(\omega)=k/2^n\)। অর্থাৎ \(f_n(\omega)\) হলো \(f(\omega)\)-কে নিচের দিকে নিকটতম \(2^{-n}\)-গুণিতকে গোল-করা মান, ঊর্ধ্বে \(n\)-এ আবদ্ধ। স্পষ্টতই \(0\le f_n(\omega)\le f(\omega)\) ও \(f_n(\omega)\le n\)।
ধাপ ১ — \(f_n\) simple ও measurable (অংশ ক)। \(f_n\) কেবল সসীম সংখ্যক মান নেয়: \(\{0,\tfrac1{2^n},\tfrac2{2^n},\dots,\tfrac{n2^n-1}{2^n}\}\cup\{n\}\) — মোট \(n2^n+1\)টি। আর প্রতিটি মানের স্তর-set একটি measurable set:
যেহেতু \(f\) measurable এবং \([\tfrac{k}{2^n},\tfrac{k+1}{2^n})\), \([n,\infty]\) Borel। একটি indicator \(\mathbf 1_A\) measurable iff \(A\in\mathcal F\) (কারণ \(\mathbf 1_A^{-1}(B)\) কেবল \(\varnothing,A,A^c,\Omega\)-র একটি), এবং measurable ফাংশনের সসীম ধনাত্মক-গুণিত যোগও measurable (প্রমাণ ৫)। সুতরাং \(f_n\) একটি measurable simple function। ∎(ধাপ ১)
ধাপ ২ — একঘাতিতা \(f_n\le f_{n+1}\) (অংশ খ): dyadic পরিশোধন। এখানেই \(2^{-n}\to 2^{-(n+1)}\) গ্রিড দ্বিগুণ সূক্ষ্ম হওয়ার সৌন্দর্য। স্থির \(\omega\), ধরি \(t=f(\omega)\)। দুই কেস:
কেস A: \(t\ge n+1\). তখন \(f_{n+1}(\omega)=n+1\) এবং (যেহেতু \(t\ge n+1>n\)) \(f_n(\omega)=n\)। তাই \(f_n(\omega)=n\le n+1=f_{n+1}(\omega)\)। ✓
কেস B: \(n\le t<n+1\). তখন \(f_n(\omega)=n\) (truncation)। আর স্তরে \(t<n+1\) বলে \(f_{n+1}(\omega)=k/2^{n+1}\) যেখানে \(k/2^{n+1}\le t\); বিশেষত \(k/2^{n+1}\le t\) মানে \(k\ge n\cdot 2^{n+1}\) থেকে শুরু করে, এবং সবচেয়ে ছোট সম্ভাব্য মান \(f_{n+1}(\omega)\ge n\) (কারণ \(t\ge n\) গোল করলে অন্তত \(n\))। সুতরাং \(f_n(\omega)=n\le f_{n+1}(\omega)\)। ✓
কেস C: \(t<n\). তখন উভয় ক্ষেত্রেই truncation-এর বদলে গোল-করা কাজ করে। \(f_n(\omega)=k/2^n\) যেখানে এটি \(t\)-এর নিচে নিকটতম \(2^{-n}\)-গুণিতক। লক্ষ করি \(k/2^n=2k/2^{n+1}\) একটি \(2^{-(n+1)}\)-গুণিতকও বটে এবং \(\le t\); তাই \(t\)-এর নিচে নিকটতম \(2^{-(n+1)}\)-গুণিতক \(f_{n+1}(\omega)\) অন্তত \(k/2^n\) (সূক্ষ্মতর গ্রিডে নিচের প্রান্ত আরও কাছে বা সমান, কখনো দূরে নয়)। অর্থাৎ \(f_{n+1}(\omega)\ge f_n(\omega)\)। ✓ — এটাই "পরিশোধন": গ্রিড সূক্ষ্ম হলে নিচ-থেকে আনুমান কখনো নামে না, কেবল ওঠে।
তিন কেসেই \(f_n(\omega)\le f_{n+1}(\omega)\); যেহেতু \(\omega\) যথেচ্ছ, \(f_n\le f_{n+1}\) সর্বত্র। ∎(ধাপ ২)
ধাপ ৩ — অভিসৃতি \(f_n\to f\) ও ত্রুটি-সীমা (অংশ গ)। স্থির \(\omega\), \(t=f(\omega)\)।
যদি \(t<\infty\): তখন \(n>t\)-এর জন্য সর্বদা \(t<n\), তাই \(f_n(\omega)\) গোল-করা শাখায় পড়ে এবং সংজ্ঞা থেকে
(কারণ \(f_n(\omega)=k/2^n\) আর \(t\in[k/2^n,(k+1)/2^n)\), তাই পার্থক্য এক ঘরের চেয়ে ছোট।) সুতরাং \(f_n(\omega)\to t=f(\omega)\)। বিশেষত \(\{f\le n\}\)-এ (\(t\le n\)) এই ত্রুটি \(\le 2^{-n}\), যা \(\omega\)-নিরপেক্ষ — অর্থাৎ \(f\) যেখানে \(n\)-এ আবদ্ধ সেখানে অভিসৃতি সমভাবে (uniform), তাই গোটা সীমাবদ্ধ অংশে।
যদি \(t=\infty\): তখন প্রতিটি \(n\)-এ \(f(\omega)\ge n\), তাই \(f_n(\omega)=n\to\infty=f(\omega)\)। অভিসৃতি বর্ধিত অর্থে বজায়।
দুই ক্ষেত্রেই \(f_n(\omega)\to f(\omega)\); বিন্দুভিত্তিক অভিসৃতি প্রতিষ্ঠিত। ∎(ধাপ ৩)
ধাপ ৪ — সাধারণ (সাইন-যুক্ত) \(f\)। যেকোনো measurable \(f:\Omega\to\overline{\mathbb R}\)-কে ধনাত্মক ও ঋণাত্মক অংশে ভাঙি:
যেখানে \(f^+,f^-\ge 0\) উভয়ই measurable (প্রমাণ ৪-এর \(\max\)-নিয়ম)। উপরের নির্মাণ আলাদাভাবে \(f^+\) ও \(f^-\)-এ প্রয়োগ করে simple function \(f_n^{+}\uparrow f^+\) ও \(f_n^{-}\uparrow f^-\) পাই; তখন \(f_n:=f_n^{+}-f_n^{-}\) simple এবং \(f_n\to f\) বিন্দুভিত্তিকভাবে (যেখানে \(f\) সংজ্ঞায়িত)। ∎
কেন এটাই 7.4-এর ভিত্তি। Lebesgue integral সংজ্ঞায়িত হয় ঠিক এই মই বেয়ে: প্রথমে simple ফাংশনের integral সরল যোগফল হিসেবে, \(\int\bigl(\sum_i a_i\mathbf 1_{A_i}\bigr)d\mu=\sum_i a_i\,\mu(A_i)\); তারপর অঋণাত্মক measurable \(f\ge 0\)-র জন্য
যেখানে শেষ সমতা ঠিক এই উপপাদ্যের একঘাতী \(f_n\uparrow f\) থেকে Monotone Convergence Theorem (একঘাতী অভিসৃতি উপপাদ্য) দিয়ে আসে। আর সাধারণ \(f\)-এর জন্য \(\int f=\int f^+-\int f^-\)। এই উপপাদ্য না থাকলে "প্রতিটি measurable ফাংশনকে simple দিয়ে নিচ-থেকে একঘাতীভাবে ছোঁয়া যায়" — Lebesgue integration-এর গোটা সংজ্ঞাটাই দাঁড়াত না।
এক বাক্যে: dyadic truncation \(f_n\) প্রতিটি স্তরে measurable simple function, গ্রিড দ্বিগুণ সূক্ষ্ম হওয়ায় তা একঘাতী বর্ধমান (\(f_n\uparrow\)), এবং সীমাবদ্ধ অংশে ত্রুটি \(\le 2^{-n}\) হওয়ায় বিন্দুভিত্তিকভাবে \(f\)-এ পৌঁছায়—এই "simple দিয়ে নিচ-থেকে ছোঁয়া"-ই Lebesgue integral (7.4)-কে গড়ার একমাত্র সিঁড়ি।
প্রমাণ ৭ — pushforward \(P_X\) একটি probability measure (★)¶
দাবি। ধরা যাক \((\Omega,\mathcal F,\mathbb P)\) একটি probability space এবং \(X:\Omega\to\mathbb R\) একটি RV। সংজ্ঞা করি pushforward (অগ্র-ঠেলা) বা distribution / law (বণ্টন):
তবে \(P_X\) হলো \((\mathbb R,\mathcal B)\)-এর উপর একটি probability measure, ফলে \((\mathbb R,\mathcal B,P_X)\) একটি probability space — RV-এর "নিজস্ব" নমুনাক্ষেত্র।
প্রথমে — \(P_X\) সুসংজ্ঞায়িত। প্রতিটি \(B\in\mathcal B\)-র জন্য \(X\) RV হওয়ায় \(X^{-1}(B)\in\mathcal F\), তাই \(\mathbb P\bigl(X^{-1}(B)\bigr)\) অর্থপূর্ণ (\(\mathbb P\) কেবল \(\mathcal F\)-এর সদস্যে সংজ্ঞায়িত)। এ কারণেই measurability শর্তটি অপরিহার্য — তা ছাড়া \(P_X\) লেখাই যেত না।
ধাপ ১ — অঋণাত্মকতা ও মোট ভর \(1\)। যেকোনো \(B\)-র জন্য \(X^{-1}(B)\in\mathcal F\) এবং \(\mathbb P\ge 0\), তাই \(P_X(B)=\mathbb P\bigl(X^{-1}(B)\bigr)\ge 0\)। আর
কারণ \(X^{-1}(\mathbb R)=\{\omega:X(\omega)\in\mathbb R\}=\Omega\) (প্রতিটি \(X(\omega)\) একটি বাস্তব সংখ্যা) এবং \(\mathbb P(\Omega)=1\) (probability measure)। ∎(ধাপ ১)
ধাপ ২ — \(P_X(\varnothing)=0\). \(X^{-1}(\varnothing)=\varnothing\) (কোনো \(\omega\)-ই \(X(\omega)\in\varnothing\) মানে না), তাই \(P_X(\varnothing)=\mathbb P(\varnothing)=0\)। ∎(ধাপ ২)
ধাপ ৩ — গণনাযোগ্য যোগাত্মকতা (countable additivity)। এটাই measure হওয়ার মূল শর্ত। ধরা যাক \(B_1,B_2,\dots\in\mathcal B\) পরস্পর-বিচ্ছিন্ন (pairwise disjoint): \(i\ne j\Rightarrow B_i\cap B_j=\varnothing\)। দুটি ধাপে চলি।
ধাপ ৩ক — preimage বিচ্ছিন্নতা সংরক্ষণ করে। দাবি: \(X^{-1}(B_1),X^{-1}(B_2),\dots\)-ও পরস্পর-বিচ্ছিন্ন। কারণ preimage ছেদের সাথে বিনিময় করে:
তাই source-জগতেও ঘরগুলো অ-অধিক্রমী থাকে — এটাই \(\mathbb P\)-র additivity প্রয়োগের পূর্বশর্ত।
ধাপ ৩খ — হিসাব। এবার preimage সংযোগের সাথেও বিনিময় করে এবং \(\mathbb P\)-র গণনাযোগ্য যোগাত্মকতা (Kolmogorov axiom) ব্যবহার করে:
এখানে দ্বিতীয় সমতা preimage-সংযোগ বিনিময়; \((\ast)\) ধাপ ৩ক-এর বিচ্ছিন্নতার জন্য \(\mathbb P\)-এর countable additivity; শেষ সমতা \(P_X\)-এর সংজ্ঞা। সুতরাং \(P_X\) গণনাযোগ্যভাবে যোগাত্মক। ∎(ধাপ ৩)
ধাপ ১–৩ একত্রে: \(P_X(\varnothing)=0\), \(P_X\ge 0\), গণনাযোগ্য যোগাত্মক, এবং \(P_X(\mathbb R)=1\) — তাই \(P_X\) একটি probability measure, আর \((\mathbb R,\mathcal B,P_X)\) একটি probability space। ∎
সংযোগ — \(F_X\) গোটা \(P_X\) নির্ধারণ করে (π–λ, 7.2)। CDF (cumulative distribution function, ক্রমযোজিত বণ্টন ফাংশন) সংজ্ঞায়িত \(F_X(x):=P_X\bigl((-\infty,x]\bigr)=\mathbb P(X\le x)\)। সংগ্রহ \(\mathcal P=\{(-\infty,x]:x\in\mathbb R\}\) একটি π-system (ছেদ-বদ্ধ: \((-\infty,x]\cap(-\infty,y]=(-\infty,\min(x,y)]\)) এবং \(\sigma(\mathcal P)=\mathcal B\)। ধরা যাক \(Q\) আরেকটি probability measure যার \(Q\bigl((-\infty,x]\bigr)=F_X(x)\) সব \(x\)-এ — অর্থাৎ \(P_X\) ও \(Q\) গোটা \(\mathcal P\)-তে মেলে। তবে 7.2-এর π–λ uniqueness উপপাদ্য (দুই probability measure একটি generating π-system-এ মিললে গোটা \(\sigma(\mathcal P)\)-তে মেলে) দিয়ে \(P_X=Q\) সর্বত্র \(\mathcal B\)-তে। সুতরাং একটিমাত্র \(F_X\) গোটা law \(P_X\)-কে অনন্যভাবে pin করে — এ কারণেই পরিসংখ্যানে "বণ্টন" বলতে প্রায়শই কেবল CDF-ই যথেষ্ট।
এক বাক্যে: \(P_X(B)=\mathbb P(X^{-1}(B))\) অঋণাত্মক, \(P_X(\mathbb R)=\mathbb P(\Omega)=1\), এবং preimage বিচ্ছিন্নতা ও সংযোগ দুটোই সংরক্ষণ করায় \(\mathbb P\)-র countable additivity সরাসরি \(P_X\)-এ উত্তরায়িত হয়—তাই \((\mathbb R,\mathcal B,P_X)\) একটি probability space, আর π–λ দিয়ে এর CDF \(F_X\) গোটা law-কে অনন্যভাবে নির্ধারণ করে।
৫ · কোড ল্যাব (Python)¶
এই অধ্যায়ের কেন্দ্রীয় বস্তুগুলো — measurable map (পরিমাপযোগ্য চিত্রণ), σ(X) (একটা random variable-এর জেনারেট-করা σ-algebra, অর্থাৎ "\(X\)-এর তথ্য"), pushforward law (সম্মুখ-ঠেলা বণ্টন \(P_X\)), আর simple function-এর dyadic approximation (দ্বিমিক সিঁড়ি-আসন্নায়ন) — সবই কাগজে বিমূর্ত। কিন্তু এদের একটা সুবিধা আছে: প্রতিটাকেই একটা কম্পিউটার দিয়ে হয় গুনিয়ে, নয় আসন্ন করিয়ে, নয় যাচাই করিয়ে নেওয়া যায়। dyadic সিঁড়ি একটা grid-এর উপর সংখ্যা; \(\sigma(X)\) একটা finite Ω-তে কেবল closure গোনার ব্যাপার (যেমন 7.2-এর ল্যাবে); আর \(Y=X^2\)-এর law একটা seeded Monte-Carlo গড়। এই ল্যাবে তাই §৪-এর প্রতিটা প্রমাণ-উপপাদ্যকে যন্ত্রের হাতে তুলে দিয়ে তাদের সংখ্যাগুলো স্ক্রিনে ফোটানো হবে।
কী কী computationally যাচাই করা হবে, এক নজরে:
- Dyadic staircase approximation। \(f(x)=x\)-এর জন্য \(f_n(x)=\min\!\bigl(n,\ \lfloor 2^n x\rfloor/2^n\bigr)\) গড়ে একটা fine grid-এ \(\sup\lvert f-f_n\rvert\) ছাপাই \(n=1,2,3,4,8\)-এ → প্রায় \(2^{-n}\); এবং monotone সিঁড়ি \(f_n\le f_{n+1}\) pointwise যাচাই করি। একই নির্মাণ একটা বাঁকানো লক্ষ্য \(f(x)=\sqrt x\)-এও চালাই।
- σ(X) of a simple function। একটা finite Ω-তে \(k\)-টা স্তর-সেট (level set) বিশিষ্ট simple function \(X\)-এর জন্য \(\sigma(X)\) = level set-গুলোকে complement+union-এ বন্ধ করার ফল; যাচাই: \(\lvert\sigma(X)\rvert=2^k\) (\(k=2,3,4\to 4,8,16\))।
- Measurability closure। finite grid-এ দেখাই — সসীম-সংখ্যক measurable step function-এর sup আবার একটা step function (তাই measurable); আর continuous \(g\)-এর জন্য \(g\circ X\) আবার একটা RV (compose করে যাচাই)।
- Pushforward / law of \(Y=X^2\)।
default_rng(20260619), \(N=10^6\); \(X\sim\text{Uniform}(-1,1)\)-এ MC \(\mathbb E[Y]\to 0.3335\) (সত্যি \(1/3\)), \(\mathbb P(Y\le \tfrac14)\to 0.4997\) (সত্যি \(1/2\)); এবং \(Y\)-এর empirical density-কে analytic \(\frac{1}{2\sqrt y}\)-এর সঙ্গে মিলাই।
স্ক্রিপ্টের কাঠামো¶
পুরো ল্যাবটা একটাই runnable স্ক্রিপ্ট — _code/lab_7-3.py — চারটে ব্যাখ্যাযুক্ত অংশে ভাগ করা। নির্ভরতা শুধু numpy আর standard library-র itertools (subset-জোড়ার উপর iterate করতে, \(\sigma(X)\)-এর closure-এ)। প্রতিটা অংশ একটা function:
| অংশ | function | কী দেখায় | মূল ধারণা |
|---|---|---|---|
| ১ | part1_dyadic() |
\(\sup\lvert f-f_n\rvert\approx 2^{-n}\), ও \(f_n\le f_{n+1}\) | approximation |
| ২ | part2_sigma_of_X() |
\(\lvert\sigma(X)\rvert=4,8,16\) (\(k=2,3,4\)) | generated σ-algebra |
| ৩ | part3_closure() |
step-গুলোর sup আবার step; \(g\circ X\) আবার RV | closure |
| ৪ | part4_pushforward() |
\(\mathbb E[Y]=0.3335\), \(\mathbb P(Y\le\tfrac14)=0.4997\) | pushforward law |
Monte-Carlo অংশের randomness reproducible রাখতে seed বাঁধা: np.random.default_rng(20260619)। dyadic আর \(\sigma(X)\) অংশ deterministic — কোনো randomness নেই। নিচের প্রতিটা output block স্ক্রিপ্টটা সত্যিই চালিয়ে পাওয়া আসল stdout; নিজের মেশিনে python3 lab_7-3.py চালালে অবিকল এই সংখ্যাগুলোই পাওয়া যাবে।
import itertools
import numpy as np
def banner(title):
line = "=" * 64
print(line)
print(title)
print(line)
def show_set(s):
"""frozenset-কে সাজানো {...} string হিসেবে ছাপায়।"""
if not s:
return "{}"
return "{" + ",".join(str(x) for x in sorted(s)) + "}"
৫.১ · Dyadic staircase — \(f_n\uparrow f\) এবং \(\sup\lvert f-f_n\rvert\approx 2^{-n}\)¶
§৪-এর approximation theorem-এর হৃৎপিণ্ড একটা স্পষ্ট নির্মাণ: অঋণাত্মক measurable \(f\)-এর নিচে একটা dyadic সিঁড়ি
বসাও — অর্থাৎ \(f(x)\)-কে নিচ থেকে দ্বিমিক-পর্দা \(1/2^n\)-এর গুণিতকে গোল করো (আর উপরে \(n\)-এ ছাঁটো)। \([0,1]\)-এ ছাঁট কখনো লাগে না, তাই কার্যত \(f_n(x)=\lfloor 2^n x\rfloor/2^n\) — \(x\)-কে না-ছাড়ানো বৃহত্তম \(2^n\)-হরের দ্বিমিক ভগ্নাংশ। প্রতিবার \(n\) এক বাড়লে পর্দা অর্ধেক হয়, তাই ত্রুটি \(\sup\lvert f-f_n\rvert\) ঠিক \(2^{-n}\)-এর দিকে নামে; আর যেহেতু প্রতিটা পর্দা পরেরটার পরিশোধন (refinement), সিঁড়ি monotone — \(f_n\le f_{n+1}\) সর্বত্র। (এটাই 7.4-এ monotone convergence-এর মঞ্চ সাজায়।)
grid হিসেবে \([0,1)\)-এ \(2{,}000{,}000\) বিন্দু নিই, আর ঠিক ডান-প্রান্ত \(1.0\) বাদ দিই — কারণ সেখানে \(\lfloor 2^n x\rfloor\) লাফ দিয়ে \(2^n\) হয়ে যায় (supremum \([0,1)\)-এ অর্জিত হয় না, কেবল আসন্ন হয়)। একই নির্মাণ একটা বাঁকানো লক্ষ্য \(f(x)=\sqrt x\)-এও চালিয়ে দেখাই — সিঁড়িটা \(f\)-কেই পড়ে (identity-কে নয়), তাই সেখানেও ত্রুটি \(\approx 2^{-n}\)।
def dyadic_simple(x, n):
"""n-তম dyadic simple function:
f_n(x) = min( n , floor(2^n * x) / 2^n ).
প্রতিবার n বাড়লে পর্দা অর্ধেক হয়; [0,1]-এ cap কখনো লাগে না, তাই
f_n(x) = x-কে না-ছাড়ানো বৃহত্তম 2^n-হরের দ্বিমিক ভগ্নাংশ।"""
step = np.floor((2.0 ** n) * x) / (2.0 ** n)
return np.minimum(float(n), step)
def part1_dyadic():
banner("PART 1 : dyadic staircase approximation f_n ^ f")
grid = np.linspace(0.0, 1.0, 2_000_001)[:-1] # [0,1), ডান-প্রান্ত বাদ
print(" target f(x) = x on [0,1) (fine grid, 2,000,000 points)\n")
print(" n sup|f - f_n| 2^-n ratio")
print(" --- ------------ ---------- -------")
f = grid
for n in (1, 2, 3, 4, 8):
fn = dyadic_simple(grid, n)
sup_err = float(np.max(np.abs(f - fn)))
bound = 2.0 ** (-n)
print(f" {n:>3d} {sup_err:>10.6f} {bound:>10.6f} {sup_err / bound:>6.3f}")
print()
print(" monotone check f_n <= f_{n+1} pointwise on the grid:")
all_mono = True
for n in range(0, 10):
fn, fn1 = dyadic_simple(grid, n), dyadic_simple(grid, n + 1)
mono = bool(np.all(fn <= fn1 + 1e-15))
all_mono = all_mono and mono
if n in (0, 1, 2, 3, 8):
print(f" f_{n} <= f_{n + 1} everywhere ? {mono}")
print(f" => ladder is monotone for all n checked (0..9) ? {all_mono}\n")
print(" same construction against a curved target f(x) = sqrt(x):")
print(" n sup|f - f_n| 2^-n")
print(" --- ------------ ----------")
g = np.sqrt(grid)
for n in (1, 2, 3, 4, 8):
step = np.floor((2.0 ** n) * g) / (2.0 ** n)
gn = np.minimum(float(n), step)
sup_err = float(np.max(np.abs(g - gn)))
print(f" {n:>3d} {sup_err:>10.6f} {2.0 ** (-n):>10.6f}")
return all_mono
================================================================
PART 1 : dyadic staircase approximation f_n ^ f
================================================================
target f(x) = x on [0,1) (fine grid, 2,000,000 points)
n sup|f - f_n| 2^-n ratio
--- ------------ ---------- -------
1 0.499999 0.500000 1.000
2 0.249999 0.250000 1.000
3 0.124999 0.125000 1.000
4 0.062499 0.062500 1.000
8 0.003906 0.003906 1.000
monotone check f_n <= f_{n+1} pointwise on the grid:
f_0 <= f_1 everywhere ? True
f_1 <= f_2 everywhere ? True
f_2 <= f_3 everywhere ? True
f_3 <= f_4 everywhere ? True
f_8 <= f_9 everywhere ? True
=> ladder is monotone for all n checked (0..9) ? True
same construction against a curved target f(x) = sqrt(x):
n sup|f - f_n| 2^-n
--- ------------ ----------
1 0.500000 0.500000
2 0.250000 0.250000
3 0.125000 0.125000
4 0.062500 0.062500
8 0.003906 0.003906
পাঠোদ্ধার (read-off)। ত্রুটি-স্তম্ভ আর \(2^{-n}\)-স্তম্ভ কার্যত অভিন্ন: \(0.5,\,0.25,\,0.125,\,0.0625,\,0.003906\) — ratio ঠিক \(1.000\)। (\(f(x)=x\)-এ মান \(0.499999\) হলো grid-পদক্ষেপের জন্য \(2^{-n}\)-এর সামান্য-নিচের আসন্ন; আদর্শ supremum \(2^{-n}\) অর্জিত হয় না, কেবল আসন্ন হয় — তাই grid-মান ও bound প্রায় মিলে।) প্রতিবার \(n\) এক বাড়লে ত্রুটি ঠিক অর্ধেক, কারণ সিঁড়ি-পর্দা \(1/2^n\) অর্ধেক হয় — এটাই "যত সূক্ষ্ম দ্বিমিক বিভাজন, তত কাছাকাছি আসন্নায়ন"। monotone-যাচাই সবগুলো \(n\)-এ True: পরের সিঁড়ি আগেরটাকে কোথাও নিচে নামায় না, কেবল পরিশোধন করে — অর্থাৎ \(0\le f_n\uparrow f\), যা §৪-এর approximation theorem-এর হুবহু দাবি। আর বাঁকানো \(\sqrt x\)-এও একই \(2^{-n}\) হার দেখায় যে নির্মাণটা যেকোনো অঋণাত্মক measurable \(f\)-এর তলায় বসে — identity-তে নয়, \(f\)-এর নিজের মানে গোল করে — এটাই simple function থেকে integral-এ সেতুর সর্বজনীনতা।
৫.২ · σ(X) — simple function থেকে জেনারেট-করা σ-algebra, \(\lvert\sigma(X)\rvert=2^k\)¶
§৩–§৪-এ দেখা গেছে একটা simple random variable \(X=\sum_{i=1}^k a_i\mathbf 1_{A_i}\)-এর জন্য \(\sigma(X)=X^{-1}(\mathcal B)\) আসলে কেবল level set (স্তর-সেট) \(A_i=\{X=a_i\}\)-গুলোকে complement আর union-এ বন্ধ করার ফল — কারণ \(X\) এই \(A_i\)-গুলোর মধ্যে কোনো পার্থক্য টের পায় না, কেবল কোন স্তরে আছ তা বলে। \(A_1,\dots,A_k\) একটা partition (Ω-এর পারস্পরিক-বিচ্ছিন্ন আবরণ), তাই এদের closure ঠিক finite atom-ভিত্তিক σ-algebra, যার সদস্যসংখ্যা সবসময় \(2^{(\text{atom-সংখ্যা})}=2^k\)।
7.2-এর ল্যাবের sigma_algebra() (fixed-point closure, \(\{\varnothing,\Omega\}\) থেকে complement+pairwise-union-এ বন্ধ) এখানে পুনর্ব্যবহার করি, কেবল generator হিসেবে level set-গুলো ঢালি। \(\Omega=\{0,\dots,7\}\)-এ তিনটে simple function নিই — \(k=2,3,4\)টা ভিন্ন মান বিশিষ্ট — আর প্রতিবার গুনি \(\lvert\sigma(X)\rvert\)।
def sigma_algebra(omega, generators):
"""finite `omega`-র উপর `generators`-ধারী ক্ষুদ্রতম σ-algebra:
{∅, Ω} + generator থেকে complement ও pairwise union-এ বন্ধ যতক্ষণ
family স্থির না হয়। (finite Ω-তে pairwise union সব countable union আনে।)"""
omega = frozenset(omega)
fam = {frozenset(), omega}
for g in generators:
fam.add(frozenset(g))
changed = True
while changed:
changed = False
current = list(fam)
for s in current: # complement-এ বন্ধ
comp = omega - s
if comp not in fam:
fam.add(comp); changed = True
for s, t in itertools.combinations(current, 2): # pairwise union
u = s | t
if u not in fam:
fam.add(u); changed = True
return fam
def level_sets(omega, X):
"""simple function X (point -> value) -এর level set {X = a};
এগুলোই σ(X)-এর atom।"""
buckets = {}
for w in omega:
buckets.setdefault(X[w], set()).add(w)
return [frozenset(v) for v in buckets.values()]
def part2_sigma_of_X():
banner("PART 2 : sigma(X) of a simple function -- |sigma(X)| = 2^k")
Omega = frozenset(range(8))
simple_funcs = {
2: {0: 5, 1: 5, 2: 5, 3: 5, 4: 9, 5: 9, 6: 9, 7: 9},
3: {0: 1, 1: 1, 2: 1, 3: 2, 4: 2, 5: 3, 6: 3, 7: 3},
4: {0: 0, 1: 0, 2: 7, 3: 7, 4: 4, 5: 4, 6: 8, 7: 8},
}
for k in (2, 3, 4):
X = simple_funcs[k]
atoms = level_sets(Omega, X)
sigX = sigma_algebra(Omega, atoms)
vals = sorted(set(X.values()))
print(f" k = {k} distinct values {vals}")
print(f" level sets {{X=a}} : " +
", ".join(show_set(a) for a in sorted(atoms, key=lambda z: sorted(z))))
print(f" |sigma(X)| = {len(sigX)} expected 2^{k} = {2 ** k} "
f"match? {len(sigX) == 2 ** k}")
print()
return [len(sigma_algebra(Omega, level_sets(Omega, simple_funcs[k]))) for k in (2, 3, 4)]
================================================================
PART 2 : sigma(X) of a simple function -- |sigma(X)| = 2^k
================================================================
k = 2 distinct values [5, 9]
level sets {X=a} : {0,1,2,3}, {4,5,6,7}
|sigma(X)| = 4 expected 2^2 = 4 match? True
k = 3 distinct values [1, 2, 3]
level sets {X=a} : {0,1,2}, {3,4}, {5,6,7}
|sigma(X)| = 8 expected 2^3 = 8 match? True
k = 4 distinct values [0, 4, 7, 8]
level sets {X=a} : {0,1}, {2,3}, {4,5}, {6,7}
|sigma(X)| = 16 expected 2^4 = 16 match? True
পাঠোদ্ধার। তিন ক্ষেত্রেই \(\lvert\sigma(X)\rvert\) ঠিক \(2^k\) — \(k=2\to4\), \(k=3\to8\), \(k=4\to16\) (match? True)। তাৎপর্যটা হলো: \(\sigma(X)\) "\(X\)-পর্যবেক্ষণ করলে যে প্রশ্নগুলোর উত্তর জানা যায়" তাদের পরিবার, আর simple \(X\)-এর ক্ষেত্রে সেই প্রশ্নগুলো ঠিক "\(\omega\) কোন level set-এ আছে?"-এর সব যৌক্তিক সমন্বয়। \(k\)টা level set মানে \(k\)টা atom, আর atom-দের যেকোনো উপসংগ্রহ মেলালে একেকটা সেট — তাই মোট \(2^k\)। লক্ষণীয়, \(X\) যে মানগুলো নেয় (যেমন \(\{5,9\}\) বনাম \(\{0,4,7,8\}\)) তা \(\sigma(X)\)-এ কিছুই বদলায় না — কেবল কয়টা স্তর (অর্থাৎ partition-এর সূক্ষ্মতা) গুনে; এটাই "\(\sigma(X)\) = তথ্যের রুক্ষতা, মানের নাম নয়"। এই finite ছবি 7.7-এ conditional expectation (\(\sigma\)-algebra-র উপর projection) ও 7.8-এ filtration-এর সরাসরি ভিত্তি।
৫.৩ · Closure — step-গুলোর sup আবার step, এবং \(g\circ X\) আবার RV¶
§৪-এর closure-উপপাদ্যগুলো বলে measurable ফাংশনের শ্রেণি ভাঙা যায় না: সসীম (বা গণনাযোগ্য) sup/inf, এবং continuous \(g\)-এর সঙ্গে composition \(g\circ X\) — সব আবার measurable। finite grid-এ এর দুটো রূপ সংখ্যায় দেখাই। (ক) \([0,1)\)-কে \(4\)টা দ্বিমিক ব্লকে ভেঙে তিনটে step function (যাদের মান কেবল ব্লক-সূচকের উপর নির্ভর করে, তাই measurable) নিই; তাদের pointwise sup যদি প্রতিটা ব্লকে ধ্রুবক থাকে, তবে সেটাও একটা step function — অর্থাৎ measurable। যাচাই: প্রতি ব্লকে sup-এর distinct মানসংখ্যা \(1\) কিনা। (খ) একটা simple RV \(X\) আর continuous \(g(t)=t^2-1\) নিয়ে \(g\circ X\) গণনা করি — যেহেতু \(X\) সসীম-মান, \(g\circ X\)-ও সসীম-মান, তাই একটা simple RV (measurable); \(g\) কিছু স্তর মিলিয়ে দিতে পারে (যেমন \(X=\pm1\) দুটোই \(g\)-তে \(0\) দেয়), তাই \(g\circ X\)-এর স্তরসংখ্যা \(\le\) \(X\)-এর স্তরসংখ্যা।
def part3_closure():
banner("PART 3 : closure -- sup of step functions, and g o X")
# (a) 4টা দ্বিমিক ব্লকে তিনটে step function; pointwise sup ব্লকে ধ্রুবক?
grid = np.linspace(0.0, 1.0, 100_001)[:-1]
block = np.floor(4.0 * grid).astype(int) # ব্লক-সূচক 0,1,2,3
s1_vals = np.array([0.0, 2.0, 1.0, 3.0])
s2_vals = np.array([1.0, 1.0, 2.5, 0.5])
s3_vals = np.array([2.0, 0.0, 0.0, 2.0])
s1, s2, s3 = s1_vals[block], s2_vals[block], s3_vals[block]
smax = np.maximum.reduce([s1, s2, s3]) # pointwise sup
per_block_unique = [int(np.unique(np.round(smax[block == b], 12)).size)
for b in range(4)]
smax_block_vals = [float(smax[block == b][0]) for b in range(4)]
is_step = all(u == 1 for u in per_block_unique)
print(" (a) sup of 3 measurable step functions on 4 dyadic blocks:")
print(f" s1 block-values = {s1_vals.tolist()}")
print(f" s2 block-values = {s2_vals.tolist()}")
print(f" s3 block-values = {s3_vals.tolist()}")
print(f" max block-values= {smax_block_vals} "
f"(expected {np.maximum.reduce([s1_vals, s2_vals, s3_vals]).tolist()})")
print(f" distinct values per block = {per_block_unique} "
f"(all 1 => still a step function => measurable? {is_step})\n")
# (b) g o X, g(t)=t^2-1 continuous, X simple => g o X simple (measurable)
print(" (b) composition g o X with continuous g(t) = t^2 - 1:")
Xvals = np.array([-2.0, -1.0, 0.0, 1.0, 2.0, 3.0])
gX = Xvals ** 2 - 1.0
print(f" X takes values : {Xvals.tolist()}")
print(f" (g o X) values : {gX.tolist()}")
n_levels_X, n_levels_gX = int(np.unique(Xvals).size), int(np.unique(gX).size)
print(f" #levels of X = {n_levels_X}, #levels of g o X = {n_levels_gX} "
f"(finite => g o X is a simple RV => measurable)")
ok_compose = n_levels_gX <= n_levels_X
n_merged = n_levels_X - n_levels_gX
print(f" #levels(g o X) <= #levels(X) ? {ok_compose} "
f"(g merged {n_merged} levels: X=+/-1 -> 0 and X=+/-2 -> 3)")
return is_step, ok_compose
================================================================
PART 3 : closure -- sup of step functions, and g o X
================================================================
(a) sup of 3 measurable step functions on 4 dyadic blocks:
s1 block-values = [0.0, 2.0, 1.0, 3.0]
s2 block-values = [1.0, 1.0, 2.5, 0.5]
s3 block-values = [2.0, 0.0, 0.0, 2.0]
max block-values= [2.0, 2.0, 2.5, 3.0] (expected [2.0, 2.0, 2.5, 3.0])
distinct values per block = [1, 1, 1, 1] (all 1 => still a step function => measurable? True)
(b) composition g o X with continuous g(t) = t^2 - 1:
X takes values : [-2.0, -1.0, 0.0, 1.0, 2.0, 3.0]
(g o X) values : [3.0, 0.0, -1.0, 0.0, 3.0, 8.0]
#levels of X = 6, #levels of g o X = 4 (finite => g o X is a simple RV => measurable)
#levels(g o X) <= #levels(X) ? True (g merged 2 levels: X=+/-1 -> 0 and X=+/-2 -> 3)
পাঠোদ্ধার। (ক) তিনটে step-এর pointwise max ব্লকওয়াইজ \([2.0,2.0,2.5,3.0]\) — আর প্রতি ব্লকে distinct মানসংখ্যা \([1,1,1,1]\), অর্থাৎ sup প্রতিটা ব্লকে একটাই মান নেয়, কাজেই এটা আবার একটা step function, তাই measurable (measurable? True)। এটাই §৪-এর "\(\max\) measurable" দাবির সংখ্যা-রূপ: measurable building-block-এর sup ভাঙে না। (খ) \(X\) ছয়টা মান নেয়, কিন্তু continuous \(g(t)=t^2-1\)-এর পর \(g\circ X\) মাত্র চারটা স্তরে নামে — কারণ \(g\) জোড়-প্রতিসম, তাই \(X=\pm1\mapsto 0\) আর \(X=\pm2\mapsto 3\) মিলে যায় (\(g\) merged \(2\) levels)। তবু সবগুলো মান সসীম, কাজেই \(g\circ X\) একটা simple RV — measurable। লক্ষণীয়, composition স্তর মেলাতে পারে কিন্তু কখনো বাড়ায় না (#levels(g o X) <= #levels(X)), যা \(\sigma(g\circ X)\subseteq\sigma(X)\)-এরই প্রতিফলন: \(g\) প্রয়োগ মানে তথ্য হারানো বা সমান থাকা, নতুন তথ্য নয়।
৫.৪ · Pushforward — \(Y=X^2\)-এর law, \(\mathbb E[Y]=0.3335\), \(\mathbb P(Y\le\tfrac14)=0.4997\)¶
§৪-এর শেষ প্রমাণে দেখা গেছে pushforward \(P_X(B)=\mathbb P(X^{-1}(B))\) একটা genuine probability measure — \(X\)-এর law। এখানে সেটা হাতেনাতে দেখি: \(X\sim\text{Uniform}(-1,1)\) থেকে \(Y=X^2\) গড়ে \(Y\)-এর law-এর দুটো বৈশিষ্ট্য Monte-Carlo-তে আনি। analytic হিসাব সরল — \(\mathbb E[Y]=\mathbb E[X^2]=\int_{-1}^{1}\frac{x^2}{2}\,dx=\frac13\), আর \(\mathbb P(Y\le\tfrac14)=\mathbb P(\lvert X\rvert\le\tfrac12)=\frac12\) (কারণ \(X\) uniform, আর \([-\tfrac12,\tfrac12]\)-এর দৈর্ঘ্য \(1\) = মোট দৈর্ঘ্য \(2\)-এর অর্ধেক)। তাছাড়া \(Y\)-এর density হলো \(f_Y(y)=\frac{1}{2\sqrt y}\) on \((0,1]\) — change-of-variable \(y=x^2\)-এর সরাসরি ফল; empirical histogram-density-কে এই বক্ররেখার সঙ্গে কয়েকটা বিন্দুতে মিলাই। seed বাঁধা default_rng(20260619), \(N=10^6\)।
def part4_pushforward():
banner("PART 4 : pushforward law of Y = X^2, X ~ Uniform(-1,1)")
rng = np.random.default_rng(20260619)
N = 1_000_000
X = rng.uniform(-1.0, 1.0, N) # X ~ Uniform(-1,1)
Y = X * X # Y = X^2 in [0,1]
EY = float(np.mean(Y))
P_le_quarter = float(np.mean(Y <= 0.25))
print(f" seed = np.random.default_rng(20260619)")
print(f" N = {N:,}")
print(f" X ~ Uniform(-1,1), Y = X^2\n")
print(f" MC E[Y] = {EY:.4f} true 1/3 = {1/3:.4f} "
f"abs err {abs(EY - 1/3):.6f}")
print(f" MC P(Y <= 1/4) = {P_le_quarter:.4f} true 1/2 = {0.5:.4f} "
f"abs err {abs(P_le_quarter - 0.5):.6f}\n")
# law of Y has density f_Y(y) = 1/(2 sqrt y) on (0,1]; histogram বনাম analytic
print(" empirical vs analytic density of Y, f_Y(y) = 1/(2 sqrt y):")
print(" y0 emp. density 1/(2 sqrt y0)")
print(" ----- -------------- --------------")
edges = np.linspace(0.0, 1.0, 101) # 100 bins, প্রস্থ 0.01
counts, _ = np.histogram(Y, bins=edges)
width = edges[1] - edges[0]
dens = counts / (N * width)
centers = 0.5 * (edges[:-1] + edges[1:])
for y0 in (0.04, 0.25, 0.64):
b = int(np.searchsorted(edges, y0, side="right") - 1)
analytic = 1.0 / (2.0 * np.sqrt(centers[b]))
print(f" {centers[b]:>5.3f} {dens[b]:>10.4f} {analytic:>10.4f}")
return EY, P_le_quarter
================================================================
PART 4 : pushforward law of Y = X^2, X ~ Uniform(-1,1)
================================================================
seed = np.random.default_rng(20260619)
N = 1,000,000
X ~ Uniform(-1,1), Y = X^2
MC E[Y] = 0.3335 true 1/3 = 0.3333 abs err 0.000172
MC P(Y <= 1/4) = 0.4997 true 1/2 = 0.5000 abs err 0.000292
empirical vs analytic density of Y, f_Y(y) = 1/(2 sqrt y):
y0 emp. density 1/(2 sqrt y0)
----- -------------- --------------
0.045 2.3664 2.3570
0.255 0.9955 0.9901
0.645 0.6240 0.6226
পাঠোদ্ধার। \(10^6\) নমুনায় MC \(\mathbb E[Y]=0.3335\) — analytic \(1/3=0.3333\)-এর গা-ঘেঁষা (পরম ত্রুটি \(0.00017\)), আর \(\mathbb P(Y\le\tfrac14)=0.4997\) — analytic \(0.5\)-এর প্রায় গায়ে (ত্রুটি \(0.00029\))। এটাই pushforward law-এর মূর্ত রূপ: \(X\)-এর সমান-ভর uniform বণ্টন \(Y=X^2\) চিত্রণের মধ্য দিয়ে \(\mathbb R\)-এ ঠেলে দিলে যে নতুন বণ্টন \(P_Y\) পাই, তার গড় ও CDF-মান গণনা করেও সঠিক analytic মানে ফেরে — অর্থাৎ "\(\Omega\)-তে গড়" আর "\(Y\)-জগতে গড়" একই (এটাই 7.4-এর change-of-variables/LOTUS-এর বীজ)। density-ছকে empirical মান \(2.366,\,0.996,\,0.624\) আর analytic \(\frac{1}{2\sqrt y}\)-এর \(2.357,\,0.990,\,0.623\) তিনটে বিন্দুতেই মেলে — দেখায় \(Y\)-এর law-এর ঘনত্ব ঠিক \(\frac{1}{2\sqrt y}\), \(0\)-এর কাছে অসীমাভিমুখী (কারণ \(X^2\) ছোট মানগুলোয় ভিড় জমায়)। লক্ষণীয়, \(Y\)-এর এই density কখনো আমরা হাতে integrate করিনি — Monte-Carlo স্রেফ preimage-গুনে \(P_Y\)-কেই ফিরিয়ে এনেছে, যা pushforward-এর সংজ্ঞা \(P_Y(B)=\mathbb P(X^{-1}(\{Y\in B\}))\)-এরই সংখ্যা-প্রতিচ্ছবি।
================================================================
SUMMARY OF KEY NUMBERS
================================================================
dyadic sup error at n=8 ~ 2^-8 = 0.003906
ladder monotone f_n<=f_n+1 : True
|sigma(X)| for k=2,3,4 : [4, 8, 16] (expected [4, 8, 16])
pushforward E[Y] = 0.3335 (true 1/3 = 0.3333)
pushforward P(Y<=1/4) = 0.4997 (true 1/2)
সারসংক্ষেপ¶
এই ল্যাব §৪-এর চারটে মূল উপপাদ্যকে যাচাইযোগ্য সংখ্যায় নামিয়ে আনল, এবং প্রতিটা সংখ্যাই canonically মিলেছে। §৫.১ approximation theorem-এর dyadic নির্মাণ চালিয়ে দেখাল \(\sup\lvert f-f_n\rvert\to 2^{-n}\) (\(n=8\)-এ \(0.003906\)) এবং সিঁড়িটা monotone (\(0\le f_n\uparrow f\)) — যা 7.4-এর Lebesgue integral-এর সরাসরি simple-function সেতু; বাঁকানো \(\sqrt x\)-এও একই হার দেখাল নির্মাণটা যেকোনো অঋণাত্মক measurable \(f\)-এর তলায় বসে। §৫.২ finite Ω-তে level-set-closure গুনে \(\lvert\sigma(X)\rvert=4,8,16\) (\(k=2,3,4\)) প্রতিষ্ঠা করল — \(\sigma(X)\) "\(X\)-এর তথ্য", আর তার আকার নির্ভর করে কেবল কয়টা স্তরে \(X\) পার্থক্য টের পায় তার উপর, \(X\) কী মান নেয় তার উপর নয়। §৫.৩ দেখাল closure ভাঙে না: তিনটে step-এর sup আবার step (measurable), আর continuous \(g\)-এর জন্য \(g\circ X\) আবার একটা simple RV — composition স্তর মেলাতে পারে কিন্তু বাড়ায় না (\(\sigma(g\circ X)\subseteq\sigma(X)\))। আর §৫.৪ pushforward law-কে মূর্ত করল: \(X\sim\text{Uniform}(-1,1)\) থেকে \(Y=X^2\)-এর MC \(\mathbb E[Y]=0.3335\) (সত্যি \(1/3\)) ও \(\mathbb P(Y\le\tfrac14)=0.4997\) (সত্যি \(1/2\)), এবং empirical density-র \(\frac{1}{2\sqrt y}\)-মিল — সব দেখাল "\(\Omega\)-তে ভর \(\to\) \(\mathbb R\)-এ ঠেলে \(P_X\)" সত্যিই একটা সুসংগত probability measure। মূল সংখ্যাগুলো — \(0.003906\), \([4,8,16]\), \(0.3335\), \(0.4997\) — সবই পুনরুৎপাদনযোগ্য, তাই উপরের measurability / \(\sigma(X)\) / pushforward / simple-function সেতু — চারটে স্তম্ভই সংখ্যায় দাঁড়িয়ে গেল।
৬ · ভিজ্যুয়ালাইজেশন¶
এই অধ্যায়ের চারটে মূল ধারণা — simple function-দিয়ে approximation, measurability-র preimage-সংজ্ঞা, একটা random variable-এর বহন-করা তথ্য \(\sigma(X)\), এবং pushforward বা law \(P_X\) — প্রতিটাই এমন এক অমূর্ততা বহন করে যা সমীকরণের সারিতে সহজে ধরা দেয় না, কিন্তু একটা ছবিতে হঠাৎ স্বচ্ছ হয়ে ওঠে। dyadic simple function কীভাবে নিচ থেকে একটা মসৃণ \(f\)-কে "ধাপে ধাপে" ছুঁয়ে ফেলে, measurability-র অদ্ভুত-শোনা "প্রতিটা Borel set-এর preimage \(\mathcal F\)-এ থাকতে হবে" শর্তটা জ্যামিতিকভাবে আসলে কী দাবি করছে, \(\sigma(X)\)-কে "\(X\)-এর জ্ঞাত তথ্য" বললে সেটা set-এর ভাষায় ঠিক কী রূপ নেয়, আর একটা probability measure \(X\)-এর মধ্য দিয়ে real line-এ ঠেলে দিলে কোন বণ্টন জন্ম নেয় — এই চারটে প্রশ্নই এই অংশের চারটে ছবির বিষয়।
ছবিগুলোর সব text ইংরেজিতে (matplotlib-এ বাংলা glyph tofu হয়ে যায়), তাই concept-এর ব্যাখ্যা থাকছে এই prose-এ, আর figure-এ থাকছে কেবল গাণিতিক চিহ্ন ও সংক্ষিপ্ত label। প্রতিটি ছবি curriculum-এর সাধারণ figure-style ব্যবহার করে (figstyle.set_style()), dpi=150-এ আঁকা, এবং _assets/ ফোল্ডারে সংরক্ষিত। নিচের প্রতিটি উপ-বিভাগে concept-এর সঙ্গে ছবিটার সংযোগ, তারপর তা তৈরির core code-এর একটা অংশ, এবং সবশেষে embed-করা ছবিটা দেওয়া হলো। চারটে ছবির সম্পূর্ণ script আছে _code/figs_7-3.py-তে।
৬.১ · Dyadic simple function: নিচ থেকে \(f\)-কে ছুঁয়ে ফেলা¶
প্রথম ছবিটা এই অধ্যায়ের সবচেয়ে শক্তিশালী যন্ত্রকে দৃশ্যমান করে — যে কৌশলে যেকোনো nonnegative measurable function \(f\)-কে simple function-এর একটা ঊর্ধ্বগামী sequence \(f_1\le f_2\le f_3\le\cdots\) দিয়ে আঁটঘাঁট বেঁধে ফেলা যায়, যারা বিন্দু-বিন্দুতে \(f\)-এ উঠে যায়: \(f_n\uparrow f\)। এটাই Lebesgue integral-এর সেতু: integral-কে আগে কেবল simple function-এর জন্য (level-গুলোর measure দিয়ে weighted যোগফল হিসেবে) সংজ্ঞায়িত করা হয়, তারপর monotone limit নিয়ে সাধারণ \(f\)-এ বাড়ানো হয় — আর সেই limit-এর বৈধতা পুরোপুরি দাঁড়িয়ে আছে এই approximation-এর উপর।
ছবিতে একটা মসৃণ nonnegative bump \(f\) (নীল মোটা curve) আঁকা হয়েছে \([0,1]\)-এ, আর তার নিচে তিনটে rising staircase — \(f_1,f_2,f_3\) — ক্রমশ সূক্ষ্ম হতে হতে \(f\)-কে নিচ থেকে চেপে ধরছে। এদের তৈরির recipe-টা চোখে আঙুল দিয়ে দেখায় কেন এটা domain নয়, range-কে কাটার গল্প: Riemann যেখানে \(x\)-অক্ষকে (domain) সরু পট্টিতে ভাগ করে, Lebesgue সেখানে \(y\)-অক্ষকে (range) dyadic স্তরে ভাগ করে। \(n\)-তম ধাপে range-কে \(2^n\)টা সমান টুকরোয় কাটা হয়, আর প্রতিটা \(x\)-এর জন্য \(f_n(x)\) হলো \(f(x)\)-এর ঠিক নিচের dyadic level: \(f_n(x)=k/2^n\) যখন \(k/2^n\le f(x)<(k+1)/2^n\)। এই সংজ্ঞা থেকেই তিনটে ধর্ম সঙ্গে সঙ্গে আসে — \(f_n\le f\) (সবসময় নিচের level নিচ্ছি), \(f_n\) ঊর্ধ্বগামী (\(n\) বাড়লে level সূক্ষ্ম হয়, approximation কখনো খারাপ হয় না), এবং সবচেয়ে গুরুত্বপূর্ণ error \(\le 2^{-n}\) — কারণ \(f(x)\) ও \(f_n(x)\) একই dyadic ব্যবধানে, যার প্রস্থ \(2^{-n}\)।
এই \(2^{-n}\) ত্রুটি-সীমাই ছবিটার আসল বার্তা: approximation-এর মান সর্বত্র সমান হারে ভালো হচ্ছে (uniform on the part where \(f\) is bounded), কোনো এক জায়গায় ভালো আর অন্যত্র খারাপ নয়। তাই ছবির \(y\)-অক্ষে \(1/8, 2/8,\dots\) dyadic গ্রিড আঁকা — \(f_3\)-এর প্রতিটা ধাপ ঠিক এই \(1/8\)-চওড়া স্তরে বসে, আর deep-blue staircase-টা \(f\)-এর সঙ্গে কত আঁটসাঁট তা এক নজরেই বোঝা যায়। কেন এই কৌশলে \(f_n\) স্বয়ংক্রিয়ভাবে measurable simple function হয়, তারও বীজ এখানে: প্রতিটা level set \(\{k/2^n\le f<(k+1)/2^n\}=f^{-1}\big([k/2^n,(k+1)/2^n)\big)\) একটা half-open interval-এর preimage, আর \(f\) measurable বলে এটা \(\mathcal F\)-এ — যা ঠিক পরের ছবির বিষয়।
import numpy as np
def f(x): # smooth nonneg bump on [0,1]
return 0.9 * np.sin(np.pi * x) ** 1.4
xs = np.linspace(0, 1, 1000)
ax.plot(xs, f(xs), lw=2.6, label=r"$f$ (target)") # the target curve
for n in (1, 2, 3): # dyadic simple f_1, f_2, f_3
step = 2.0 ** (-n) # slice the RANGE into 2^n levels
fn = np.floor(f(xs) / step) * step # f_n(x) = k/2^n (the level below f)
ax.step(xs, fn, where="post",
label=fr"$f_{{{n}}}$ ($2^{{{n}}}$ levels)")
ax.annotate(r"simple $f_n\uparrow f$, error $\leq 2^{-n}$", ...)
![নীল মোটা curve \(f\) (একটা মসৃণ nonnegative bump) \([0,1]\)-এ, আর তার নিচে তিনটে rising staircase \(f_1\) (হালকা), \(f_2\) (মাঝারি), \(f_3\) (গাঢ় নীল), যারা ক্রমশ সূক্ষ্ম হতে হতে \(f\)-কে নিচ থেকে ছুঁয়ে ফেলছে; \(y\)-অক্ষে \(0,\tfrac18,\tfrac28,\dots,1\) dyadic level-grid আঁকা, \(f_3\)-এর প্রতিটা ধাপ ঠিক এই \(1/8\)-চওড়া স্তরে বসে আছে। উপরে box-এ লেখা: simple \(f_n\uparrow f\), error \(\le 2^{-n}\) — অর্থাৎ range-কে dyadic level-এ কাটার এই কৌশলে simple function-গুলো একসঙ্গে monotonically এবং uniformly \(f\)-এ উঠে যায়, যা Lebesgue integral-এর সংজ্ঞার ভিত্তি।](../_assets/7-3-dyadic-approximation.png)
৬.২ · Measurability একটা pull-back শর্ত: \(X^{-1}(B)\in\mathcal F\)¶
দ্বিতীয় ছবিটা এই অধ্যায়ের সংজ্ঞাগত হৃৎপিণ্ড — measurability-র preimage-শর্তকে একটা schematic-এ দাঁড় করায়। একটা map \(X:\Omega\to\mathbb R\)-কে measurable বলা হয় তখনই, যখন প্রতিটা Borel set \(B\subseteq\mathbb R\)-এর জন্য তার preimage \(X^{-1}(B)=\{\omega:X(\omega)\in B\}\) source space-এর σ-algebra \(\mathcal F\)-এ থাকে। শর্তটা প্রথম শুনলে উল্টো-মুখী মনে হয়: \(X\) যায় \(\Omega\) থেকে \(\mathbb R\)-এ, কিন্তু measurability-র দাবি উঠছে উল্টো দিকে — target-এর set টেনে নিয়ে source-এ ফেরত আনলে সে যেন σ-algebra-র সদস্য হয়।
ছবিতে বাঁ দিকে একটা blob \(\Omega\) আঁকা (তার নিজস্ব σ-algebra \(\mathcal F\) সহ), ডান দিকে real line \(\mathbb R\), আর তাদের জুড়ছে একটা বড় তীর \(X:\Omega\to\mathbb R\)। ডান লাইনে একটা Borel interval \(B=[a,b]\) লাল রঙে চিহ্নিত। এখন measurability-র প্রশ্নটা হলো: \(B\)-কে "পিছনে টেনে" আনলে — অর্থাৎ যেসব \(\omega\)-এর \(X(\omega)\) মান \(B\)-র ভেতরে পড়ে, তাদের সংগ্রহ \(X^{-1}(B)\) — সেই সবুজ ছায়া-অঞ্চলটা কি \(\mathcal F\)-এ আছে? ছবির ভাঙা সবুজ তীরটা ঠিক এই "pull back \(B\)" ক্রিয়াটাই দেখায়, \(B\) থেকে তার preimage-এ ফিরে। caption-টা সম্পূর্ণ equivalence-টা বলে: \(X\) measurable \(\Longleftrightarrow\) \(X^{-1}(B)\in\mathcal F\) সব Borel \(B\)-র জন্য।
কেন এই preimage-সংজ্ঞা এত সুবিধাজনক, তার একটা গভীর কারণ ছবিটা ইঙ্গিত করে: preimage set-operation-গুলোর সঙ্গে নিখুঁতভাবে commute করে — \(X^{-1}(B^c)=X^{-1}(B)^c\), \(X^{-1}(\bigcup_n B_n)=\bigcup_n X^{-1}(B_n)\)। ফলে \(\{B:X^{-1}(B)\in\mathcal F\}\) নিজেই একটা σ-algebra, আর তা যদি সব open interval ধারণ করে, তবে σ-algebra-বদ্ধতার জোরে গোটা Borel \(\mathcal B(\mathbb R)\)-কেই ধারণ করে। এটাই §-এর মূল সরলীকরণ: measurability যাচাই করতে অগুনতি Borel set ঘাঁটতে হয় না — কেবল একটা generating class-এর (যেমন সব \((-\infty,a]\), বা সব open interval) preimage \(\mathcal F\)-এ আছে কিনা দেখলেই যথেষ্ট। তাই বাস্তবে \(\{X\le a\}\in\mathcal F\) সব \(a\)-র জন্য — এই একটামাত্র শর্তই পুরো measurability নিশ্চিত করে দেয়।
এই ছবিটা একই সঙ্গে একটা ভুল ধারণা ভাঙে: measurability \(X\)-এর continuity বা মসৃণতা নিয়ে কিছু বলে না, বলে কেবল \(X\) ও দুই σ-algebra-র মধ্যে সামঞ্জস্য নিয়ে। একটা ভয়ানক discontinuous function-ও measurable হতে পারে (যেমন indicator \(\mathbf 1_A\), যদি \(A\in\mathcal F\)), আবার "তথ্য" কম থাকলে অনেক function non-measurable হয়ে পড়ে। আসল কথা হলো: \(\mathcal F\) যেন \(X\)-এর প্রতিটা "প্রশ্ন" (\(X\) কি \(B\)-তে পড়ল?)-এর উত্তর ধারণ করার মতো যথেষ্ট সমৃদ্ধ হয় — measurability মানে \(X\) সেই σ-algebra-র তুলনায় "পাঠযোগ্য"। এই পাঠযোগ্যতার সূক্ষ্মতম পরিমাপই পরের ছবির বিষয়: \(X\) ঠিক কতটা তথ্য বহন করে।
from matplotlib.patches import Ellipse, Rectangle, FancyArrowPatch
ax.add_patch(Ellipse((Ocx, Ocy), Ow, Oh, facecolor=C_OUT)) # blob Omega (with F)
ax.add_patch(Ellipse((Pcx, Pcy), Pw, Ph, facecolor=C_PRE, # the preimage X^{-1}(B)
alpha=0.32)) # shaded green inside Omega
ax.add_patch(Rectangle((bL, lineY-0.16), bR-bL, 0.32, # Borel set B on the real line
facecolor=C_B))
ax.annotate("", xy=(7.3, 4.8), xytext=(4.7, 4.8)) # the map X: Omega -> R
ax.add_patch(FancyArrowPatch(..., ls="--", color=C_PRE)) # dashed "pull back B" arrow
ax.text(6.0, 0.55, r"$X$ measurable $\Longleftrightarrow$ "
r"$X^{-1}(B)\in\mathcal{F}$ for all Borel $B$") # the caption
![Schematic: বাঁয়ে একটা ধূসর blob \(\Omega\) (σ-algebra \(\mathcal F\) সহ), যার ভেতরে একটা সবুজ ছায়া-অঞ্চল \(X^{-1}(B)\); ডানে real line \(\mathbb R\), তার উপর একটা লাল Borel interval \(B=[a,b]\) চিহ্নিত; মাঝখানে বড় তীর \(X:\Omega\to\mathbb R\), আর \(B\) থেকে তার preimage-এ ফেরা একটা ভাঙা সবুজ "pull back \(B\)" তীর। নিচে box-এ caption: \(X\) measurable \(\Longleftrightarrow\) \(X^{-1}(B)\in\mathcal F\) for all Borel \(B\) — অর্থাৎ target-এর প্রতিটা Borel set পিছনে টানলে তার preimage source-এর σ-algebra-য় থাকতে হবে।](../_assets/7-3-preimage-measurability.png)
৬.৩ · \(\sigma(X)\): একটা random variable-এর বহন-করা তথ্য¶
তৃতীয় ছবিটা probability-র সবচেয়ে সূক্ষ্ম ধারণাগুলোর একটাকে concrete করে — একটা random variable \(X\)-এর generated σ-algebra \(\sigma(X)\)-কে "\(X\)-এর জ্ঞাত তথ্য" হিসেবে পড়া। বিমূর্ত সংজ্ঞায় \(\sigma(X)\) হলো সবচেয়ে ছোট σ-algebra যার সাপেক্ষে \(X\) measurable, অর্থাৎ \(\sigma(X)=\{X^{-1}(B):B\in\mathcal B(\mathbb R)\}\)। কিন্তু \(X\) যখন একটা simple function — কেবল কয়েকটা মান \(a_1,\dots,a_k\) নেয় — তখন এই বিমূর্ত বস্তুটা একটা চমৎকার সসীম, গোনা-যায় এমন রূপ পায়, আর ছবিটা ঠিক সেটাই দেখায়।
বাঁ panel-এ \(X\) গোটা \(\Omega\)-কে \(k=3\)টা level set বা atom-এ ভাগ করছে: \(\{X=a_1\}\), \(\{X=a_2\}\), \(\{X=a_3\}\) — এমন তিনটে পরস্পর-বিচ্ছিন্ন টুকরো, যাদের প্রত্যেকটার উপর \(X\) একটামাত্র ধ্রুব মান নেয়। এই atom-গুলোই \(X\)-এর "দৃষ্টির রেজোলিউশন": একই atom-এর দুটো বিন্দু \(X\)-এর চোখে অভিন্ন, কারণ \(X\) তাদের একই মান দেয়। ডান panel-এ দেখানো হয়েছে \(\sigma(X)\) আসলে কী — এই atom-গুলোর সব সম্ভাব্য union: খালি union (∅) থেকে শুরু করে একক atom, atom-জোড়া, এবং সব atom মিলে \(\Omega\) পর্যন্ত। \(k=3\) atom-এর জন্য তাই ঠিক \(2^3=8\)টা set, প্রতিটা set-এর একটা "atom নেব/নেব না" সিদ্ধান্ত-সমষ্টির সঙ্গে এক-এক সম্পর্কে।
"\(\sigma(X)\) = তথ্য" রূপকটা এই ছবিতে নিখুঁতভাবে ফুটে ওঠে। \(\sigma(X)\)-এর একটা set জানা মানে \(X\)-এর মান পর্যবেক্ষণ করে যে প্রশ্নের উত্তর দেওয়া যায়, তা জানা। যদি কেউ আমাদের \(X(\omega)\)-এর মান বলে দেয়, আমরা ঠিক বলতে পারব \(\omega\) কোন atom-এ — কিন্তু atom-এর ভেতরে কোথায়, তা পারব না। তাই \(\sigma(X)\) ঠিক সেই event-গুলোর সংগ্রহ যাদের ঘটা-না-ঘটা \(X\)-এর মান থেকে নিশ্চিতভাবে নির্ণয় করা যায়। কম atom (মোটা partition) মানে \(X\) কম তথ্য বহন করে, \(\sigma(X)\) ছোট; বেশি atom (সূক্ষ্ম partition) মানে বেশি তথ্য, \(\sigma(X)\) বড়। চরম দুই প্রান্ত শিক্ষণীয়: \(X\) ধ্রুবক হলে atom একটাই (\(\Omega\) নিজেই), \(\sigma(X)=\{\varnothing,\Omega\}\) — কোনো তথ্য নেই; আর \(X\) injective হলে প্রতিটা বিন্দু আলাদা atom, \(\sigma(X)\) পুরো power set-এর সমান — সর্বোচ্চ তথ্য।
এই information-as-σ-algebra ভাষাটাই Part VII-এর বাকি অংশের মেরুদণ্ড। Conditional expectation \(\mathbb E[Y\mid X]\) মানে \(Y\)-এর সেরা অনুমান যা কেবল \(\sigma(X)\)-এর তথ্য ব্যবহার করে — আর সেটা সবসময় প্রতিটা atom-এর উপর ধ্রুবক একটা function (atom-এর ভেতরের গড়)। Filtration \(\mathcal F_1\subseteq\mathcal F_2\subseteq\cdots\) মানে সময়ের সঙ্গে atom-গুলো সূক্ষ্ম হতে থাকা, তথ্য জমতে থাকা। তাই এই সরল তিন-atom ছবিটা আসলে martingale, Markov property, ও তথ্য-প্রবাহের পুরো তত্ত্বের বীজ-চিত্র — যেখানে "জানা" আর "একটা σ-algebra-measurable হওয়া" সমার্থক হয়ে যায়।
from matplotlib.patches import Rectangle, FancyBboxPatch
bounds = [0.4, 3.6, 6.7, 9.6] # LEFT: three atoms of a simple X
for i in range(3): # {X=a_1}, {X=a_2}, {X=a_3}
ax.add_patch(Rectangle((bounds[i], 0.4),
bounds[i+1]-bounds[i], 7.6, facecolor=ATOM_COLORS[i]))
ax.text(..., r"$\{X=a_%d\}$" % (i+1)) # X is constant (= a_i) on each atom
members = ["∅", "{X=a1}", ..., "Omega"] # RIGHT: sigma(X) = ALL unions of atoms
for m in members: # 2^k = 8 sets for k = 3 atoms
ax.add_patch(FancyBboxPatch(...)); ax.text(..., m)
ax.text(..., r"$\sigma(X)=$ information in $X$ ($2^{k}$ sets for $k$ atoms)")

৬.৪ · Pushforward / law: \(P_X(B)=\mathbb P(X\in B)\)¶
চতুর্থ ছবিটা এই অধ্যায়ের গন্তব্য — একটা random variable-কে কীভাবে তার law বা distribution \(P_X\)-এ রূপান্তর করা হয় — তাকে একসঙ্গে schematic ও বাস্তব data দিয়ে দেখায়। ধারণাটা হলো pushforward: source space-এ একটা probability measure \(\mathbb P\) আছে, আর measurable map \(X\) সেই measure-কে real line-এ "ঠেলে দেয়", জন্ম দেয় \(\mathbb R\)-এর উপর একটা নতুন measure \(P_X\), যার সংজ্ঞা \(P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)\)। এই একটা সংজ্ঞাই গোটা probability-র "ভাষা পরিবর্তন": মূল space \((\Omega,\mathcal F,\mathbb P)\) যত জটিল বা বিমূর্তই হোক, \(X\)-সংক্রান্ত সব probability-প্রশ্নের উত্তর এখন real line-এর উপর একটামাত্র measure \(P_X\) থেকে পাওয়া যায় — distribution-ই হয়ে ওঠে \(X\)-এর সম্পূর্ণ probabilistic পরিচয়।
বাঁ panel-এ এই pushforward-ক্রিয়াটা schematically আঁকা: blob \((\Omega,\mathcal F,\mathbb P)\) থেকে measure \(\mathbb P\), একটা তীর \(X\) বেয়ে নেমে real line-এ, আর সেখানে জন্ম-নেওয়া law \(P_X\) (লাল)। নিচের box-এ মূল সংজ্ঞাটা: \(P_X(B)=\mathbb P(X\in B)\) — অর্থাৎ "\(X\) set \(B\)-তে পড়ার সম্ভাবনা"-ই হলো \(B\)-তে pushforward measure-এর ভর। ডান panel-এ এই বিমূর্ত ধারণাটা একটা concrete উদাহরণে ধরা: \(X\sim\text{Uniform}(-1,1)\) নিয়ে \(Y=X^2\) গঠন করা হয়েছে, এবং বড় sample (\(N=400{,}000\), seed default_rng(20260619)) থেকে \(Y\)-এর histogram আঁকা হয়েছে, তার উপর analytic density \(p_Y(y)=\frac{1}{2\sqrt y}\) (লাল curve) চাপানো হয়েছে \((0,1)\)-এ।
কেন density-টা ঠিক \(\frac{1}{2\sqrt y}\), সেটাই pushforward-এর গণিত। \(X\) uniform on \((-1,1)\) হলে তার density \(\tfrac12\) on \([-1,1]\)। \(Y=X^2\)-এর CDF বের করতে: \(0<y<1\)-এর জন্য \(\mathbb P(Y\le y)=\mathbb P(-\sqrt y\le X\le\sqrt y)=\tfrac12\cdot 2\sqrt y=\sqrt y\)। density হলো এর derivative, \(p_Y(y)=\frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y}\)। লক্ষণীয় ব্যাপার — \(y\to 0^+\)-এ density অসীমে ছুটে যায়, কারণ uniform \(X\)-এর ভর শূন্যের কাছে ঘন হয়ে জমে (\(X\approx 0\)-এর ছোট ব্যবধান \(Y\)-এর আরও ছোট ব্যবধানে চাপা পড়ে); আর \(y\to 1\)-এ density সমতল \(\tfrac12\)-এর দিকে নামে। ছবির histogram এই দুই আচরণই নিখুঁতভাবে অনুসরণ করছে — বাঁ প্রান্তে আকাশছোঁয়া, ডান প্রান্তে চাপা — যা analytic curve-এর সঙ্গে প্রায় হুবহু মিলে যায়।
এই simulation একটা গভীর সত্য চোখে দেখায়: law \(P_X\) সম্পূর্ণভাবে \(X\)-এর "আকৃতি"-নির্ধারিত, source space-এর কোনো বিবরণ আর লাগে না। দুটো একদম আলাদা probability space-এ সংজ্ঞায়িত দুটো random variable-এর law এক হতে পারে — তখন distribution-গত সব প্রশ্নে তারা অভিন্ন (equal in distribution), যদিও pointwise তারা সম্পূর্ণ ভিন্ন। histogram-এর analytic curve-এর সঙ্গে এই নিবিড় মিল সেটাই ব্যবহারিকভাবে যাচাই করে: \(400{,}000\)টা নমুনার empirical বণ্টন প্রায় হুবহু \(\frac{1}{2\sqrt y}\)-তে বসে যাচ্ছে (যাচাইযোগ্য সংখ্যায় empirical \(\mathbb E[Y]\approx 0.3335\), যা analytic \(\int_0^1 y\cdot\tfrac{1}{2\sqrt y}\,dy=\tfrac13\)-এর সঙ্গে মেলে), কারণ law-ই বণ্টনের একমাত্র সত্য, আর simulation কেবল সেই law থেকে নমুনা টানছে। এই pushforward-নীতিই পরে CDF, density, ও সব distribution-উপপাদ্যকে একই measure-theoretic ভিত্তিতে দাঁড় করায়।
import numpy as np
rng = np.random.default_rng(20260619) # fixed seed for reproducibility
X = rng.uniform(-1.0, 1.0, size=400_000) # X ~ Uniform(-1, 1)
Y = X ** 2 # the pushforward target Y = X^2
ax.hist(Y, bins=np.linspace(0, 1, 61), # empirical law of Y (the histogram)
density=True, label=r"empirical $Y=X^{2}$")
yy = np.linspace(1e-3, 1.0, 800)
ax.plot(yy, 1.0 / (2.0 * np.sqrt(yy)), # analytic density p_Y(y) = 1/(2 sqrt y)
label=r"$p_Y(y)=\dfrac{1}{2\sqrt{y}}$")
# caption (left schematic): P_X(B) = P(X in B) -- the law

৭ · অনুশীলনী¶
প্রতিটি প্রশ্নে difficulty tag (★ সহজ · ★★ মাঝারি · ★★★ চ্যালেঞ্জিং) ও একটি Hint: আছে। পূর্ণ সমাধান _solutions/07-03-measurable-maps-random-variables-solutions.md-এ। চেষ্টা না করে সমাধান দেখবেন না — নিজে হোঁচট খেয়ে তারপর মিলিয়ে নেওয়াটাই শেখার আসল অংশ। প্রশ্নগুলো চার দলে — ক ধারণাগত, খ গণনামূলক, গ প্রমাণভিত্তিক, ঘ কোডিং।
ক · ধারণাগত¶
প্রশ্ন ১ (★). "একটা ফাংশন \(X:\Omega\to\mathbb R\) measurable হওয়ার অর্থ — তার সম্পর্কে তোলা ঘটনাগুলোর probability থাকে" — এই বাক্যটি এক অনুচ্ছেদে ব্যাখ্যা করুন। বিশেষত দেখান কেন measurability ঠিক সেই শর্ত যা "\(\mathbb P(X\le x)\)" বা "\(\mathbb P(X\in B)\)"-কে অর্থবহ করে, এবং একটা non-measurable \(X\)-এর জন্য কোন বাক্যটা ভেঙে যায়। (এক লাইনে বলুন: probability measure \(\mathbb P\) কোথায় সংজ্ঞায়িত, আর তার সঙ্গে \(X^{-1}(B)\)-এর সম্পর্ক কী।) Hint: \(\mathbb P\) কেবল \(\mathcal F\)-এর সদস্যদের (ঘটনা) উপর সংজ্ঞায়িত। "\(X\in B\)" আসলে set \(\{X\in B\}=X^{-1}(B)\); তাই \(\mathbb P(X\in B)\) লিখতে হলে আগে \(X^{-1}(B)\in\mathcal F\) লাগবে — measurability হলো "সব Borel \(B\)-র জন্য \(X^{-1}(B)\in\mathcal F\)"। কোনো Borel \(B\)-র preimage \(\mathcal F\)-এ না থাকলে \(\mathbb P(X\in B)\) বাক্যটাই অর্থহীন।
প্রশ্ন ২ (★). "\(\sigma(X)\) ধরে \(X\)-এর মধ্যেকার তথ্য (information)" — এই কথাটার মানে কী, ব্যাখ্যা করুন। \(X\) পর্যবেক্ষণ করার পর কোন প্রশ্নগুলোর উত্তর জানা যায় আর কোনগুলোর যায় না — এটা \(\sigma(X)\)-এর সদস্যপদের সঙ্গে কীভাবে মেলে? একটা constant random variable \(X\equiv c\) আর একটা injective (এক-এক) \(X\)-এর \(\sigma(X)\) তুলনা করে চরম দুই প্রান্ত দেখান। Hint: \(\sigma(X)=X^{-1}(\mathcal B)=\{X^{-1}(B):B\in\mathcal B\}\) = \(X\)-কে measurable করা সবচেয়ে ছোট σ-algebra। একটা ঘটনা \(A\in\sigma(X)\) মানে "\(X\)-এর মান জানলেই \(A\) ঘটেছে কি না বলা যায়"। \(X\equiv c\) কিছুই আলাদা করে না, তাই \(\sigma(X)=\{\varnothing,\Omega\}\) (সর্বনিম্ন তথ্য); \(X\) injective হলে প্রতিটি \(\omega\) আলাদা মান পায়, তাই \(\sigma(X)\) সম্পূর্ণ \(\mathcal F\) পর্যন্ত পৌঁছাতে পারে (সর্বোচ্চ তথ্য)।
প্রশ্ন ৩ (★). এক লাইনে (কিন্তু সঠিক যুক্তিতে) ব্যাখ্যা করুন কেন measurable ফাংশনদের একটা ক্রমের \(\sup_n X_n\) এবং \(\limsup_n X_n\) আবার measurable থাকে। key সূত্রটা কী, এবং কেন সেখানে শুধু গণনাযোগ্য union/intersection লাগে (তাই σ-algebra-র অস্ত্রই যথেষ্ট)? Hint: মূল identity: \(\{\sup_n X_n\le x\}=\bigcap_n\{X_n\le x\}\) — ডান পাশ গণনাযোগ্য intersection of events, তাই \(\in\mathcal F\); এতে \(\sup_n X_n\) measurable। আর \(\limsup_n X_n=\inf_m\sup_{n\ge m}X_n\) — sup/inf-এর গণনাযোগ্য রচনা, তাই বদ্ধতা টিকে থাকে। σ-algebra ঠিক গণনাযোগ্য operation-এ বদ্ধ বলেই এটা কাজ করে।
খ · গণনামূলক¶
প্রশ্ন ৪ (★). \(\Omega=\{1,2,3,4,5,6\}\) (একটা ছক্কা), \(\mathbb P\) uniform। একটা simple random variable \(X\) নিন যা তিনটি মান ধরে — level set \(A_1=X^{-1}(\{0\})=\{1,2\}\), \(A_2=X^{-1}(\{1\})=\{3,4\}\), \(A_3=X^{-1}(\{5\})=\{5,6\}\) (অর্থাৎ \(X=0,1,5\) যথাক্রমে)। \(\sigma(X)\)-এর সব উপাদান হাতে লিখে তালিকা করুন এবং মোট সংখ্যা গুনুন। দেখান \(\sigma(X)\) ঠিক তিন atom \(A_1,A_2,A_3\) দিয়ে গড়া, এবং ব্যাখ্যা করুন কেন \(k\)টি ভিন্ন মানের simple \(X\)-এর \(\sigma(X)\)-এর আকার ঠিক \(2^k\)। (\(k=2,3,4\)-এর জন্য আকার লিখুন।) Hint: \(X\)-এর atom-গুলো হলো তার level set \(A_i=X^{-1}(\{a_i\})\); \(\sigma(X)\) হলো এদের সব union, তাই \(k\) atom-এ \(2^k\) সদস্য। এখানে \(k=3\), তাই \(\lvert\sigma(X)\rvert=2^3=8\) — অর্থাৎ \(\varnothing,A_1,A_2,A_3,A_1\cup A_2,A_1\cup A_3,A_2\cup A_3,\Omega\)। সাধারণভাবে \(k=2,3,4\to 4,8,16\)।
প্রশ্ন ৫ (★★). \(X\sim U(-1,1)\) (Uniform on \((-1,1)\), density \(\tfrac12\) on \((-1,1)\)) এবং \(Y=g(X)=X^2\)। (ক) \(Y\)-এর support কী, এবং CDF \(F_Y(y)=\mathbb P(Y\le y)\) বের করুন \(0\le y\le 1\)-এর জন্য (পথে \(\{X^2\le y\}=\{-\sqrt y\le X\le\sqrt y\}\) ব্যবহার করুন)। (খ) তা differentiate করে density \(f_Y(y)\) বের করুন। (গ) \(\mathbb E[Y]\) এবং \(\mathbb P(Y\le\tfrac14)\) গণনা করুন। (সংখ্যাগুলো মনে রাখার মতো সরল।) Hint: \(F_Y(y)=\mathbb P(-\sqrt y\le X\le\sqrt y)=\tfrac12\cdot 2\sqrt y=\sqrt y\), তাই \(f_Y(y)=F_Y'(y)=\dfrac{1}{2\sqrt y}\) (\(0<y<1\))। \(\mathbb E[Y]=\mathbb E[X^2]=\int_{-1}^{1}x^2\cdot\tfrac12\,dx=\tfrac13\); আর \(\mathbb P(Y\le\tfrac14)=\sqrt{\tfrac14}=\tfrac12\)।
প্রশ্ন ৬ (★). dyadic approximation-এ \(n\)-তম ধাপের সর্বোচ্চ approximation-error হলো \(2^{-n}\) (অর্থাৎ যেখানে \(f\) bounded ও \(f_n\uparrow f\), সেখানে \(0\le f-f_n\le 2^{-n}\))। \(n=1,2,3,4\)-এর জন্য \(2^{-n}\) মান একটা টেবিলে লিখুন এবং দেখান প্রতিধাপে error ঠিক অর্ধেক হচ্ছে, তাই \(n\to\infty\)-এ \(f_n\to f\)। (\(n\) এক বাড়লে error-অনুপাত কত?) Hint: \(2^{-1}=0.5\), \(2^{-2}=0.25\), \(2^{-3}=0.125\), \(2^{-4}=0.0625\)। প্রতিধাপে \(2^{-(n+1)}/2^{-n}=\tfrac12\) — error geometric ভাবে \(\tfrac12\) হারে নামে, তাই \(\to 0\)। dyadic সিঁড়ির ধাপ-উচ্চতা \(2^{-n}\) বলেই সর্বোচ্চ ফাঁক \(2^{-n}\)।
গ · প্রমাণভিত্তিক¶
প্রশ্ন ৭ (★★). একটা ফাংশন \(X:\Omega\to\mathbb R\) (\((\Omega,\mathcal F)\) থেকে \((\mathbb R,\mathcal B)\)-তে) দেওয়া। good-sets / check-on-generator যুক্তি ব্যবহার করে প্রমাণ করুন: $$ X \text{ random variable (measurable)} \iff {X\le x}\in\mathcal F \ \ \forall x\in\mathbb R. $$ অর্থাৎ পুরো Borel \(\mathcal B\)-তে পরীক্ষা না করে শুধু generator \(\{(-\infty,x]:x\in\mathbb R\}\)-এ preimage যাচাই করাই যথেষ্ট। প্রতিটি দিক স্পষ্টভাবে দেখান। Hint: (\(\Rightarrow\)) সহজ — \((-\infty,x]\in\mathcal B\), তাই measurable \(X\)-এ \(X^{-1}((-\infty,x])=\{X\le x\}\in\mathcal F\)। (\(\Leftarrow\)) good-sets: \(\mathcal D=\{B\subseteq\mathbb R:X^{-1}(B)\in\mathcal F\}\) ধরুন; preimage union/complement/intersection সংরক্ষণ করে বলে \(\mathcal D\) একটা σ-algebra। ধরে নেওয়া শর্ত মানে \((-\infty,x]\in\mathcal D\ \forall x\), তাই \(\mathcal G=\{(-\infty,x]\}\subseteq\mathcal D\), ফলে \(\mathcal B=\sigma(\mathcal G)\subseteq\mathcal D\) — অর্থাৎ সব Borel \(B\)-র preimage \(\in\mathcal F\)।
প্রশ্ন ৮ (★★). \(X,Y:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) দুটি random variable। প্রমাণ করুন \(\max(X,Y)\) (যার মান প্রতিটি \(\omega\)-তে \(\max\{X(\omega),Y(\omega)\}\)) আবার একটা random variable। এক লাইনে যোগ করুন কীভাবে একই যুক্তি \(\min(X,Y)\)-তেও খাটে। Hint: generator-এ পরীক্ষা যথেষ্ট (প্রশ্ন ৭)। লক্ষ করুন \(\{\max(X,Y)\le x\}=\{X\le x\}\cap\{Y\le x\}\) — কারণ দুটোর সর্বোচ্চ \(\le x\) হওয়া মানে দুটোই \(\le x\)। ডান পাশ দুই event-এর intersection, তাই \(\in\mathcal F\); সব \(x\)-এ তাই, তাই \(\max(X,Y)\) measurable। \(\min\)-এর জন্য \(\{\min(X,Y)\ge x\}=\{X\ge x\}\cap\{Y\ge x\}\) (বা \(\min(X,Y)=-\max(-X,-Y)\))।
প্রশ্ন ৯ (★★★). অঋণাত্মক measurable \(f\ge 0\)-এর জন্য approximation theorem-এর dyadic নির্মাণ: $$ f_n(\omega)=\sum_{k=0}^{n2^n-1}\frac{k}{2^n}\,\mathbf 1_{{k/2^n\le f<(k+1)/2^n}}(\omega)\;+\;n\,\mathbf 1_{{f\ge n}}(\omega). $$ প্রমাণ করুন এই ক্রম monotone increasing, অর্থাৎ \(f_n(\omega)\le f_{n+1}(\omega)\) প্রতিটি \(\omega\)-তে। (অর্থাৎ সিঁড়ি কখনো নামে না, শুধু সূক্ষ্মতর হয়।) Hint: মূল কথা — \(n\) থেকে \(n+1\)-এ গেলে প্রতিটি dyadic ব্যবধান \([\tfrac{k}{2^n},\tfrac{k+1}{2^n})\) ঠিক দুই অর্ধে ভাগ হয় \([\tfrac{2k}{2^{n+1}},\tfrac{2k+1}{2^{n+1}})\) ও \([\tfrac{2k+1}{2^{n+1}},\tfrac{2k+2}{2^{n+1}})\), আর \(f_{n+1}\)-এর floor-মান বাঁ-প্রান্ত ব্যবহার করে \(\ge f_n\)-এর মান দেয়; আবার range-ও \(n\to n+1\) পর্যন্ত প্রসারিত হয়। যেখানে \(f\ge n\) ছিল সেখানে নতুন ধাপে হয় floor-মান \(\ge n\), নয় \(f\ge n+1\) হলে \(n+1\ge n\) — সব ক্ষেত্রে \(f_{n+1}\ge f_n\)।
ঘ · কোডিং¶
প্রশ্ন ১০ (★). একটা \(\sigma(X)\) closure-builder লিখুন: input একটা সসীম \(\Omega\) আর \(X\)-এর level set-গুলো (অর্থাৎ \(X\)-এর atom-পরিবার, একটা partition); output হলো \(\sigma(X)\) — atom-গুলোর সব সম্ভাব্য union (\(\varnothing,\Omega\) সহ)। দিয়ে যাচাই করুন: ২টি atom → আকার ৪, ৩টি atom → আকার ৮, ৪টি atom → আকার ১৬ — অর্থাৎ \(k\) atom-এ ঠিক \(2^k\)।
Hint: atom-গুলোকে list-of-frozenset হিসেবে নিন; তারপর itertools দিয়ে সব subset-of-atoms-এর union গড়ুন (একটা subset-of-atoms ↔ একটা σ(X)-সদস্য, তাই মোট \(2^k\)টি)। চাইলে complement+pairwise-union closure লুপও চলবে — দুই পথেই একই উত্তর।
প্রশ্ন ১১ (★★). \(X\sim U(-1,1)\), \(Y=X^2\)-এর law-টা Monte-Carlo-তে যাচাই করুন। default_rng(20260619), \(N=10^6\) নিয়ে (ক) \(\mathbb E[Y]\)-এর আনুমান বের করে analytic \(\tfrac13\)-এর সঙ্গে মিলিয়ে দেখুন; (খ) \(\mathbb P(Y\le\tfrac14)\)-এর আনুমান বের করে analytic \(\tfrac12\)-এর সঙ্গে মিলান; (গ) \(Y\)-এর histogram-কে analytic density \(\dfrac{1}{2\sqrt y}\)-এর সঙ্গে চোখে মিলিয়ে দেখুন। (প্রত্যাশিত আনুমান \(\approx 0.3335\) ও \(0.4997\)।)
Hint: x = rng.uniform(-1, 1, N); y = x**2; তারপর y.mean() (\(\to 0.3335\)) আর (y <= 0.25).mean() (\(\to 0.4997\))। density-তুলনায় plt.hist(y, bins=100, density=True)-এর উপর f = lambda yy: 1/(2*np.sqrt(yy)) plot করুন (যেখানে \(y\to 0\)-এ density \(\to\infty\), তাই বাঁ-প্রান্ত খুব খাড়া)।
প্রশ্ন ১২ (★★). approximation theorem-এর dyadic \(f_n\) implement করুন এবং error \(\to 2^{-n}\) দেখান। একটা bounded \(f\) নিন (যেমন \(f(t)=t\) on \([0,1]\)); \(f_n(t)=\min\!\big(n,\ \lfloor 2^n f(t)\rfloor/2^n\big)\) গড়ে \(n=1,2,3,4\)-এর জন্য সর্বোচ্চ error \(\sup_t\big(f(t)-f_n(t)\big)\) মাপুন এবং দেখান তা ঠিক \(2^{-n}\) (\(=0.5,0.25,0.125,0.0625\)), প্রতিধাপে অর্ধেক।
Hint: def f_n(f, t, n): return np.minimum(n, np.floor((2**n)*f(t))/2**n); এরপর ঘন grid t = np.linspace(0,1,2_000_001)-এ err = np.max(f(t) - f_n(f, t, n)) ছাপান। প্রতিটি \(n\)-এ err ≈ \(2^{-n}\) পাবেন; অনুপাত \(\tfrac12\) দেখাতে পরপর দুই error-এর ভাগফল দিন।
৮ · সারসংক্ষেপ ও সংযোগ¶
মূল পয়েন্ট (recap):
- Random variable = measurable function। একটা random variable কোনো রহস্যময় বস্তু নয় — সে একটা ফাংশন \(X:\Omega\to\mathbb R\) যা \((\Omega,\mathcal F)\) থেকে \((\mathbb R,\mathcal B)\)-তে measurable: সব Borel \(B\)-র জন্য \(X^{-1}(B)=\{X\in B\}\in\mathcal F\)। এই শর্তই "\(\mathbb P(X\le x)\)" বা "\(\mathbb P(X\in B)\)"-কে অর্থবহ করে, কারণ \(\mathbb P\) কেবল ঘটনায় (∈ \(\mathcal F\)) সংজ্ঞায়িত। আর সংজ্ঞাটা যাচাই করা সহজ — check-on-generator (good-sets / সুসেট-নীতি): পুরো \(\mathcal B\) নয়, শুধু \(\{(-\infty,x]\}\)-এ preimage \(\mathcal F\)-এ থাকলেই \(X\) measurable, কারণ \(\{B:X^{-1}(B)\in\mathcal F\}\) নিজেই একটা σ-algebra। এর সরাসরি ফল continuous ⇒ Borel, এবং closure: measurable-দের \(f+g,\,fg,\,\max,\min,\,\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n\) ও composition \(g\circ X\) (\(g\) Borel) আবার measurable।
- \(\sigma(X)\) = "\(X\)-এর মধ্যে কতটা তথ্য"। generated σ-algebra \(\sigma(X)=X^{-1}(\mathcal B)\) = \(X\)-কে measurable করা সবচেয়ে ছোট σ-algebra = "\(X\) পর্যবেক্ষণ করলে যেসব প্রশ্নের উত্তর জানা যায়" তাদের পরিবার। চরম দুই প্রান্ত: \(X\equiv c\) দিলে \(\sigma(X)=\{\varnothing,\Omega\}\) (তথ্য শূন্য), \(X\) injective দিলে \(\sigma(X)\) পুরো \(\mathcal F\) পর্যন্ত। simple \(X\)-এর ক্ষেত্রে \(k\)টি ভিন্ন মান (= \(k\) atom) দিলে \(\lvert\sigma(X)\rvert=2^k\) (\(k=2,3,4\to 4,8,16\))। এই "σ-algebra = তথ্য" ছবিই conditioning (7.7) ও filtration (7.8)-এর বীজ।
- Pushforward law ও CDF — বণ্টন rigorous। \(X\) তার মাধ্যমে \(\Omega\)-র ভর \(\mathbb P\)-কে \(\mathbb R\)-এ ঠেলে দেয় (push forward), তৈরি হয় \((\mathbb R,\mathcal B)\)-এর উপর একটা probability measure — \(X\)-এর law \(P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)\); আর \(F_X(x)=P_X((-\infty,x])\), এবং π–λ (7.2) দিয়ে CDF একাই law-কে সম্পূর্ণ pin করে। উদাহরণ \(X\sim U(-1,1),\,Y=X^2\): density \(\dfrac{1}{2\sqrt y}\) (\(0<y<1\)), \(\mathbb E[Y]=\tfrac13\), \(\mathbb P(Y\le\tfrac14)=\tfrac12\) (Monte-Carlo: \(0.3335\), \(0.4997\); seed
default_rng(20260619), \(N=10^6\))। - Simple function ও approximation — integration-এর সেতু। simple function \(s=\sum_{i=1}^n a_i\mathbf 1_{A_i}\); আর approximation theorem: প্রতিটি অঋণাত্মক measurable \(f\ge 0\) হলো simple function-দের একটা ক্রমবর্ধমান point-wise limit (\(0\le f_n\uparrow f\), dyadic সিঁড়ি, সর্বোচ্চ error \(2^{-n}\) — \(n=1,2,3,4\to 0.5,0.25,0.125,0.0625\)), সাধারণ \(f=f^+-f^-\)। এটাই 7.4-এর Lebesgue integral-এর সরাসরি প্রবেশদ্বার; সঙ্গে a.e. (almost everywhere, প্রায়-সর্বত্র) সমতা — null set বাদ দিয়ে সমান হলে integration-এর চোখে সমান।
মূল সংজ্ঞা/তথ্য (এক নজরে):
| বস্তু | সংজ্ঞা/তথ্য |
|---|---|
| measurable map | \(f:(\Omega,\mathcal F)\to(E,\mathcal E)\) measurable iff \(f^{-1}(B)\in\mathcal F\ \forall B\in\mathcal E\) |
| random variable | \(X:(\Omega,\mathcal F)\to(\mathbb R,\mathcal B)\) measurable; \(\{X\in B\}=X^{-1}(B)\) |
| check-on-generator | \(X\) RV iff \(\{X\le x\}\in\mathcal F\ \forall x\) (good-sets: \(\{B:X^{-1}(B)\in\mathcal F\}\) σ-algebra) |
| \(\sigma(X)\) (তথ্য) | \(\sigma(X)=X^{-1}(\mathcal B)\) = \(X\)-কে measurable করা smallest σ-algebra; simple \(X\), \(k\) মান \(\Rightarrow\lvert\sigma(X)\rvert=2^k\) |
| closure | \(f+g,\,fg,\,\max,\min,\,\sup_n,\inf_n,\limsup_n,\liminf_n,\lim_n,\ g\circ X\) (\(g\) Borel) সব measurable |
| pushforward / law | \(P_X(B)=\mathbb P(X^{-1}(B))=\mathbb P(X\in B)\) — \((\mathbb R,\mathcal B)\)-এর উপর probability measure |
| CDF ⟺ law | \(F_X(x)=P_X((-\infty,x])\); π–λ দিয়ে CDF law-কে সম্পূর্ণ নির্ধারণ করে |
| simple function | \(s=\sum_{i=1}^n a_i\mathbf 1_{A_i}\) (\(a_i\in\mathbb R,\ A_i\in\mathcal F\)) |
| approximation theorem | \(f\ge 0\) measurable \(\Rightarrow\exists\) simple \(0\le f_n\uparrow f\) (dyadic, error \(\le 2^{-n}\)); সাধারণ \(f=f^+-f^-\) |
| canonical সংখ্যা | dyadic \(2^{-n}\) (\(0.5,0.25,0.125,0.0625\)); \(\lvert\sigma(X)\rvert=2^k\) (\(4,8,16\)); \(Y=X^2\): \(\tfrac{1}{2\sqrt y},\ \mathbb E=\tfrac13,\ \mathbb P(Y\le\tfrac14)=\tfrac12\); MC \(0.3335/0.4997\) |
পূর্ববর্তী সংযোগ:
- ← 7.2 (σ-Algebra, Measure ও Extension): এই অধ্যায়ের সরাসরি ভিত্তি। measurable map-এর সংজ্ঞা \(\mathcal F\)-এর উপর দাঁড়ায়; check-on-generator-এর বৈধতা Borel-এর generator-রূপ \(\mathcal B=\sigma((-\infty,x])\)-এর উপর; আর pushforward law-এর well-defined হওয়া ও law⟺CDF correspondence সরাসরি π–λ uniqueness-এর উপর — π-system-এ মিললেই দুই measure সর্বত্র মেলে।
- ← 7.1 (Why Measure Theory?): Dirichlet function \(\mathbf 1_{\mathbb Q}\) — Riemann-integrable নয় অথচ measurable — এখানে measurability-র উদারতা দেখানোর কেন্দ্রীয় উদাহরণ; আর 7.1-এর "measure zero" / null set-স্বজ্ঞা এখানে a.e.-সমতার ভিত্তি।
- ← 2.3 / 2.4 (RV স্বজ্ঞাগত; CDF/density): 2.3-এর অনানুষ্ঠানিক "\(X\) মানে ফলাফলকে সংখ্যায় অনুবাদ" আর 2.4-এর \(F_X(x)=\mathbb P(X\le x)\) এখানে rigorous রূপ পায় — \(X:\Omega\to\mathbb R\) measurable, এবং \(F_X(x)=P_X((-\infty,x])\) pushforward law-এর সঙ্গে বাঁধা।
- ← 3.2 (a.e. / প্রায়-সর্বত্র): "প্রায় নিশ্চিতভাবে" ধারণাটাই এখানে measure-তাত্ত্বিক a.e. সমতা (\(X=Y\) except a null set) হিসেবে আনুষ্ঠানিক হয়।
পরবর্তী সংযোগ:
- → 7.4 (Lebesgue integral): approximation theorem-এর \(0\le f_n\uparrow f\) ঠিক এখানে কাজে লাগে — Lebesgue integral সংজ্ঞায়িত হয় simple function থেকে শুরু করে \(\int f\,d\mu=\lim\int f_n\,d\mu\) রূপে, তারপর MCT/Fatou/DCT।
- → 7.7 (Conditional expectation): "\(\sigma(X)\) = তথ্য" ছবিই এখানে \(\mathbb E[Y\mid X]=\mathbb E[Y\mid\sigma(X)]\) — "\(X\) জানা থাকলে \(Y\)-এর সেরা অনুমান" — রূপে পরিণত হয়।
- → 7.8 (Filtration ও martingale): একটা random variable-এর \(\sigma(X)\) থেকে সময়ের সঙ্গে বেড়ে চলা তথ্যের শৃঙ্খল \((\mathcal F_n)\) — filtration — গড়া হয়, যার উপর martingale দাঁড়ায়।
সূত্র (source): Klenke, Probability Theory: A Comprehensive Course — §1.3 (Measurable Maps) ও §1.5 (Random Variables): measurable map-এর সংজ্ঞা, generator-এ measurability-পরীক্ষা, generated σ-algebra \(\sigma(X)\), measurable ফাংশনদের closure, image measure (pushforward) \(\mathbb P\circ X^{-1}\), distribution/law ও CDF correspondence; simple-function-এর dyadic approximation §1.5–§4.1-এর সংযোগস্থলে (Lebesgue integral-এর প্রস্তুতি)।
এক বাক্যে। এই অধ্যায় 7.2-এর মঞ্চ \((\Omega,\mathcal F,\mathbb P)\)-এ মূল চরিত্রটিকে নামায় — random variable = measurable function \(X:\Omega\to\mathbb R\) (\(X^{-1}(B)\in\mathcal F\), generator-এ যাচাইযোগ্য) — আর তার হাত ধরে আসে তিন প্রাপ্তি: \(\sigma(X)\) = তথ্য, pushforward law \(P_X\) ও CDF, এবং simple-function approximation (\(f_n\uparrow f\)) যা 7.4-এর Lebesgue integral-এর সরাসরি সেতু।