7.8 — Martingales: Filtration, Stopping Time ও Optional Sampling (ন্যায্য খেলার গণিত)¶

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶

১.১ একটা ন্যায্য খেলা — যেখানে কোনো পক্ষপাত নেই¶

কল্পনা করা যাক একটা নিখুঁত ন্যায্য খেলা (fair game): প্রতিটি দানে আপনি কিছু বাজি ধরেন, আর খেলাটা এমন সাজানো যে গড়ে আপনি জেতেনও না, হারেনও না। ধরা যাক $X_n$ হলো $n$-তম দানের পর আপনার মোট সম্পদ। "ন্যায্য" শব্দটার গাণিতিক অর্থ ঠিক কী? — স্বজ্ঞা বলে: আজ পর্যন্ত যা-কিছু ঘটেছে তার সমস্ত তথ্য হাতে নিয়েও, আগামী দানের পর আপনার প্রত্যাশিত সম্পদ ঠিক আজকের সম্পদের সমান। আপনি এগিয়েও যাবেন না, পিছিয়েও না — গড়-অর্থে। এই একটিমাত্র বাক্যই martingale (মার্টিঙ্গেল) ধারণার পুরো প্রাণ: $$ \mathbb E[X_{n+1}\mid\mathcal F_n]\;=\;X_n, $$ যেখানে $\mathcal F_n$ মানে "$n$ সময় পর্যন্ত জমে-ওঠা সমস্ত তথ্য"। ডান পাশে $X_n$ — আজকের পরিচিত মান; বাঁ পাশে $\mathbb E[X_{n+1}\mid\mathcal F_n]$ — সেই সব তথ্য দিয়ে আগামীকালের সেরা অনুমান (7.7-এর শর্তাধীন প্রত্যাশা)। দুই সমান হওয়া মানে: আগামীকালের সেরা পূর্বাভাস = আজকের মান। কোনো গোপন প্রবণতা নেই, কোনো drift নেই।

এর দুই স্বাভাবিক প্রতিবেশী: যদি খেলাটা আপনার পক্ষে ঝোঁকা থাকে (গড়ে বাড়ে), তখন $\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n$ — একে বলে submartingale; আর যদি বিপক্ষে ঝোঁকা (গড়ে কমে, যেমন বাস্তব ক্যাসিনো, যেখানে ঘর-সুবিধা আছে), তখন $\le$ — supermartingale। নামের উল্টো-সম্পর্কটা প্রথমে ধাঁধার মতো লাগে (sub = বাড়ে?), কিন্তু তা subharmonic ফাংশনের সাদৃশ্য থেকে আসে — §২-এ মনে রাখার সহজ সূত্র দেব।

লক্ষণীয়, martingale মানে "নিশ্চল" নয়। $X_n$ দিব্যি লাফাতে-ঝাঁপাতে পারে, পথ বুনোভাবে দুলতে পারে — শর্ত শুধু একটাই: প্রতিটি মুহূর্তে পরবর্তী পদক্ষেপের গড় শূন্য (বর্তমান তথ্যের সাপেক্ষে)। তাই martingale মানে বায়াসহীন, নিশ্চল নয় — একটা গুরুত্বপূর্ণ পার্থক্য যা চিত্র 7-8-martingale-paths-এ চোখে দেখব: বহু পথ, প্রতিটি দোলে, কিন্তু তাদের গড় সমতল থাকে।

এক বাক্যে সূচনা। martingale হলো ন্যায্য খেলার কঠোর গাণিতিক রূপ — $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$, অর্থাৎ আজ পর্যন্ত সব তথ্য $\mathcal F_n$ দিয়ে আগামীকালের সেরা অনুমান ঠিক আজকের মান; পক্ষে-ঝোঁকা হলে $\ge$ (submartingale), বিপক্ষে $\le$ (supermartingale) — আর martingale মানে "বায়াসহীন", "নিশ্চল" নয়।

১.২ filtration — তথ্য যেভাবে ধাপে ধাপে জমে¶

7.7-এ "তথ্য" ছিল একটামাত্র sub-σ-algebra $\mathcal G$ — একটা স্থির ছবি। কিন্তু খেলা, পরিভ্রমণ, পর্যবেক্ষণ — সবই সময়ে গড়ায়, আর তথ্য জমে ক্রমশ। প্রথম দান দেখার আগে আমরা প্রায় কিছুই জানি না; প্রথম দানের পর কিছুটা জানি; দ্বিতীয় দানের পর আরও বেশি — এবং একবার-জানা তথ্য কখনো হারায় না। এই জমে-ওঠা তথ্যপ্রবাহ ধরার গাণিতিক বস্তুই filtration (ফিল্ট্রেশন): একটা বর্ধমান σ-algebra-অনুক্রম $$ \mathcal F_0\;\subseteq\;\mathcal F_1\;\subseteq\;\mathcal F_2\;\subseteq\;\cdots\;\subseteq\;\mathcal F, $$ যেখানে $\mathcal F_n$ = "সময় $n$ পর্যন্ত যা-কিছু পর্যবেক্ষণযোগ্য, তার সমস্ত সংগ্রহ"। nested (বর্ধমান) হওয়াটাই সিদ্ধান্তকারী — এটিই "তথ্য জমে, হারায় না"-র গণিত, আর এটিই 7.7-এর tower property-কে ($\mathcal H\subseteq\mathcal G$) সময়ের অক্ষে বসিয়ে দেয়।

সবচেয়ে স্বাভাবিক filtration আসে প্রক্রিয়াটা নিজে থেকে: $\mathcal F_n=\sigma(X_0,X_1,\dots,X_n)$ — "এ-পর্যন্ত দেখা সব $X$-এর তথ্য", একে বলে natural filtration (স্বাভাবিক ফিল্ট্রেশন)। এই কাঠামোয় দুটো ভূমিকা আলাদা করা মৌলিক:

একটা process $(X_n)$ adapted (অভিযোজিত) যদি প্রতিটি $X_n$ $\mathcal F_n$-measurable — অর্থাৎ এখনই, বর্তমান তথ্যেই $X_n$ জানা। (martingale হতে গেলে adapted হওয়া আবশ্যক — যা জানাই নেই তার সাথে "বর্তমান মান" তুলনা করা অর্থহীন।)
একটা process $(H_n)$ predictable (পূর্বানুমেয়) যদি প্রতিটি $H_n$ $\mathcal F_{n-1}$-measurable — অর্থাৎ এক-ধাপ-আগেই $H_n$ জানা, $n$-তম ঘটনা ঘটার আগেই। বাজির আকার এর নিখুঁত উদাহরণ: আপনি $n$-তম দান গড়ানোর আগে ঠিক করেন কত বাজি ধরবেন ($H_n$), ফলাফল দেখার পর নয়।

এই "এক-ধাপের ব্যবধান" — adapted ($\mathcal F_n$) বনাম predictable ($\mathcal F_{n-1}$) — দেখতে সামান্য, কিন্তু এটিই "ভবিষ্যৎ উঁকি দিয়ে দেখা যায় না" নীতির গণিত, এবং ১.৩-এর "ন্যায্য খেলা হারানো যায় না"-র পুরো যুক্তি এর উপরেই দাঁড়ায়।

এক বাক্যে। তথ্যের জমে-ওঠা প্রবাহকে ধরে একটা বর্ধমান σ-algebra-অনুক্রম filtration $(\mathcal F_n)$ ($\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots$, তথ্য জমে—হারায় না); একটা process adapted যদি $X_n$ $\mathcal F_n$-measurable (এখনই জানা), predictable যদি $H_n$ $\mathcal F_{n-1}$-measurable (এক-ধাপ-আগেই জানা, যেমন বাজির আকার) — এই এক-ধাপের ব্যবধানই "ভবিষ্যৎ উঁকি দেওয়া যায় না"-র গণিত।

১.৩ কেন এটি গুরুত্বপূর্ণ — "ন্যায্য খেলা হারানো যায় না" থেকে আধুনিক প্রয়োগ¶

martingale কেন আধুনিক সম্ভাব্যতার অন্যতম শক্তিশালী হাতিয়ার — তার সবচেয়ে সুন্দর ছোট-উপপাদ্য দিয়েই শুরু করা যাক। প্রশ্ন: একটা ন্যায্য খেলায় কোনো চতুর বাজির কৌশল কি আপনাকে গড়ে এগিয়ে দিতে পারে? — যেমন "জেতার পর বড় বাজি, হারার পর ছোট", বা যেকোনো জটিল নিয়ম যা শুধু অতীত-ফলাফলের উপর নির্ভর করে। উত্তর — না, কখনো নয়। আপনার কৌশল $H_n$ (n-তম দানের বাজি) যদি predictable হয় (অতীত দিয়ে স্থির, ভবিষ্যৎ না-দেখে) ও bounded, তবে আপনার সঞ্চিত মুনাফা $$ (H\cdot X)n\;=\;\sum) $$ আবার একটা }^{n}H_k\,(X_k-X_{k-1martingale — গড়ে শূন্য-লাভ। একে বলে martingale transform, আর এর তাৎপর্য গভীর: "You cannot beat a fair game by any betting system." ন্যায্যতা একটা সংরক্ষিত (conserved) ধর্ম — কোনো অতীত-নির্ভর কৌশলে তাকে ভাঙা যায় না। এর প্রমাণ একলাইনে 7.7-এর pull-out থেকে আসে ($H_k$ predictable, তাই $\mathcal F_{k-1}$-এ ধ্রুবকের মতো বের করে আনা যায়) — §২.৬-এ দেখব।

এই একটিমাত্র অন্তর্দৃষ্টি থেকে জন্ম নেয় বিশাল প্রয়োগ-জগৎ:

stochastic approximation ও SGD। আধুনিক মেশিন-লার্নিং যে stochastic gradient descent-এ মডেল শেখায়, তার অভিসরণ-প্রমাণের কেন্দ্রে martingale: প্রতিটি ধাপে gradient-এর noise-অংশ একটা martingale difference ($\mathbb E[\text{noise}\mid\text{অতীত}]=0$), আর তার সঞ্চয় একটা martingale — যার convergence (7.9) থেকেই "SGD থামে কোথায়" প্রমাণ হয়।
sequential analysis (অনুক্রমিক পরীক্ষণ)। ক্লিনিকাল ট্রায়াল বা A/B টেস্টে আমরা তথ্য আসতে-আসতে সিদ্ধান্ত নিই — "এখনই থামব, না আরও তথ্য নেব?"। likelihood-ratio martingale ও stopping time এর গাণিতিক ভিত্তি (Wald-এর SPRT), এবং কখন থামলে সিদ্ধান্ত পক্ষপাতহীন থাকে তা ঠিক optional stopping theorem বলে।
finance (অর্থায়ন)। আধুনিক গাণিতিক অর্থায়নের মূল স্বীকার্য — একটা ন্যায্য (arbitrage-মুক্ত) বাজারে discounted দামের প্রক্রিয়া একটা martingale (\"efficient market\"); option-মূল্যায়ন থেকে ঝুঁকি-নিরপেক্ষ মূল্যায়ন — সবই martingale-ভাষায়।
probability-র নিজস্ব যন্ত্রপাতি। সবচেয়ে গভীর — 7.9-এর martingale convergence theorem (\"bounded martingale a.s. converges\") ও Doob's inequalities, যা SLLN-এর দ্বিতীয় প্রমাণ, concentration inequality, এবং আরও বহু ফলের একক, সর্বজনীন ইঞ্জিন। এই অধ্যায় ঠিক সেই যন্ত্রের ভিত্তি গাঁথে।

এক বাক্যে। martingale-এর প্রথম বড় ফল — martingale transform $(H\cdot X)_n=\sum H_k(X_k-X_{k-1})$ আবার martingale ($H$ predictable ও bounded), অর্থাৎ "কোনো বাজির কৌশল ন্যায্য খেলাকে হারাতে পারে না" — আর এই কাঠামোই SGD/stochastic approximation, sequential analysis, finance, এবং 7.9-এর martingale convergence ও concentration-যন্ত্রের সর্বজনীন ভিত্তি।

১.৪ কখন থামলে গড় বদলায় না — optional stopping-এর পূর্বাভাস¶

martingale-এর দ্বিতীয় বড় প্রশ্ন — এবং এই অধ্যায়ের মুকুটমণি — থামার (stopping) সাথে জড়িত। ন্যায্য খেলায় $\mathbb E[X_n]=\mathbb E[X_0]$ প্রতিটি স্থির সময় $n$-তে (গড়ে কোনো লাভ-ক্ষতি নেই)। কিন্তু আমরা প্রায়ই এলোমেলো, তথ্য-নির্ভর সময়ে থামি — "যখন প্রথম ৳$N$ জিতব তখন থামব", বা "যখন প্রথম দেউলিয়া হব"। এমন একটা এলোমেলো থামার-সময় $\tau$-কে বলে stopping time — যার একমাত্র শর্ত: থামার সিদ্ধান্ত $\{\tau\le n\}$ কেবল অতীত তথ্য $\mathcal F_n$-এর উপর নির্ভর করে, ভবিষ্যৎ উঁকি দিয়ে নয় (\"আজ থামব কিনা তা আজ পর্যন্ত যা দেখেছি তাতেই ঠিক করতে হবে\")।

স্বাভাবিক আশা: এমন এলোমেলো $\tau$-তে থামলেও কি গড় অপরিবর্তিত — $\mathbb E[X_\tau]=\mathbb E[X_0]$? — এটিই optional stopping (বা optional sampling) theorem। এর উত্তর একটা সাবধানী "হ্যাঁ, তবে শর্তসাপেক্ষে": এটি সত্য যখন (ক) $\tau$ bounded, বা (খ) $X$ bounded, বা (গ) $\mathbb E[\tau]<\infty$ ও increment bounded — কিন্তু এই hypothesis ছাড়া মিথ্যা হয়ে যেতে পারে। সবচেয়ে শিক্ষণীয় ব্যর্থতা: একটা ন্যায্য simple random walk যদি আপনি "প্রথম যখন +১ ছোঁব" তখন থামেন, তাহলে নিশ্চিতভাবে (a.s.) +১-এ থামবেন — তাই $\mathbb E[X_\tau]=1\ne0=\mathbb E[X_0]$! এখানে $\tau$ অসীম গড়-সময়ের ($\mathbb E[\tau]=\infty$), তাই কোনো শর্ত মেটে না — আর এই ফাঁকটাই বিখ্যাত doubling (martingale) কৌশল-এর "অমোঘ জয়"-এর বিভ্রম ও তার বাস্তব অসারতা ব্যাখ্যা করে। চিত্র 7-8-optional-stopping-ruin (সফল প্রয়োগ — gambler's ruin) ও 7-8-optional-stopping-fails (ব্যর্থতা — first-passage/doubling) এই দুই দিক পাশাপাশি দেখাবে।

এক বাক্যে। optional stopping theorem বলে এলোমেলো stopping time $\tau$-তে থামলেও $\mathbb E[X_\tau]=\mathbb E[X_0]$ — কিন্তু কেবল শর্তসাপেক্ষে ($\tau$ bounded, বা $X$ bounded, বা $\mathbb E[\tau]<\infty$ ও bounded increments); hypothesis ভাঙলে (first-passage-এ $\mathbb E[X_\tau]=1\ne0$, বা doubling-কৌশল) তা মিথ্যা — যা gambler's ruin-এর সঠিক হিসাব ও doubling-জয়ের বিভ্রম দুই-ই ব্যাখ্যা করে।

১.৫ এই অধ্যায়ের পথরেখা¶

§২ সব মূল বস্তুর precise সংজ্ঞা ও বিবৃতি — filtration ও তথ্যপ্রবাহ (২.১); adapted ও predictable process (২.২); martingale / sub- / supermartingale (conditional-expectation-সংজ্ঞা, ২.৩); মূল উদাহরণ — random walk, গুণফল, Doob martingale, likelihood ratio, Pólya urn (২.৪); martingale transform ও "ন্যায্য খেলা হারানো যায় না" (২.৫); stopping time ও basic উদাহরণ (২.৬); stopped process $X_{n\wedge\tau}$ যে martingale (২.৭); optional stopping theorem-এর তিন hypothesis-গুচ্ছ, gambler's ruin, ও hypothesis-ভাঙা failure (২.৮); Doob decomposition (২.৯)। ভারী প্রমাণ §৪-এ স্থগিত, স্পষ্ট forward pointer সহ।
§৪ ভারী প্রমাণ — martingale transform martingale (pull-out দিয়ে); stopped process martingale (predictable indicator $H_n=\mathbf 1_{\{n\le\tau\}}$ দিয়ে transform হিসেবে); optional stopping (প্রথমে bounded $\tau$-তে সরাসরি, তারপর DCT/MCT দিয়ে তিন hypothesis-গুচ্ছে উন্নয়ন); gambler's ruin-এর ruin-সম্ভাবনা ও গড়-সময়; এবং Doob decomposition-এর অস্তিত্ব ও a.s.-uniqueness।
§৫–৬ simulation ও চিত্র (seed 20260619) — 7-8-martingale-paths (বহু martingale-পথ — গড়ে স্থির, পৃথক পথ দোলে), 7-8-optional-stopping-ruin (gambler's ruin — সীমানায় থামা, ruin-সম্ভাবনা ও $\mathbb E[X_\tau]=\mathbb E[X_0]$ empirically মেলা), 7-8-optional-stopping-fails (first-passage/doubling — $\mathbb E[X_\tau]\ne\mathbb E[X_0]$), এবং 7-8-doob-decomposition (submartingale $S_n^2$ = martingale + predictable compensator $n$)।

এর পরে Part VII-এর পুরস্কার: 7.9 — martingale convergence theorem (bounded martingale a.s. converges), Doob's maximal ও $L^p$ inequalities, এবং SLLN-এর martingale-প্রমাণ; তারপর 7.10 — rigorous central limit theorem-এর দিকে।

এক বাক্যে পথরেখা। §২ সংজ্ঞা ও বিবৃতি (filtration + adapted/predictable + martingale/sub/super + উদাহরণ + martingale transform + stopping time + stopped process + optional stopping-এর তিন hypothesis + Doob decomposition) → §৪ প্রমাণ (transform via pull-out, stopped via predictable indicator, optional stopping via bounded-$\tau$+DCT, gambler's ruin, Doob uniqueness) → §৫–৬ চার চিত্র (seed 20260619); আর এই martingale-ভিত্তির উপর Part VII গড়ে 7.9 (martingale convergence ও Doob's inequalities) → 7.10 (rigorous CLT)।

২ · মূল ধারণা ও সংজ্ঞা¶

এই বিভাগে এ অধ্যায়ের সব formal বস্তুর precise সংজ্ঞা ও বিবৃতি দিই — প্রতিটি প্রতীক প্রথম ব্যবহারেই খুলে। কাঠামো §১-এর সুতো ধরে: প্রথমে filtration ও তথ্যপ্রবাহ (২.১); তারপর adapted ও predictable (২.২); তারপর কেন্দ্রীয় সংজ্ঞা — martingale / sub- / supermartingale (২.৩) ও মূল উদাহরণ (২.৪); তারপর martingale transform ও "ন্যায্য খেলা হারানো যায় না" (২.৫); তারপর stopping time (২.৬), stopped process (২.৭) ও optional stopping theorem তার তিন hypothesis-গুচ্ছ ও failure সহ (২.৮); শেষে Doob decomposition (২.৯)। ভারী প্রমাণগুলো §৪-এ — এখানে কেবল বিবৃতি ও অন্তর্দৃষ্টি, স্পষ্ট forward pointer সহ।

জুড়ে আমরা একটা probability space $(\Omega,\mathcal F,\mathbb P)$ ধরে কাজ করি, এবং discrete সময় $n\in\{0,1,2,\dots\}$। random variable বলতে measurable $X:\Omega\to\mathbb R$ (7.3); $\mathbb E[X]=\int_\Omega X\,d\mathbb P$ (7.4), $X\in L^1\iff\mathbb E\lvert X\rvert<\infty$। 7.7-এর শর্তাধীন প্রত্যাশা $\mathbb E[\cdot\mid\mathcal G]$ ও তার সব ধর্ম (linearity, tower, pull-out, conditional Jensen, monotonicity) নিঃশব্দে ধরে নেওয়া। প্রতিটি conditional-expectation সমতা — $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ ইত্যাদি — by default a.s. (almost surely) অর্থে বোঝা, যেহেতু conditional expectation কেবল a.s.-অনন্যভাবে সংজ্ঞায়িত (7.7)।

২.১ filtration — তথ্যপ্রবাহের গাণিতিক রূপ¶

প্রথম ইট — সময়ে জমে-ওঠা তথ্যকে গণিতে বসানো। একটা একক sub-σ-algebra (7.7) ছিল একটা স্থির ছবি; এখন দরকার তার একটা সময়-নির্ভর, বর্ধমান অনুক্রম।

সংজ্ঞা (filtration)। $(\Omega,\mathcal F,\mathbb P)$-এর উপর একটা filtration (ফিল্ট্রেশন — তথ্যপ্রবাহ) হলো sub-σ-algebra-গুলোর একটা অনুক্রম $(\mathcal F_n)_{n\ge0}$ যা বর্ধমান (increasing): $$ \mathcal F_0\;\subseteq\;\mathcal F_1\;\subseteq\;\mathcal F_2\;\subseteq\;\cdots\;\subseteq\;\mathcal F. $$ আমরা ভাবি $\mathcal F_n$ = "সময় $n$ পর্যন্ত পর্যবেক্ষণযোগ্য সমস্ত তথ্য"। nested কাঠামোই বলে তথ্য জমে, কখনো হারায় না। $(\Omega,\mathcal F,(\mathcal F_n),\mathbb P)$-কে একটা filtered probability space বলে।

সবচেয়ে স্বাভাবিক উৎস প্রক্রিয়াটা নিজে: একটা random-variable-অনুক্রম $(X_n)$ দিলে তার natural filtration (স্বাভাবিক ফিল্ট্রেশন) $$ \mathcal F_n\;:=\;\sigma(X_0,X_1,\dots,X_n)\qquad(\text{"এ-পর্যন্ত দেখা সব }X\text{-এর তথ্য"}). $$ এটি স্বয়ংক্রিয়ভাবে বর্ধমান, কারণ generator-সেট বাড়ছে। দুই চরম সবসময় মনে রাখা ভালো (sanity-check): $\mathcal F_n=\{\emptyset,\Omega\}$ সব $n$-তে ("কখনো কোনো তথ্য নেই") এবং $\mathcal F_n=\mathcal F$ সব $n$-তে ("শুরুতেই সব জানা")। আর nested $\mathcal F_n\subseteq\mathcal F_{n+1}$-ই ঠিক সেই $\mathcal H\subseteq\mathcal G$-কাঠামো যা 7.7-এর tower property-কে এখানে কর্মক্ষম করে।

এক বাক্যে। filtration $(\mathcal F_n)_{n\ge0}$ হলো বর্ধমান sub-σ-algebra-অনুক্রম ($\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots$) — সময়ে জমে-ওঠা তথ্যের গাণিতিক রূপ ("তথ্য জমে, হারায় না"); সবচেয়ে স্বাভাবিক উদাহরণ প্রক্রিয়াটার natural filtration $\mathcal F_n=\sigma(X_0,\dots,X_n)$, আর এর nested কাঠামোই 7.7-এর tower-কে এখানে চালায়।

২.২ adapted ও predictable — দুই মৌলিক ভূমিকা¶

filtration বসানোর পর, একটা process-এর তথ্যপ্রবাহের সাথে সম্পর্ক দুই রকম — আর এই দুইয়ের পার্থক্যই পরের সব কিছুর চাবি।

সংজ্ঞা (adapted)। একটা process $(X_n)_{n\ge0}$ adapted (অভিযোজিত) $(\mathcal F_n)$-এর সাপেক্ষে যদি প্রতিটি $n$-তে $X_n$ একটা $\mathcal F_n$-measurable random variable — অর্থাৎ বর্তমান তথ্য $\mathcal F_n$-এ $X_n$-এর মান ইতিমধ্যে জানা। (natural filtration-এ প্রতিটি $(X_n)$ স্বয়ংক্রিয়ভাবে adapted।)

সংজ্ঞা (predictable)। একটা process $(H_n)_{n\ge1}$ predictable (পূর্বানুমেয়) যদি প্রতিটি $n\ge1$-তে $H_n$ একটা $\mathcal F_{n-1}$-measurable random variable — অর্থাৎ এক ধাপ আগেই, $\mathcal F_{n-1}$-তে $H_n$-এর মান জানা, $n$-তম ঘটনা ঘটার আগেই।

পার্থক্যটা ঠিক এক-ধাপের সূচক-ব্যবধান — adapted-এ $X_n\leftrightarrow\mathcal F_n$, predictable-এ $H_n\leftrightarrow\mathcal F_{n-1}$ — কিন্তু অর্থে বিশাল। adapted মানে "এখন জানা" (যেমন আপনার বর্তমান সম্পদ); predictable মানে "আগেই জানা, ফলাফল দেখার আগে" (যেমন বাজির আকার, যা দান গড়ানোর আগে স্থির)। এই predictability-ই হলো "ভবিষ্যৎ উঁকি দিয়ে দেখা যায় না" নীতির আনুষ্ঠানিক রূপ — একটা বাজির কৌশল কেবল অতীত ব্যবহার করতে পারে, ভবিষ্যৎ নয়। ২.৫-এর martingale transform-এ ঠিক এই predictability-ই pull-out-কে বৈধ করে, আর তা থেকেই "ন্যায্য খেলা হারানো যায় না" বেরোয়।

এক বাক্যে। একটা process adapted যদি $X_n$ $\mathcal F_n$-measurable ("এখনই জানা", যেমন বর্তমান সম্পদ), predictable যদি $H_n$ $\mathcal F_{n-1}$-measurable ("এক-ধাপ-আগেই জানা", যেমন বাজির আকার ফলাফল দেখার আগে) — এই এক-ধাপের ব্যবধানই "ভবিষ্যৎ উঁকি দেওয়া যায় না"-র গণিত এবং martingale transform-এর চাবি।

২.৩ martingale, submartingale, supermartingale¶

এবার কেন্দ্রীয় সংজ্ঞা, পূর্ণ আকারে। §১.১-এর "ন্যায্য খেলা"-কে formally বসাই।

সংজ্ঞা (martingale)। একটা process $(X_n)_{n\ge0}$ একটা martingale (মার্টিঙ্গেল) filtration $(\mathcal F_n)$-এর সাপেক্ষে যদি— 1. (integrability) প্রতিটি $n$-তে $X_n\in L^1$ (অর্থাৎ $\mathbb E\lvert X_n\rvert<\infty$); 2. (adapted) প্রতিটি $X_n$ $\mathcal F_n$-measurable; এবং 3. (martingale property) $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s. সব $n\ge0$-তে।

যদি ৩-এ "$=$"-এর বদলে $\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n$ a.s. হয়, তবে $(X_n)$ একটা submartingale (পক্ষে-ঝোঁকা — গড়ে বাড়ে); আর $\le$ হলে supermartingale (বিপক্ষে-ঝোঁকা — গড়ে কমে)।

শর্ত তিনটির ভূমিকা: integrability না-থাকলে $\mathbb E[\cdot\mid\mathcal F_n]$ সংজ্ঞায়িতই নয় (7.7); adapted না-হলে "$=X_n$" তুলনাটাই অর্থহীন; আর শর্ত ৩-ই হৃদয় — "আগামীকালের সেরা পূর্বাভাস = আজকের মান"। নাম মনে রাখার সহজ সূত্র: supermartingale নিচে নামে (super = উপরে শুরু, পড়ে), submartingale উপরে ওঠে — উল্টোটা, subharmonic ফাংশনের সাদৃশ্যে (একটা convex/subharmonic ছবি সাব-নাম পায় যদিও বাড়ে)।

দুটো অবিলম্বে-পরিণতি, tower (7.7) থেকে, যা সারা অধ্যায়ে ব্যবহৃত:

(দূর-ভবিষ্যৎ) martingale-এ $m>n$ হলে $\mathbb E[X_m\mid\mathcal F_n]=X_n$ — শুধু পরের ধাপ নয়, যেকোনো ভবিষ্যৎ ধাপের সেরা অনুমানও আজকের মান। (প্রমাণ: $\mathbb E[X_m\mid\mathcal F_n]=\mathbb E[\mathbb E[X_m\mid\mathcal F_{m-1}]\mid\mathcal F_n]=\mathbb E[X_{m-1}\mid\mathcal F_n]$, পুনরাবৃত্তি — tower; §৪।)
(ধ্রুব গড়) $\mathbb E[X_n]=\mathbb E[X_0]$ সব $n$-তে (martingale); submartingale-এ $\mathbb E[X_n]$ অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান। ($G=\Omega$-এ total expectation।)

আরেকটা দরকারি সেতু: $(X_n)$ martingale ও $\varphi$ convex ($\varphi(X_n)\in L^1$) হলে $(\varphi(X_n))$ একটা submartingale — সরাসরি conditional Jensen (7.7): $\varphi(X_n)=\varphi(\mathbb E[X_{n+1}\mid\mathcal F_n])\le\mathbb E[\varphi(X_{n+1})\mid\mathcal F_n]$। বিশেষত $\lvert X_n\rvert$ ও $X_n^2$ (যদি $L^1$-এ) submartingale — যা 7.9-এর Doob's inequalities-এর গোড়া।

এক বাক্যে। $(X_n)$ একটা martingale যদি তা integrable, adapted, এবং $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s. (ন্যায্য খেলা); $\ge$ হলে submartingale (গড়ে বাড়ে), $\le$ হলে supermartingale (গড়ে কমে) — tower থেকে $\mathbb E[X_m\mid\mathcal F_n]=X_n$ ($m>n$) ও $\mathbb E[X_n]=\mathbb E[X_0]$ ধ্রুব, আর convex $\varphi$-তে conditional Jensen martingale→submartingale বানায়।

২.৪ মূল উদাহরণ — random walk, গুণফল, Doob martingale, likelihood ratio, Pólya urn¶

সংজ্ঞা জীবন্ত হয় উদাহরণে। প্রতিটির জন্য আসল কাজ একটাই — শর্ত ৩ ($\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$) যাচাই করা; নিচে স্কেচ, পূর্ণ হিসাব §৩-৪।

(ক) mean-0 random walk। $\xi_1,\xi_2,\dots$ স্বাধীন (7.6), $\mathbb E[\xi_k]=0$, $\mathbb E\lvert\xi_k\rvert<\infty$; $S_0=0$, $S_n=\sum_{k=1}^n\xi_k$, $\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)$। তখন $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+\mathbb E[\xi_{n+1}\mid\mathcal F_n]=S_n+\mathbb E[\xi_{n+1}]=S_n$ (pull-out + independence, 7.7) — তাই $(S_n)$ একটা martingale। যদি $\mathbb E[\xi_k]>0$, তবে submartingale; $<0$ হলে supermartingale। (3.5-এর random walk-ই canonical martingale।)
(খ) mean-1 iid-এর গুণফল। $\eta_1,\eta_2,\dots$ স্বাধীন, $\eta_k\ge0$, $\mathbb E[\eta_k]=1$; $M_0=1$, $M_n=\prod_{k=1}^n\eta_k$। তখন $\mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\,\mathbb E[\eta_{n+1}]=M_n$ (pull-out: $M_n$ $\mathcal F_n$-measurable, $\eta_{n+1}$ স্বাধীন) — তাই martingale। (গুণমূলক ন্যায্যতা; likelihood ratio-র গোড়া।)
(গ) Doob martingale। যেকোনো $Y\in L^1$ ও filtration $(\mathcal F_n)$ নিয়ে সংজ্ঞা $X_n:=\mathbb E[Y\mid\mathcal F_n]$ — "$Y$-এর সেরা অনুমান, সময় $n$-এর তথ্যে"। tower সরাসরি দেয় $\mathbb E[X_{n+1}\mid\mathcal F_n]=\mathbb E[\mathbb E[Y\mid\mathcal F_{n+1}]\mid\mathcal F_n]=\mathbb E[Y\mid\mathcal F_n]=X_n$ — তাই স্বয়ংক্রিয়ভাবে martingale। এটি martingale-এর সবচেয়ে গুরুত্বপূর্ণ উৎস: একটা স্থির লক্ষ্য $Y$ সম্পর্কে আমাদের অনুমান যত তথ্য জমে তত পরিশীলিত হয় (Bayesian updating-এর গতিশীল রূপ), আর 7.9-এর martingale convergence বলবে $X_n\to Y$।
(ঘ) likelihood-ratio martingale। ডেটা $Z_1,Z_2,\dots$ iid, দুই সম্ভাব্য density $f$ ও $g$ ($f$ সত্য)। $L_n=\prod_{k=1}^n\frac{g(Z_k)}{f(Z_k)}$ হলো $f$-এর অধীনে একটা martingale (কারণ $\mathbb E_f[\frac{g(Z)}{f(Z)}]=\int g=1$ — (খ)-এর বিশেষ রূপ) — sequential hypothesis testing (Wald's SPRT)-এর কেন্দ্রীয় বস্তু।
(ঙ) Pólya urn। একটা কলসে শুরুতে কিছু লাল ও সাদা বল; প্রতি ধাপে একটা বল তুলে তার রঙের আরেকটা বল সঙ্গে ফেরত দিই। সময় $n$-এ লালের অনুপাত $X_n$ একটা martingale ($\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ — যাচাই §৩) — একটা চমকপ্রদ স্ব-শক্তিশালী (self-reinforcing) প্রক্রিয়া যেখানেও অনুপাত গড়ে স্থির থাকে।

প্রতিটিতে যন্ত্রপাতি একই — 7.7-এর pull-out ($\mathcal F_n$-measurable অংশ বের করা) ও independence ($\mathbb E[\cdot\mid\mathcal F_n]=\mathbb E[\cdot]$ স্বাধীন অংশে) — তাই martingale-যাচাই প্রায় সবসময় এই দুই ধর্মের সরাসরি প্রয়োগ।

এক বাক্যে। canonical martingale — mean-0 random walk $S_n=\sum\xi_k$, mean-1 iid-এর গুণফল $M_n=\prod\eta_k$, Doob martingale $X_n=\mathbb E[Y\mid\mathcal F_n]$ (tower থেকে স্বয়ংক্রিয়; লক্ষ্য $Y$-এর ক্রমে-পরিশীলিত অনুমান), likelihood ratio $L_n$, ও Pólya urn-এর রঙ-অনুপাত — প্রতিটিই $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ যাচাই করে পাওয়া যায়, যন্ত্র সবসময় 7.7-এর pull-out ও independence।

২.৫ martingale transform — "ন্যায্য খেলা হারানো যায় না"¶

§১.৩-এর প্রথম বড় ফলটা এবার formally। একটা ন্যায্য খেলায় বাজির কৌশল প্রয়োগ করলে কী হয়?

সংজ্ঞা ও উপপাদ্য (martingale transform)। $(X_n)$ একটা martingale এবং $(H_n)_{n\ge1}$ একটা predictable process ($H_n$ $\mathcal F_{n-1}$-measurable)। martingale transform (বা discrete stochastic integral) সংজ্ঞায়িত করি $$ (H\cdot X)n\;:=\;\sum),\qquad (H\cdot X)_0:=0. $$ তখন যদি }^{n}H_k\,(X_k-X_{k-1$H$ bounded হয় (বা যথাযথ integrability মেটে), $(H\cdot X)_n$ আবার একটা martingale (এবং $X$ super-/submartingale হলে $H\ge0$-তে যথাক্রমে super-/submartingale)।

স্বজ্ঞা: $X_k-X_{k-1}$ হলো $k$-তম দানে প্রতি-একক-বাজির ন্যায্য মুনাফা, $H_k$ আপনার বেছে নেওয়া বাজির আকার (যা $\mathcal F_{k-1}$-এ আগেই স্থির), তাই $(H\cdot X)_n$ আপনার সঞ্চিত মুনাফা একটা কৌশল $H$-এর অধীনে। উপপাদ্য বলে: এই সঞ্চিত মুনাফাও martingale — গড়ে শূন্য-লাভ। অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজির কৌশল ন্যায্য খেলার ন্যায্যতা ভাঙতে পারে না: you cannot beat a fair game. প্রমাণ একলাইন, 7.7-এর pull-out: $\mathbb E[(H\cdot X)_{n+1}-(H\cdot X)_n\mid\mathcal F_n]=\mathbb E[H_{n+1}(X_{n+1}-X_n)\mid\mathcal F_n]=H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=H_{n+1}\cdot0=0$ — কারণ $H_{n+1}$ $\mathcal F_n$-measurable (predictable), তাই বের করে আনা যায় (§৪)। এই predictability-ই সিদ্ধান্তকারী; $H$ যদি ভবিষ্যৎ "দেখতে" পারত (adapted কিন্তু predictable নয়), কৌশলটা খেলা হারাতে পারত — কিন্তু সেটা প্রতারণা, গণিত নয়।

এক বাক্যে। martingale transform $(H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})$, যেখানে $H$ predictable ও bounded, আবার একটা martingale — অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজির কৌশল ন্যায্য খেলাকে হারাতে পারে না; প্রমাণ এক-লাইন pull-out ($H_{n+1}$ $\mathcal F_n$-measurable বলে বের করে $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ গুণ)।

২.৬ stopping time — কেবল অতীত-তথ্যে থামা¶

optional stopping-এর দিকে প্রথম ধাপ — "এলোমেলো থামার-সময়"-কে গণিতে বসানো, এমনভাবে যাতে ভবিষ্যৎ উঁকি দেওয়া না-যায়।

সংজ্ঞা (stopping time)। একটা random variable $\tau:\Omega\to\{0,1,2,\dots\}\cup\{\infty\}$ একটা stopping time (থামার-সময়) filtration $(\mathcal F_n)$-এর সাপেক্ষে যদি প্রতিটি $n\ge0$-তে $$ {\tau\le n}\in\mathcal F_n\qquad(\text{সমতুল্যভাবে } {\tau=n}\in\mathcal F_n). $$ অর্থাৎ "$n$ সময়ের মধ্যে থেমে গেছি কিনা" — এই সিদ্ধান্ত কেবল সময় $n$ পর্যন্ত পর্যবেক্ষিত তথ্য-এর উপর নির্ভর করে, ভবিষ্যৎ না-দেখে।

মূল স্বজ্ঞা: stopping time হলো এমন থামার-নিয়ম যা আপনি বাস্তবে অনুসরণ করতে পারতেন — প্রতি মুহূর্তে আপনি জানেন থামবেন কিনা, ভবিষ্যৎ জানার দরকার নেই। উদাহরণ:

hitting time (পৌঁছানোর সময়)। একটা adapted process $(X_n)$ ও একটা সেট $B$ নিয়ে $\tau_B=\min\{n:X_n\in B\}$ ("$B$-তে প্রথম পৌঁছানো") একটা stopping time — কারণ $\{\tau_B\le n\}=\bigcup_{k\le n}\{X_k\in B\}\in\mathcal F_n$। (gambler's-ruin-এর "$0$ বা $N$-এ প্রথম পৌঁছানো" এর বিশেষ রূপ।)
কিন্তু "$X$ তার সর্বোচ্চে পৌঁছানোর সময়" (পুরো ভবিষ্যৎ-পথ জানা লাগে) stopping time নয় — ভবিষ্যৎ উঁকি দিতে হয়।

আরও দুটো দরকারি তথ্য: যেকোনো ধ্রুব সময় $\tau\equiv m$ একটা (তুচ্ছ) stopping time; আর দুটো stopping time-এর $\min$ (যেমন $\tau\wedge m=\min(\tau,m)$, "$\tau$ অথবা $m$ — যেটা আগে") আবার stopping time — ২.৭-এ এটিই $X_{n\wedge\tau}$-কে অর্থ দেবে।

এক বাক্যে। stopping time $\tau$ হলো এমন এলোমেলো থামার-সময় যেখানে $\{\tau\le n\}\in\mathcal F_n$ — থামার সিদ্ধান্ত কেবল অতীত-তথ্যে, ভবিষ্যৎ উঁকি দিয়ে নয় (যেমন "$B$-তে প্রথম পৌঁছানো" $\tau_B$ হলো stopping time, কিন্তু "সর্বোচ্চে পৌঁছানোর সময়" নয়)।

২.৭ stopped process — থামালেও martingale থেকে যায়¶

stopping time হাতে নিয়ে এখন martingale-কে "$\tau$-তে থামিয়ে" দিই, এবং দেখি ন্যায্যতা টিকে থাকে।

সংজ্ঞা ও উপপাদ্য (stopped process)। $(X_n)$ martingale ও $\tau$ একটা stopping time হলে, stopped process (থামানো প্রক্রিয়া) $$ X_n^\tau\;:=\;X_{n\wedge\tau}\qquad(\text{যেখানে } n\wedge\tau=\min(n,\tau)) $$ আবার একটা martingale (এবং super-/submartingale হলে তা-ই থাকে)। বিশেষত $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে।

স্বজ্ঞা: $X_{n\wedge\tau}$ মানে "$\tau$ পর্যন্ত খেলো, তারপর থেমে যাও — মান আর বদলায় না"। উপপাদ্য বলে, থেমে যাওয়া নিজে একটা ন্যায্য কৌশল — তাই থামালেও খেলা ন্যায্যই থাকে। আর প্রমাণটা ২.৫-এর সরাসরি ফল: থামাটা ঠিক একটা predictable bounded transform — বাজি $H_n=\mathbf 1_{\{n\le\tau\}}=\mathbf 1_{\{\tau\ge n\}}$ নিন ("$\tau$ পর্যন্ত প্রতি ধাপে এক-একক বাজি, তারপর শূন্য")। লক্ষণীয় $\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}$ — তাই $H_n$ predictable! তখন $X_{n\wedge\tau}-X_0=(H\cdot X)_n$, আর martingale transform (২.৫) থেকেই $X_{n\wedge\tau}$ martingale (§৪)। অর্থাৎ "$\tau$-তে থামা" আর "একটা বিশেষ predictable কৌশল খেলা" — একই কথা।

একটা সতর্কতা: $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সবসময় খাটে (প্রতিটি স্থির $n$-তে), কিন্তু এটি এখনও $\mathbb E[X_\tau]=\mathbb E[X_0]$ নয় — $n\to\infty$-এ সীমা নেওয়া দরকার, আর ঠিক সেখানেই (২.৮-এর) hypothesis লাগে।

এক বাক্যে। stopped process $X_{n\wedge\tau}$ আবার একটা martingale (তাই $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে) — কারণ "থামা" হলো predictable bounded বাজি $H_n=\mathbf 1_{\{\tau\ge n\}}$ ($\{\tau\ge n\}\in\mathcal F_{n-1}$) দিয়ে একটা martingale transform; তবে $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ এখনও $\mathbb E[X_\tau]=\mathbb E[X_0]$ নয় — $n\to\infty$-সীমায় শর্ত লাগে।

২.৮ optional stopping theorem — তিন hypothesis-গুচ্ছ ও তার সীমা¶

এই অধ্যায়ের মুকুটমণি। প্রশ্নটা ছিল: এলোমেলো $\tau$-তে থামলে কি $\mathbb E[X_\tau]=\mathbb E[X_0]$? ২.৭ দিয়েছে $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$; এখন $n\to\infty$ পার করতে হবে, আর সেটাই শর্ত দাবি করে।

উপপাদ্য (optional stopping / optional sampling)। $(X_n)$ একটা martingale ও $\tau$ একটা stopping time। তাহলে $X_\tau\in L^1$ এবং $$ \boxed{\ \mathbb E[X_\tau]\;=\;\mathbb E[X_0]\ } $$ — যদি নিচের যেকোনো একটি শর্ত মেটে: - (ক) $\tau$ bounded: কোনো ধ্রুবক $N$-তে $\tau\le N$ a.s.; - (খ) $X$ bounded ও $\tau<\infty$ a.s.: কোনো ধ্রুবক $C$-তে $\lvert X_{n\wedge\tau}\rvert\le C$ a.s. সব $n$-তে; - (গ) $\mathbb E[\tau]<\infty$ এবং bounded increments: কোনো ধ্রুবক $C$-তে $\lvert X_{n+1}-X_n\rvert\le C$ a.s.

(submartingale-এ "$=$"-এর বদলে $\mathbb E[X_\tau]\ge\mathbb E[X_0]$, supermartingale-এ $\le$।)

প্রতিটি শর্ত একটাই কাজ করে — $n\to\infty$-এ $\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]$ সীমা-বিনিময়কে বৈধ করা: (ক) তুচ্ছভাবে $n\ge N$-এ $X_{n\wedge\tau}=X_\tau$; (খ) bounded convergence (7.4-এর DCT, $C$ dominating); (গ) increment-যোগফলে $\sum$–$\mathbb E$ বিনিময় ($\mathbb E[\tau]<\infty$ ও bounded increments দিয়ে dominating function বানিয়ে DCT)। স্বজ্ঞা এক বাক্যে: খেলা যদি বাস্তবে শেষ হয় (অসীম পুঁজি বা অসীম সময় না-লাগিয়ে), তবে গড়-ন্যায্যতা টিকে থাকে।

প্রয়োগ — gambler's ruin। simple random walk $S_n$ ($\pm1$, ন্যায্য), শুরু $S_0=k$, থামি $\tau=$ "$0$ অথবা $N$-এ প্রথম পৌঁছানো" ($0<k<N$)। $X$ bounded (মান $[0,N]$-এ) ও $\tau<\infty$ a.s. — শর্ত (খ) মেটে, তাই $\mathbb E[S_\tau]=S_0=k$। কিন্তু $S_\tau\in\{0,N\}$, তাই $k=\mathbb E[S_\tau]=0\cdot\mathbb P(\text{ruin})+N\cdot\mathbb P(\text{win})$, যা সরাসরি দেয় ruin-সম্ভাবনা $\mathbb P(\text{win})=k/N$, $\mathbb P(\text{ruin})=1-k/N$। আর $S_n^2-n$ একটা martingale (২.৯) — তাতে optional stopping প্রয়োগ করলে গড়-সময় $\mathbb E[\tau]=k(N-k)$ বেরোয় (§৩)। এটিই 3.5-এর gambler's ruin-এর কঠোর, পূর্ণ হিসাব (চিত্র 7-8-optional-stopping-ruin)।

ব্যর্থতা — hypothesis ছাড়া। সতর্কতা সবচেয়ে শিক্ষণীয়। একই ন্যায্য simple random walk ($S_0=0$), কিন্তু এবার $\tau=$ "প্রথম যখন $S_n=1$"। জানা যায় $\tau<\infty$ a.s. (recurrence), তাই $S_\tau=1$ নিশ্চিতভাবে — অর্থাৎ $$ \mathbb E[S_\tau]\;=\;1\;\ne\;0\;=\;\mathbb E[S_0]\;! $$ optional stopping এখানে মিথ্যা — কারণ কোনো শর্তই মেটে না: $\tau$ unbounded, $X=S$ unbounded, এবং $\mathbb E[\tau]=\infty$ (first-passage-এর গড় অসীম)। এটিই বিখ্যাত doubling (martingale) কৌশল-এর রহস্য: হারলে বাজি দ্বিগুণ করতে থাকুন, প্রথম জয়ে থামুন — তাত্ত্বিকভাবে "নিশ্চিত ৳১ লাভ", কিন্তু তার জন্য দরকার অসীম পুঁজি ও অসীম সময় ($\mathbb E[\tau]=\infty$, unbounded loss) — যা বাস্তবে নেই, তাই "অমোঘ জয়" একটা বিভ্রম। hypothesis-ই সেই বিভ্রম থেকে রক্ষাকবচ (চিত্র 7-8-optional-stopping-fails)।

এক বাক্যে। optional stopping theorem — martingale ও stopping time $\tau$-তে $\mathbb E[X_\tau]=\mathbb E[X_0]$ যদি (ক) $\tau$ bounded, (খ) $X$ bounded, বা (গ) $\mathbb E[\tau]<\infty$ ও bounded increments (প্রতিটিই $n\to\infty$-সীমা-বিনিময়কে DCT/MCT দিয়ে বৈধ করে); gambler's ruin-এ ruin-সম্ভাবনা $1-k/N$ ও $\mathbb E[\tau]=k(N-k)$ এর সরাসরি ফল, কিন্তু hypothesis ছাড়া (first-passage-এ $\mathbb E[S_\tau]=1\ne0$, doubling-কৌশলে অসীম পুঁজি) তা ভেঙে পড়ে।

২.৯ Doob decomposition — ঝোঁক বনাম গোলমাল আলাদা করা¶

শেষ একটা কাঠামোগত ফল, যা submartingale-কে একটা পরিষ্কার অংশে ভাঙে — martingale (বিশুদ্ধ গোলমাল) আর একটা predictable প্রবণতা (drift)।

উপপাদ্য (Doob decomposition)। $(X_n)$ একটা submartingale হলে, তাকে অনন্যভাবে (a.s.) লেখা যায় $$ X_n\;=\;M_n\;+\;A_n, $$ যেখানে $(M_n)$ একটা martingale ($M_0=X_0$), এবং $(A_n)$ একটা predictable, অ-হ্রাসমান process ($A_0=0$, $A_n\le A_{n+1}$, $A_n$ $\mathcal F_{n-1}$-measurable) — একে compensator (ক্ষতিপূরক) বলে। (supermartingale-এ $A$ অ-বর্ধমান।)

নির্মাণ স্বচ্ছ: increment-কে দুই ভাগে ভাঙি — predictable প্রত্যাশিত-বৃদ্ধি ও বিশুদ্ধ-গোলমাল। $A_n=\sum_{k=1}^n\big(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1}\big)$ (submartingale বলে প্রতিটি পদ $\ge0$, তাই $A$ অ-হ্রাসমান ও predictable), আর $M_n=X_n-A_n$ (যাচাই: martingale)। স্বজ্ঞা: $A_n$ ধরে রাখে "গড়ে কতটা এগোনোর কথা ছিল" (drift/প্রবণতা), আর $M_n$ ধরে রাখে "তার চারপাশে এলোমেলো ওঠানামা" (martingale অংশ) — অর্থাৎ প্রবণতা ও গোলমাল আলাদা করা।

ধ্রুপদী উদাহরণ: $S_n$ ন্যায্য simple random walk হলে $S_n^2$ একটা submartingale (convex $\varphi(t)=t^2$, ২.৩), এবং তার Doob decomposition $$ S_n^2\;=\;\underbrace{(S_n^2-n)}{\text{martingale } M_n}\;+\;\underbrace{n}, $$ অর্থাৎ } A_n=\langle S\rangle_n$A_n=n$ ঠিক "জমে-ওঠা variance" (একে quadratic variation $\langle S\rangle_n$ বলে), আর $S_n^2-n$ একটা martingale — যা ঠিক gambler's-ruin-এর $\mathbb E[\tau]$ বের করতে কাজে লাগে (২.৮)। এই decomposition-ই continuous সময়ে Doob–Meyer ও stochastic calculus-এর discrete বীজ (চিত্র 7-8-doob-decomposition)।

এক বাক্যে। Doob decomposition — যেকোনো submartingale $X_n=M_n+A_n$ অনন্যভাবে (a.s.), যেখানে $M$ martingale (বিশুদ্ধ গোলমাল) ও $A$ predictable অ-হ্রাসমান compensator ($A_n=\sum_k(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})$, drift) — অর্থাৎ ঝোঁক ও গোলমাল আলাদা; canonical উদাহরণ $S_n^2=(S_n^2-n)+n$, যেখানে $\langle S\rangle_n=n$ জমে-ওঠা variance।

৩ · পূর্ণাঙ্গ উদাহরণ¶

§১–২-এ martingale (মার্টিঙ্গেল)-তত্ত্বের গোটা স্থাপত্য গড়া হয়েছে — প্রথমে filtration (ফিল্ট্রেশন, তথ্যের ক্রমবর্ধমান প্রবাহ) $\mathcal F_0\subseteq\mathcal F_1\subseteq\mathcal F_2\subseteq\cdots$, যেখানে $\mathcal F_n$ হলো "সময় $n$ পর্যন্ত যা জানা"; তারপর adapted (অভিযোজিত) প্রক্রিয়া ($X_n$ হলো $\mathcal F_n$-পরিমাপযোগ্য) ও predictable (পূর্বানুমেয়) প্রক্রিয়া ($H_n$ হলো $\mathcal F_{n-1}$-পরিমাপযোগ্য, অর্থাৎ এক-ধাপ-আগেই জানা); আর কেন্দ্রীয় সংজ্ঞা — $(X_n)$ একটা martingale যদি প্রতিটি ধাপে $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$, submartingale (সাব-মার্টিঙ্গেল) যদি $\ge X_n$, আর supermartingale (সুপার-মার্টিঙ্গেল) যদি $\le X_n$। martingale মানে "ন্যায্য খেলা (fair game)": আজকের তথ্য হাতে নিয়েও কালকের সেরা অনুমান আজকের মানই। সঙ্গে এসেছে কয়েকটা হাতিয়ার — martingale transform (মার্টিঙ্গেল রূপান্তর) $(H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})$ (predictable বাজির ফল আবার martingale), stopping time (থামার সময়) $\tau$ (যেখানে $\{\tau\le n\}\in\mathcal F_n$ — "এখনই থামব কিনা তা শুধু এখন পর্যন্ত তথ্যেই ঠিক হয়"), optional stopping theorem (ঐচ্ছিক-থামার উপপাদ্য) $\mathbb E[X_\tau]=\mathbb E[X_0]$ (শর্তসাপেক্ষে), আর Doob decomposition (ডুব পচন) — যেকোনো submartingale-কে একটা martingale ও একটা বর্ধমান predictable compensator (ক্ষতিপূরক)-এ ভাঙা। এই অংশের উদ্দেশ্য সেই বিমূর্ত কাঠামোকে হাতে-কলমে, কংক্রিট সংখ্যা ও কংক্রিট সিমুলেশন দিয়ে ছুঁয়ে দেখা — random walk কীভাবে martingale হয়ে ওঠে, যেকোনো integrable $Y$-এর "ধাপে-ধাপে উন্মোচন" কীভাবে আপনাআপনি martingale, কেন কোনো বাজি-কৌশল ন্যায্য খেলা হারাতে পারে না, optional stopping কীভাবে gambler's ruin-এর উত্তর এক লাইনে বার করে, কোথায় ও কেন সেই উপপাদ্য ভেঙে পড়ে, আর $S_n^2-n$ কীভাবে "জমা-হওয়া তারতম্য"-কে ক্ষতিপূরক হিসেবে আলাদা করে। ছয়টি উদাহরণে প্রতিটি ধাপ ধৈর্য ধরে কষব — কোনো হিসাব লুকানো থাকবে না — তারপর প্রতিটির শেষে "কী শিখলাম" বলে মূল শিক্ষাটা গুটিয়ে আনব। কষ্টের স্তর শিরোনামে তারা দিয়ে চিহ্নিত: ★ = সরাসরি, সংজ্ঞা প্রয়োগ করলেই হয় · ★★ = কিছু কৌশল বা সতর্ক যুক্তি লাগে। প্রতিটি ইংরেজি পরিভাষা প্রথম ব্যবহারে বাংলায় খুলে দেওয়া হবে। সব সিমুলেশন একই বীজে (seed np.random.default_rng(20260619)) চালানো, যাতে সংখ্যাগুলো পুনরুৎপাদনযোগ্য থাকে।

উদাহরণ ১ — random walk একটি martingale (★)¶

সেটআপ। নিরপেক্ষ মুদ্রা-হাঁটা (symmetric random walk) গড়ি। ধরা যাক $\xi_1,\xi_2,\dots$ স্বাধীন, প্রতিটি সমান সম্ভাবনায় $\pm1$: $$ \mathbb P(\xi_i=+1)=\mathbb P(\xi_i=-1)=\tfrac12,\qquad \mathbb E[\xi_i]=(+1)\tfrac12+(-1)\tfrac12=0. $$ আংশিক-যোগফল $S_n=\sum_{i=1}^n\xi_i$ ($S_0=0$) — প্রতি ধাপে এক কদম ডানে বা বাঁয়ে। filtration নিই $\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)$ — "$n$ ধাপ পর্যন্ত সব কদম জানা"। স্পষ্টতই $S_n$ হলো $\mathcal F_n$-পরিমাপযোগ্য, তাই $(S_n)$ adapted। প্রশ্ন: $(S_n)$ কি martingale?

ধাপ ১ — তিন শর্ত যাচাই। martingale হতে তিনটি জিনিস লাগে: (ক) $(S_n)$ adapted ✓ (উপরে); (খ) প্রতিটি $S_n$ integrable, অর্থাৎ $\mathbb E\lvert S_n\rvert<\infty$ — এখানে $\lvert S_n\rvert\le n$ পরিবদ্ধ, তাই ✓; (গ) মূল সমতা $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n$। তৃতীয়টাই আসল কাজ।

ধাপ ২ — মূল সমতা কষা। লিখি $S_{n+1}=S_n+\xi_{n+1}$, তারপর শর্তাধীন প্রত্যাশার linearity খাটাই: $$ \mathbb E[S_{n+1}\mid\mathcal F_n]=\mathbb E[S_n\mid\mathcal F_n]+\mathbb E[\xi_{n+1}\mid\mathcal F_n]. $$ প্রথম পদে $S_n$ হলো $\mathcal F_n$-পরিমাপযোগ্য (ইতিমধ্যেই জানা), তাই pull-out-এ তা ধ্রুবকের মতো বেরিয়ে আসে: $\mathbb E[S_n\mid\mathcal F_n]=S_n$। দ্বিতীয় পদে $\xi_{n+1}$ হলো $\xi_1,\dots,\xi_n$-এর (তথা $\mathcal F_n$-এর) স্বাধীন (independent), তাই independence rule বলে শর্ত মুছে যায়: $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0$। মিলিয়ে: $$ \boxed{\ \mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+0=S_n.\ } $$ অর্থাৎ "আগামীকালের অবস্থানের সেরা অনুমান, আজকের সব তথ্য হাতে নিয়েও, আজকের অবস্থানই" — $(S_n)$ একটা martingale।

ধাপ ৩ — অপরিবর্তনীয় গড়। martingale-এর সরাসরি ফল: tower property দিয়ে গড় সময়ের সঙ্গে বদলায় না। $\mathbb E[S_{n+1}]=\mathbb E\big[\mathbb E[S_{n+1}\mid\mathcal F_n]\big]=\mathbb E[S_n]$, আর $\mathbb E[S_0]=0$, তাই আরোহণে $$ \mathbb E[S_n]=0\quad\text{সব } n\text{-তে}. $$ হাঁটা যতই দূর যাক, প্রত্যাশিত অবস্থান শূন্যেই থাকে (যদিও ছড়ানো বাড়ে — $\operatorname{Var}(S_n)=n$, উদাহরণ ৬-এ ফিরবে)।

ধাপ ৪ — পক্ষপাত থাকলে আর martingale নয়। ধরা যাক মুদ্রা পক্ষপাতী, $\mathbb P(\xi=+1)=p\ne\tfrac12$, তাই $\mathbb E[\xi]=2p-1=:\mu\ne0$। তখন ধাপ ২-এর শেষ পদ $\mu$ হয়ে দাঁড়ায়: $$ \mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+\mu. $$ $\mu>0$ হলে $\ge S_n$ — submartingale (গড়ে উপরে টানে, খেলোয়াড়ের পক্ষে অনুকূল); $\mu<0$ হলে $\le S_n$ — supermartingale (ক্যাসিনোর মতো প্রতিকূল)। ঠিক $\mu=0$ — ন্যায্যতার সরু সীমা — তেই martingale। (চাইলে $\tilde S_n=S_n-n\mu$ নিয়ে আবার martingale বানানো যায় — এটাই Doob পচনের প্রথম ঝলক, উদাহরণ ৬।)

একটি কোডে দেখা। $\mathbb E[S_n]\approx0$ সিমুলেশনে যাচাই করি:

import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 200_000, 50
xi = rng.choice([-1, 1], size=(paths, steps))   # ±1 fair
S  = xi.cumsum(axis=1)                            # S_1..S_50
print("E[S_10] ≈", round(S[:, 9].mean(),  4))    # ≈ 0
print("E[S_50] ≈", round(S[:, 49].mean(), 4))    # ≈ 0
print("Var(S_50) ≈", round(S[:, 49].var(), 3))   # ≈ 50

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
$\mathbb E[S_{10}]$	$0$	$\approx0$
$\mathbb E[S_{50}]$	$0$	$\approx0$
$\operatorname{Var}(S_{50})$	$n=50$	$\approx50$

সব $\mathbb E[S_n]$ শূন্যের গায়ে, আর ভেদ ঠিক $n=50$ — martingale-সমতার প্রত্যক্ষ ছাপ।

কী শিখলাম। নিরপেক্ষ random walk $S_n=\sum\xi_i$ ($\xi=\pm1$) একটা martingale, কারণ $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0$ (স্বাধীনতা) আর $S_n$ pull-out-এ অটুট, ফলে $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n$; তাই $\mathbb E[S_n]=0$ সব $n$-তে। পক্ষপাত $\mathbb E[\xi]=\mu\ne0$ থাকলে আর নয় — $\mu>0$-এ submartingale, $\mu<0$-এ supermartingale। স্বজ্ঞা: martingale = "ন্যায্য খেলা", যেখানে প্রতি ধাপের প্রত্যাশিত লাভ ঠিক শূন্য; এই একটা মাত্র ভারসাম্যই গোটা তত্ত্বের চালিকাশক্তি, আর পরের সব উদাহরণ এই হাঁটাটাকেই নানা কোণে ঘুরিয়ে দেখবে।

উদাহরণ ২ — Doob martingale $\mathbb E[Y\mid\mathcal F_n]$ (★)¶

সেটআপ। আগের উদাহরণে একটা নির্দিষ্ট প্রক্রিয়া ($S_n$) martingale হলো। এবার একটা আশ্চর্য সাধারণ সত্য: যেকোনো filtration $(\mathcal F_n)$ আর যেকোনো একটিমাত্র integrable random variable $Y$ ($\mathbb E\lvert Y\rvert<\infty$) দিলে, $$ X_n:=\mathbb E[Y\mid\mathcal F_n] $$ সবসময় একটা martingale — একে বলে Doob martingale (ডুব মার্টিঙ্গেল)। স্বজ্ঞাটা সুন্দর: একটা অজানা সংখ্যা $Y$ আছে; সময়ের সঙ্গে তথ্য $\mathcal F_n$ বাড়ছে; $X_n$ হলো "এ-পর্যন্ত যা জানি, তাতে $Y$-এর সেরা অনুমান" — অর্থাৎ $Y$-কে ধাপে-ধাপে উন্মোচন করার প্রক্রিয়া।

ধাপ ১ — তিন শর্ত। (ক) adapted: সংজ্ঞা-অনুযায়ী $\mathbb E[Y\mid\mathcal F_n]$ হলো $\mathcal F_n$-পরিমাপযোগ্য ✓। (খ) integrable: শর্তাধীন প্রত্যাশা $L^1$-সংকোচক, $\mathbb E\lvert X_n\rvert=\mathbb E\big\lvert\mathbb E[Y\mid\mathcal F_n]\big\rvert\le\mathbb E\big[\mathbb E[\lvert Y\rvert\mid\mathcal F_n]\big]=\mathbb E\lvert Y\rvert<\infty$ ✓ (conditional Jensen + tower)। (গ) মূল সমতা — নিচে।

ধাপ ২ — tower property-ই পুরো প্রমাণ। $\mathcal F_n\subseteq\mathcal F_{n+1}$ (filtration বর্ধমান)। তাই tower property-এর স্তর-রূপ ($\mathcal H\subseteq\mathcal G$ হলে $\mathbb E[\mathbb E[Y\mid\mathcal G]\mid\mathcal H]=\mathbb E[Y\mid\mathcal H]$, এখানে $\mathcal H=\mathcal F_n$, $\mathcal G=\mathcal F_{n+1}$) সরাসরি বলে: $$ \mathbb E[X_{n+1}\mid\mathcal F_n]=\mathbb E\big[\mathbb E[Y\mid\mathcal F_{n+1}]\,\big\mid\,\mathcal F_n\big]=\mathbb E[Y\mid\mathcal F_n]=X_n. $$ $$ \boxed{\ \mathbb E[X_{n+1}\mid\mathcal F_n]=X_n.\ } $$ একটিমাত্র সূত্রে — "মোটাটাই জেতে" — Doob martingale-এর martingale-ত্ব প্রমাণিত। কোনো হিসাব নয়, নিছক tower।

ধাপ ৩ — দুই প্রান্ত। $\mathcal F_0=\{\varnothing,\Omega\}$ (কিছুই জানা নেই) হলে $X_0=\mathbb E[Y]$ — শুরুর সেরা অনুমান নিছক গড়। আর যদি $Y$ হয় $\mathcal F_N$-পরিমাপযোগ্য (সময় $N$-এ সব জানা), তবে $X_N=\mathbb E[Y\mid\mathcal F_N]=Y$ — উন্মোচন সম্পূর্ণ। মাঝের $X_n$-গুলো $\mathbb E[Y]$ থেকে $Y$-এর দিকে ক্রমে "ফোকাস" করে।

ধাপ ৪ — একটা কংক্রিট কেস। নাও $Y=S_N$ (উদাহরণ ১-এর হাঁটার শেষ অবস্থান), $\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)$, $n\le N$। তখন $$ X_n=\mathbb E[S_N\mid\mathcal F_n]=\mathbb E\Big[\underbrace{S_n}{\text{জানা}}+\underbrace{(\xi\,\Big\mid\,\mathcal F_n\Big]=S_n+0=S_n. $$ অর্থাৎ এই বিশেষ ক্ষেত্রে Doob martingale হুবহু random walk-ই ফিরিয়ে দেয় — উদাহরণ ১ আসলে উদাহরণ ২-এরই একটা দৃষ্টান্ত! (এই কাঠামোই পরে concentration inequality-তে — যেমন Azuma–Hoeffding — কাজে লাগে, যেখানে }+\cdots+\xi_N)}_{\text{স্বাধীন, গড় }0$Y=f(\xi_1,\dots,\xi_N)$ আর $X_n$ ধাপে-ধাপে উন্মোচন।)

একটি কোডে দেখা। martingale-সমতা $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ সংখ্যায় দেখি — $Y=S_{10}$, $\mathcal F_3$-এর atom-এ ($S_1,S_2,S_3$ স্থির রেখে) $X_4$-এর শর্তাধীন গড় $X_3$-এর সমান হওয়া উচিত:

import numpy as np
rng = np.random.default_rng(20260619)
N, paths = 10, 2_000_000
xi = rng.choice([-1, 1], size=(paths, N))
S  = xi.cumsum(axis=1)
Y  = S[:, N-1]                      # Y = S_10
# F_3 শর্ত: (S_1,S_2,S_3) = (1,2,1) atom-এ আটকে
mask = (S[:,0]==1) & (S[:,1]==2) & (S[:,2]==1)
X3 = S[mask, 2].mean()             # = 1 (ধ্রুব, atom-এ)
X4 = Y[mask].mean()                # E[Y | F_3] উপর F_4-গড় = E[Y|F_3]
print("X_3 =", round(X3,4), " E[X_4|F_3] =", round(X4,4))  # 1.0  ≈ 1.0

কী শিখলাম। যেকোনো integrable $Y$-এর জন্য $X_n=\mathbb E[Y\mid\mathcal F_n]$ আপনাআপনি একটা martingale — প্রমাণ নিছক tower property, কারণ $\mathcal F_n\subseteq\mathcal F_{n+1}$ থাকায় $\mathbb E[\mathbb E[Y\mid\mathcal F_{n+1}]\mid\mathcal F_n]=\mathbb E[Y\mid\mathcal F_n]$। স্বজ্ঞা: $X_n$ হলো $Y$-এর "ধাপে-ধাপে উন্মোচন" — শুরুতে $\mathbb E[Y]$, শেষে $Y$, মাঝে ক্রমশ ধারালো অনুমান; martingale-ত্ব মানে নতুন তথ্য যোগ হলেও অনুমান গড়ে পক্ষপাতহীন (নিরপেক্ষ)। এটিই martingale-এর সবচেয়ে উর্বর উৎস — উদাহরণ ১-এর random walk-ও এর একটা বিশেষ রূপ — আর 7.9-এর convergence-তত্ত্ব ঠিক এই "অনুমান শেষমেশ স্থির হয়" ঘটনাটাকে কঠোর করে।

উদাহরণ ৩ — martingale transform: ন্যায্য খেলা হারানো যায় না (★★)¶

সেটআপ। একটা ন্যায্য খেলা — random walk $S_n$ (উদাহরণ ১) — আর একজন খেলোয়াড় যে প্রতি দানে বাজি ধরে। ধরা যাক $n$-তম দানে সে $H_n$ টাকা বাজি রাখে, আর সেই দানে ফল $\xi_n=S_n-S_{n-1}=\pm1$, তাই তার ঐ-দানের লাভ $H_n\,\xi_n$। মোট জমা-লাভ $$ (H\cdot S)n=\sum^n H_k\,\xi_k. $$ একে বলে }^n H_k\,(S_k-S_{k-1})=\sum_{k=1martingale transform। গুরুত্বপূর্ণ শর্ত: বাজি $H_n$ হতে হবে predictable — অর্থাৎ $\mathcal F_{n-1}$-পরিমাপযোগ্য, "দান খেলার আগেই" ঠিক করা (আগের সব ফল দেখে যা খুশি কৌশল নাও, কিন্তু এ-দানের ফল $\xi_n$ আগে জানতে পারবে না — সেটাই হলে জুয়া নয়, জাদু)। দাবি: predictable বাজিতেও ন্যায্য খেলা হারানো যায় না — $(H\cdot S)_n$ আবার martingale।

ধাপ ১ — এক-ধাপের লাভ গড়ে শূন্য। $\Delta_n:=(H\cdot S)_n-(H\cdot S)_{n-1}=H_n\xi_n$। এর শর্তাধীন প্রত্যাশা নিই $\mathcal F_{n-1}$-এ। যেহেতু $H_n$ হলো $\mathcal F_{n-1}$-পরিমাপযোগ্য (predictable!), pull-out-এ তা বেরিয়ে আসে: $$ \mathbb E[H_n\xi_n\mid\mathcal F_{n-1}]=H_n\,\mathbb E[\xi_n\mid\mathcal F_{n-1}]=H_n\cdot 0=0, $$ কারণ $\xi_n$ হলো $\mathcal F_{n-1}$-এর স্বাধীন আর $\mathbb E[\xi_n]=0$ (independence rule)। এটাই গোটা যুক্তির হৃদয়: predictability বলেই $H_n$-কে ধ্রুবকের মতো বার করা গেল; নইলে (যদি $H_n$ আজকের ফল দেখে ঠিক হতো) $\mathbb E[H_n\xi_n]$ ধনাত্মক বানানো যেত — কিন্তু সেটা নিয়মভঙ্গ।

ধাপ ২ — তাই martingale। $(H\cdot S)_{n-1}$ হলো $\mathcal F_{n-1}$-পরিমাপযোগ্য, তাই $$ \mathbb E[(H\cdot S)n\mid\mathcal F]=(H\cdot S){n-1}+\underbrace{\mathbb E[H_n\xi_n\mid\mathcal F}]{=\,0}=(H\cdot S). $$ $$ \boxed{\ \mathbb E[(H\cdot S)n\mid\mathcal F $$ }]=(H\cdot S)_{n-1},\qquad \mathbb E[(H\cdot S)_n]=0.\ martingale-এর predictable রূপান্তর আবার martingale (ধরে নিচ্ছি $H_n$ পরিবদ্ধ, যাতে integrability ঠিক থাকে)। গড় থাকে শূন্য — অর্থাৎ গড়ে কোনো বাজি-কৌশল ন্যায্য খেলায় লাভ আনতে পারে না। এটিই "no system beats a fair game"-এর কঠোর বিবৃতি।

ধাপ ৩ — কংক্রিট কৌশল: "যা জিতি তার দ্বিগুণ বাজি"। একটা সক্রিয় কৌশল নিই: শুরুতে $H_1=1$; এরপর আগের দানে জিতলে বাজি দ্বিগুণ ($H_n=2H_{n-1}$), হারলে $1$-এ রিসেট। লক্ষ করো $H_n$ ঠিক করতে কেবল $\xi_1,\dots,\xi_{n-1}$ লাগে — তাই predictable ✓। যত চটকদারই হোক, ধাপ ১–২ অনুযায়ী $\mathbb E[(H\cdot S)_n]=0$ থাকতেই হবে। সিমুলেশন এটাই দেখাবে (নিচে)।

ধাপ ৪ — একটা সতর্কবাণী (martingale doubling)। "ন্যায্য খেলা হারানো যায় না" কথাটা নির্দিষ্ট সময় $n$-এ সত্য। কুখ্যাত doubling strategy (হারলে বাজি দ্বিগুণ করে যাও যতক্ষণ না একবার জিতি) থামার সময় $\tau$-তে $+1$ নিশ্চিত করে — কিন্তু সেটা অসীম মূলধন ও অসীম অপেক্ষা চায়, আর ঠিক optional stopping-এর শর্ত ভাঙে বলেই $\mathbb E[(H\cdot S)_\tau]\ne0$ সম্ভব হয়। এই ফাটলটাই উদাহরণ ৫-এর বিষয়; এখানে মনে রাখি — পরিবদ্ধ কৌশলে, স্থির সময়ে, ন্যায্য খেলা ন্যায্যই থাকে।

একটি কোডে দেখা। উপরের "জিতলে দ্বিগুণ" কৌশলে $\mathbb E[(H\cdot S)_{30}]\approx0$ যাচাই করি:

import numpy as np
rng = np.random.default_rng(20260619)
paths, N = 300_000, 30
xi = rng.choice([-1, 1], size=(paths, N))
H  = np.ones(paths)                 # H_1 = 1
wealth = np.zeros(paths)
prev = np.zeros(paths, dtype=int)   # আগের দানের ফল (k=0 ধাপের আগে 0 ধরা)
for k in range(N):
    if k > 0:
        H = np.where(prev > 0, 2*H, 1.0)   # জিতলে দ্বিগুণ, হারলে 1 (predictable)
    wealth += H * xi[:, k]                   # H_k * ξ_k
    prev = xi[:, k]
print("E[(H·S)_30] ≈", round(wealth.mean(), 4))   # ≈ 0

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
$\mathbb E[(H\cdot S)_{30}]$ ("জিতলে দ্বিগুণ")	$0$	$\approx0$

কৌশল যত চালাকই হোক, স্থির সময়ে প্রত্যাশিত লাভ শূন্যেই ঠেকে।

কী শিখলাম। predictable বাজি-কৌশল $H_n$ ($\mathcal F_{n-1}$-পরিমাপযোগ্য) ন্যায্য খেলায় লাগালে জমা-লাভ $(H\cdot S)_n=\sum H_k\xi_k$ আবার martingale, $\mathbb E[(H\cdot S)_n]=0$ — কোনো কৌশল ন্যায্য খেলা হারাতে পারে না। মূল চাবি: predictability বলেই pull-out-এ $\mathbb E[H_n\xi_n\mid\mathcal F_{n-1}]=H_n\mathbb E[\xi_n\mid\mathcal F_{n-1}]=0$। স্বজ্ঞা: আজকের ফল আগে জানতে না পারলে বাজি যত খুশি বদলাও — গড়ে শূন্যই থাকবে; "doubling"-জাতীয় ব্যতিক্রম কাজ করে কেবল অসীম মূলধন/সময় ধার করে, যা পরের উদাহরণের optional-stopping-ভঙ্গের সঙ্গে এক সুতোয় বাঁধা। এই martingale transform-ই হলো নিরবচ্ছিন্ন (continuous-time) স্টোক্যাস্টিক ইন্টিগ্রেশনের বিচ্ছিন্ন পূর্বসূরি।

উদাহরণ ৪ — optional stopping ও gambler's ruin (★★)¶

সেটআপ। জুয়াড়ির সর্বনাশ (gambler's ruin) — চিরায়ত সমস্যা। নিরপেক্ষ হাঁটা $S_n$ শুরু $0$ থেকে, দুটো বাধা (barrier): নিচে $-a$ আর উপরে $+b$, এখানে $a=8,\ b=4$। stopping time $$ \tau=\inf{n\ge0:\ S_n=-a\ \text{বা}\ S_n=+b} $$ — যে মুহূর্তে হাঁটা কোনো এক বাধা ছোঁয়। (এটি বৈধ stopping time, কারণ $\{\tau\le n\}$ নির্ধারণে কেবল $S_0,\dots,S_n$ লাগে।) দুটো প্রশ্ন: উপরের বাধা $+b$ আগে ছোঁয়ার সম্ভাবনা কত, আর গড়ে কত ধাপে খেলা শেষ হয়?

ধাপ ১ — optional stopping theorem-এর শর্ত যাচাই। OST বলে: যথাযথ শর্তে martingale-এর গড় থামার সময়েও অপরিবর্তিত, $\mathbb E[S_\tau]=\mathbb E[S_0]=0$। শর্ত তিনটির যেকোনো একটা যথেষ্ট; এখানে সবচেয়ে পরিষ্কারটা ধরি — $\mathbb E[\tau]<\infty$ এবং বৃদ্ধি পরিবদ্ধ ($\lvert S_n-S_{n-1}\rvert=1\le1$)। দুই বাধার মাঝে আটকে থাকায় হাঁটা নিশ্চিতভাবে শেষ হয় আর গড় সময় সসীম (ধাপ ৩-এ $\mathbb E[\tau]=32$ দেখব), তাই OST প্রয়োগযোগ্য ✓। (এই শর্ত-যাচাইটাই আসল — উদাহরণ ৫-এ দেখব শর্ত ভাঙলে কী হয়।)

ধাপ ২ — এক সমীকরণে সম্ভাবনা। থামার সময় $S_\tau$ ঠিক দুটো মান নেয়: $+b$ (সম্ভাবনা $p:=\mathbb P(\text{hit }+b)$) অথবা $-a$ (সম্ভাবনা $1-p$)। OST থেকে $\mathbb E[S_\tau]=0$, তাই $$ 0=\mathbb E[S_\tau]=(+b)\,p+(-a)\,(1-p)=b\,p-a(1-p). $$ $p$ বার করি: $$ b\,p-a+a\,p=0\ \Rightarrow\ p(a+b)=a\ \Rightarrow\ \boxed{\ p=\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac{8}{12}=\frac23\approx0.6667.\ } $$ লক্ষণীয় কাব্য: উপরের বাধা কাছে ($b=4$ ছোট) বলেই তা ছোঁয়ার সম্ভাবনা বেশি ($\tfrac23$) — দূরত্ব $a$ যত বড়, ও-দিকে যাওয়া তত কঠিন, তাই বিপরীত $\tfrac{a}{a+b}$। আর নিচের সর্বনাশের সম্ভাবনা $1-p=\tfrac{b}{a+b}=\tfrac4{12}=\tfrac13$।

ধাপ ৩ — গড় স্থিতিকাল (দ্বিতীয় martingale দিয়ে)। $\mathbb E[\tau]$ পেতে $S_n^2-n$ martingale খাটাই (উদাহরণ ৬-এ প্রমাণ; $\mathbb E[S_n^2-n]=0$)। OST আবার লাগিয়ে $\mathbb E[S_\tau^2-\tau]=0$, অর্থাৎ $\mathbb E[\tau]=\mathbb E[S_\tau^2]$। কিন্তু $S_\tau\in\{+b,-a\}$, তাই $$ \mathbb E[S_\tau^2]=b^2\,p+a^2(1-p)=b^2\cdot\tfrac{a}{a+b}+a^2\cdot\tfrac{b}{a+b}=\frac{ab(b+a)}{a+b}=ab. $$ $$ \boxed{\ \mathbb E[\tau]=ab=8\times4=32.\ } $$ সুন্দর সমমিতি: গড় স্থিতিকাল ঠিক দুই দূরত্বের গুণফল $ab$ — কাছের বাধা যত দূরে সরে, খেলা তত দীর্ঘ।

ধাপ ৪ — সিমুলেশনে যাচাই। $-8/+4$ বাধায় বহু হাঁটা চালাই, তিন রাশি মাপি:

import numpy as np
rng = np.random.default_rng(20260619)
a, b, trials = 8, 4, 200_000
hitB = np.zeros(trials); Stau = np.zeros(trials); tau = np.zeros(trials)
for t in range(trials):
    s, n = 0, 0
    while -a < s < b:
        s += rng.choice([-1, 1]); n += 1
    hitB[t] = (s == b); Stau[t] = s; tau[t] = n
print("P(hit +b) ≈", round(hitB.mean(), 4))   # ≈ 0.667
print("E[S_tau]  ≈", round(Stau.mean(), 4))   # ≈ 0
print("E[tau]    ≈", round(tau.mean(), 2))    # ≈ 32

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
$\mathbb P(\text{hit }+b)$	$\tfrac{a}{a+b}=\tfrac23\approx0.6667$	$\approx0.67$
$\mathbb E[S_\tau]$	$0$	$\approx0$
$\mathbb E[\tau]$	$ab=32$	$\approx32$

তিনটেই তত্ত্বের গায়ে — $+b$-ছোঁয়া $\approx0.67$, থামার-গড় $\approx0$ (OST নিশ্চিত), স্থিতিকাল $\approx32$।

কী শিখলাম। OST-এর শর্ত মিটলে ($\mathbb E[\tau]<\infty$, পরিবদ্ধ বৃদ্ধি) $\mathbb E[S_\tau]=\mathbb E[S_0]=0$, আর দুই-মান $S_\tau\in\{+b,-a\}$ ভেঙে gambler's ruin এক লাইনে সমাধান হয়: $\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac23$, আর $S_n^2-n$ martingale দিয়ে $\mathbb E[\tau]=ab=32$। স্বজ্ঞা: ন্যায্য খেলায় থামার সময়েও গড় শূন্য, তাই কাছের বাধা বেশি-সম্ভাব্য কিন্তু খেলা শেষ হতে দুই দূরত্বের গুণফল-সময় লাগে। এটিই OST-এর সবচেয়ে নির্ভরযোগ্য প্রয়োগ — শর্ত যাচাই করে, তারপর "থামার সময়ে গড় টানা যায়" বলে এক সমীকরণে উত্তর; পরের উদাহরণ দেখাবে শর্ত যাচাই বাদ দিলে এই হাতিয়ার কীভাবে বিশ্বাসঘাতকতা করে।

উদাহরণ ৫ — কখন optional stopping ভাঙে (★★)¶

সেটআপ। এবার বিপদ। একই নিরপেক্ষ হাঁটা $S_n$ ($S_0=0$), কিন্তু এবার একটিমাত্র বাধা — শুধু উপরে, $+1$: $$ \tau=\inf{n\ge0:\ S_n=1}\qquad(\text{প্রথম-উত্তরণ }+1\text{-তে}). $$ পরিচিত সত্য (recurrence of symmetric walk, 7.6/7.9): এক-মাত্রিক নিরপেক্ষ হাঁটা পুনরাবৃত্ত (recurrent), তাই $+1$-তে নিশ্চিতভাবেই একদিন পৌঁছায় — $\mathbb P(\tau<\infty)=1$। প্রলোভন: "OST লাগাই, $\mathbb E[S_\tau]=\mathbb E[S_0]=0$"। দেখি কী হয়।

ধাপ ১ — বিরোধ। $\tau<\infty$ সর্বত্র (a.s.), আর থামার সংজ্ঞাতেই $S_\tau=1$ সবসময় — যেহেতু থামিই কেবল $+1$ ছুঁলে। তাই $$ \mathbb E[S_\tau]=\mathbb E[1]=1\ \neq\ 0=S_0. $$ $$ \boxed{\ \mathbb E[S_\tau]=1\neq\mathbb E[S_0]=0\ \Rightarrow\ \text{OST এখানে খাটে না।}\ } $$ "ন্যায্য খেলা" থেকে নিশ্চিত $+1$ লাভ আদায় হলো — অথচ random walk তো martingale! অসংগতিটা কোথায়?

ধাপ ২ — কোন শর্ত ভাঙল। OST-এর কোনো অনুমানই এখানে ধরে না: - $\mathbb E[\tau]<\infty$? না — নিরপেক্ষ হাঁটার $+1$-উত্তরণ-সময়ের $\mathbb E[\tau]=\infty$ (নিশ্চিত পৌঁছায় বটে, কিন্তু গড়ে অসীম দীর্ঘ — "ভারী লেজ", $\mathbb P(\tau=n)\sim n^{-3/2}$, যার গড় অপসারী)। এই একটাই ভাঙন যথেষ্ট। - থামা পর্যন্ত পরিবদ্ধতা? না — $+1$ ছোঁয়ার আগে হাঁটা যত খুশি নিচে নামতে পারে, $\inf_n S_{n\wedge\tau}=-\infty$, তাই $(S_{n\wedge\tau})$ পরিবদ্ধ নয় এবং uniformly integrable-ও নয়। - পরিবদ্ধ-সময়ে থামা? না — $\tau$-এর কোনো ঊর্ধ্বসীমা নেই।

তিন দরজাই বন্ধ, তাই $\mathbb E[S_\tau]=\mathbb E[S_0]$ নিশ্চিত করার কোনো ভিত্তি নেই — আর বাস্তবে তা মেলেও না।

ধাপ ৩ — কোথায় "ভর পালায়"। স্বজ্ঞা: থামা-পর্যন্ত হাঁটা $S_{n\wedge\tau}$ যেকোনো স্থির $n$-তে গড়-শূন্য (martingale, $\mathbb E[S_{n\wedge\tau}]=0$)। কিন্তু $n\to\infty$-তে এই ভারসাম্য একটা "$+1$-এ থেমে যাওয়া বড় ভর" আর "এখনো-অনেক-নিচে ঝুলে থাকা ছোট কিন্তু গভীর ভর"-এর মধ্যে টিকে থাকে। সীমায় নিচের লেজটা মুছে যায় না বরং অসীম-গভীরে সরে যায়, ফলে সীমা-আদানপ্রদান $\lim\mathbb E[S_{n\wedge\tau}]\ne\mathbb E[\lim S_{n\wedge\tau}]=\mathbb E[S_\tau]$ অবৈধ — ঠিক DCT-এর dominating function না-থাকার ব্যর্থতা। OST আসলে এই সীমা-আদানপ্রদানেরই একটা মোড়ক, তাই শর্তগুলো (UI / পরিবদ্ধতা / $\mathbb E[\tau]<\infty$) সেখানেই পাহারা দেয়।

ধাপ ৪ — সিমুলেশনের সততা। কম্পিউটারে $\mathbb E[\tau]=\infty$ ধরা যায় না, কিন্তু লক্ষণ দেখা যায়: সময়-সীমা $T$ বাড়ালে থামার গড় $S_{T\wedge\tau}$ ধীরে-ধীরে $0$-এর দিকে ঝোঁকে (যত পথ এখনো নিচে ঝুলে আছে, তাদের গভীর ঋণ গড়কে টেনে নামায়), অথচ যেগুলো ইতিমধ্যে থেমেছে তারা $+1$-এ। প্লট করলে $T$-এর সঙ্গে গড় ক্রমে নামে, $1$-এ থিতু হয় না — "$\mathbb E[\tau]=\infty$"-এর ছাপ:

import numpy as np
rng = np.random.default_rng(20260619)
paths = 100_000
for T in (100, 1_000, 10_000):
    s = np.zeros(paths); stopped = np.zeros(paths, bool)
    for _ in range(T):
        live = ~stopped
        s[live] += rng.choice([-1, 1], size=live.sum())
        stopped |= (s >= 1)
    frac = stopped.mean()                      # T-এর মধ্যে থামার ভগ্নাংশ
    print(f"T={T:>6}: P(τ≤T)≈{frac:.3f}, E[S_(T∧τ)]≈{s.mean():+.3f}")
# T বাড়লে P(τ≤T) 1-এর দিকে ধীরে ওঠে, কিন্তু E[S_(T∧τ)] 0-এর কাছেই থাকে — 1-এ নয়

সময়-সীমা $T$	$\mathbb P(\tau\le T)$	$\mathbb E[S_{T\wedge\tau}]$ (martingale ⇒ $\approx0$)
$100$	$<1$	$\approx0$
$1{,}000$	$\uparrow$ ১-এর দিকে	$\approx0$
$10{,}000$	আরও কাছে	$\approx0$

স্থির $T$-তে $\mathbb E[S_{T\wedge\tau}]\approx0$ (martingale অটুট); শুধু $T\to\infty$-এর সীমায় $S_\tau\equiv1$ হয়ে $\mathbb E$ লাফিয়ে $1$ হয় — সেই অবৈধ সীমা-আদানপ্রদানই OST-ভঙ্গ।

কী শিখলাম। OST-এর শর্ত নিছক সাজসজ্জা নয় — শর্ত ভাঙলে উপপাদ্যও ভাঙে। $+1$-প্রথম-উত্তরণে $\mathbb P(\tau<\infty)=1$ ও $S_\tau\equiv1$, তাই $\mathbb E[S_\tau]=1\neq0=S_0$ — কারণ $\mathbb E[\tau]=\infty$ এবং থামা-পর্যন্ত হাঁটা পরিবদ্ধ/UI নয়, ফলে $\lim\mathbb E[S_{n\wedge\tau}]\ne\mathbb E[S_\tau]$ (DCT-ব্যর্থতার মুখোশ)। স্বজ্ঞা: নিশ্চিত-পৌঁছানো $\ne$ দ্রুত-পৌঁছানো; "ন্যায্য খেলা থেকে নিশ্চিত লাভ" কেবল অসীম ধৈর্য ও অসীম ঋণ-ক্ষমতা ধার করেই সম্ভব (উদাহরণ ৩-এর doubling-এর যমজ)। নৈতিকতা: martingale-যুক্তিতে $\mathbb E[X_\tau]=\mathbb E[X_0]$ লেখার আগে সবসময় কোনো-একটা OST-শর্ত আগে যাচাই করতে হবে — নইলে উত্তর ভুল হতে বাধ্য।

উদাহরণ ৬ — Doob decomposition $S_n^2-n$ (★★)¶

সেটআপ। martingale $S_n$ নিজে গড়-শূন্য, কিন্তু তার ছড়ানো বাড়ে — আর সেই বৃদ্ধিটাকে ধরা যায় $S_n^2$ দেখে। প্রশ্ন: $S_n^2$ কি martingale? উত্তর — না, submartingale; আর তার থেকে ঠিক কতটা "প্রবণতা" বাদ দিলে আবার martingale মেলে? সেটিই Doob decomposition-এর প্রশ্ন, আর উত্তরটা চমৎকার সরল: $A_n=n$।

ধাপ ১ — $S_n^2$ একটা submartingale। $S_{n+1}=S_n+\xi_{n+1}$, তাই $S_{n+1}^2=S_n^2+2S_n\xi_{n+1}+\xi_{n+1}^2$। শর্তাধীন প্রত্যাশা নিই $\mathcal F_n$-এ, প্রতি পদ আলাদা করে: $$ \mathbb E[S_{n+1}^2\mid\mathcal F_n]=\underbrace{S_n^2}{\text{pull-out}}+2S_n\underbrace{\mathbb E[\xi}\mid\mathcal F_n]{=\,0}+\underbrace{\mathbb E[\xi}^2\mid\mathcal F_n]{=\,1}. $$ এখানে $S_n^2$ ও $2S_n$ হলো $\mathcal F_n$-পরিমাপযোগ্য (pull-out), $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0$ (স্বাধীনতা), আর $\xi_{n+1}^2=1$ সবসময় (কারণ $(\pm1)^2=1$) বলে তার শর্তাধীন প্রত্যাশাও $1$। মিলিয়ে: $$ \boxed{\ \mathbb E[S $$ }^2\mid\mathcal F_n]=S_n^2+1\ \ge\ S_n^2.\ $\ge$ চিহ্নই বলে $S_n^2$ submartingale — প্রতি ধাপে গড়ে ঠিক $+1$ করে উপরে টানে। (স্বজ্ঞা: হাঁটা যেদিকেই যাক, $S^2$ গড়ে বাড়ে, কারণ ছড়ানো জমতে থাকে।)

ধাপ ২ — ক্ষতিপূরক আলাদা করা। যেহেতু বৃদ্ধি ধাপ-প্রতি ঠিক $+1$, "অতিরিক্ত প্রবণতা" সরাতে $n$ বিয়োগ করি। ধরা যাক $$ M_n:=S_n^2-n. $$ শর্তাধীন প্রত্যাশা: $$ \mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[S_{n+1}^2\mid\mathcal F_n]-(n+1)=(S_n^2+1)-(n+1)=S_n^2-n=M_n. $$ $$ \boxed{\ \mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\ \Rightarrow\ M_n=S_n^2-n\ \text{একটা martingale}.\ } $$ আর $\mathbb E[M_n]=\mathbb E[M_0]=0$, অর্থাৎ $\mathbb E[S_n^2]=n$ — যা ঠিক $\operatorname{Var}(S_n)=n$ (যেহেতু $\mathbb E[S_n]=0$)। এটাই Doob decomposition: submartingale $S_n^2 = \underbrace{M_n}_{\text{martingale}} + \underbrace{A_n}_{\text{compensator}}$, যেখানে $A_n=n$ — একটা predictable, বর্ধমান প্রক্রিয়া ($A_0=0$, $A_n-A_{n-1}=1\ge0$, আর $A_n$ ধ্রুব বলে তুচ্ছভাবে $\mathcal F_{n-1}$-পরিমাপযোগ্য)।

ধাপ ৩ — $A_n=n$-এর অর্থ: quadratic variation। ক্ষতিপূরক $A_n$ মাপে "এ-পর্যন্ত কতটা তারতম্য জমেছে"। এখানে প্রতি ধাপের শর্তাধীন ভেদ $\mathbb E[\xi_{n+1}^2\mid\mathcal F_n]=1$, তাই $n$ ধাপে মোট $n$ — একে বলে quadratic variation / predictable variation (বর্গ-প্রকরণ), প্রতীকে $\langle S\rangle_n=n$। সাধারণ ছবি: যেকোনো $L^2$-martingale $X_n$-এর জন্য $X_n^2-\langle X\rangle_n$ martingale, যেখানে $\langle X\rangle_n=\sum_{k\le n}\mathbb E[(X_k-X_{k-1})^2\mid\mathcal F_{k-1}]$ — জমা-হওয়া শর্তাধীন ভেদ। random walk-এ প্রতি ধাপের ভেদ $1$ বলে তা নিছক $n$। এই $\langle S\rangle_n$-ই 7.9-এর $L^2$-পরিবদ্ধ martingale convergence-এর চাবি ($\sup_n\mathbb E[X_n^2]<\infty\iff\mathbb E[\langle X\rangle_\infty]<\infty$) এবং continuous-time-এ Itô-ক্যালকুলাসের কেন্দ্রীয় বস্তু।

একটি কোডে দেখা। $\mathbb E[S_n^2-n]\approx0$ (অর্থাৎ $\mathbb E[S_n^2]\approx n$) সব $n$-তে যাচাই করি:

import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 400_000, 40
xi = rng.choice([-1, 1], size=(paths, steps))
S  = xi.cumsum(axis=1)
n  = np.arange(1, steps+1)
ES2   = (S**2).mean(axis=0)        # E[S_n^2] প্রতি n-এ
print("E[S_5^2]  =", round(ES2[4],  3), " (তত্ত্ব 5 )")    # ≈ 5
print("E[S_40^2] =", round(ES2[39], 3), " (তত্ত্ব 40)")    # ≈ 40
print("max |E[S_n^2 - n]| =", round(np.abs(ES2 - n).max(), 3))  # ≈ 0

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
$\mathbb E[S_5^2]$	$5$	$\approx5$
$\mathbb E[S_{40}^2]$	$40$	$\approx40$
$\mathbb E[M_n]=\mathbb E[S_n^2-n]$	$0$ (সব $n$)	$\approx0$

প্রতি $n$-তে $\mathbb E[S_n^2]\approx n$, তাই $\mathbb E[S_n^2-n]\approx0$ — $M_n=S_n^2-n$ সত্যিই গড়-শূন্য martingale।

কী শিখলাম। $S_n^2$ একটা submartingale ($\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2$, কারণ $\xi^2=1$ সবসময়), আর $M_n=S_n^2-n$ একটা martingale — এটিই Doob decomposition: $S_n^2=M_n+A_n$ যেখানে predictable বর্ধমান ক্ষতিপূরক $A_n=n$। ফলে $\mathbb E[S_n^2]=n=\operatorname{Var}(S_n)$। স্বজ্ঞা: ক্ষতিপূরক $A_n=\langle S\rangle_n$ হলো "এ-পর্যন্ত জমা-হওয়া তারতম্য" (quadratic variation) — হাঁটার গড় শূন্য থাকলেও তার ছড়ানো ঠিক রৈখিক হারে জমে, আর সেই জমা-হওয়া অংশটাই বাদ দিলে আবার ন্যায্য martingale ফেরে। উদাহরণ ৪-এ এই $M_n$-ই $\mathbb E[\tau]=ab$ বার করতে কাজে লাগল, আর 7.9-এ $\langle S\rangle_n$ হবে $L^2$-martingale convergence ও স্টোক্যাস্টিক ইন্টিগ্রেশনের ভিত্তিপ্রস্তর।

৪ · প্রমাণ ও উৎপাদন¶

এই অংশে §১–২-এ বিবৃত martingale (মার্টিঙ্গেল — "ন্যায্য খেলা"র random process) তত্ত্বের কেন্দ্রীয় ফলগুলো ধাপে ধাপে উৎপাদন (derive) করা হয় — সবগুলোই 7.7-এর শর্তাধীন প্রত্যাশা (conditional expectation) $\mathbb E[\cdot\mid\mathcal F_n]$-এর তিনটি কর্মঘোড়ার উপর দাঁড়ায়: tower (পুনরাবৃত্ত প্রত্যাশা, $\mathcal H\subseteq\mathcal G\Rightarrow\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H]$), pull-out (জানা-জিনিস বাইরে আনা, $Y$ $\mathcal G$-measurable হলে $\mathbb E[YX\mid\mathcal G]=Y\,\mathbb E[X\mid\mathcal G]$), এবং linearity (রৈখিকতা) — তিনটিই 7.7-§৪-এ প্রমাণিত, এখানে নাম ধরে অবাধে ব্যবহৃত। যুক্তি-শৃঙ্খল একমুখী: প্রমাণ ৬ (constant mean + centered-sum) ভিত্তি; প্রমাণ ১ (martingale transform) থেকে প্রমাণ ২ (stopped process) সরাসরি বেরোয়; প্রমাণ ২ থেকে প্রমাণ ৩ (optional stopping theorem) তিনটি অনুমান-গুচ্ছে; প্রমাণ ৩-কে কাজে লাগিয়ে প্রমাণ ৪ (gambler's ruin); আর প্রমাণ ৫ (Doob decomposition) submartingale-কে martingale + predictable অংশে ভাঙে, যা $S_n^2-n$-কে martingale প্রমাণ করে প্রমাণ ৪-এর শেষ ধাপ পূরণ করে। প্রতিটি প্রমাণের শিরোনামে কঠিনতা-চিহ্ন (difficulty tag):

★ — মৌলিক, প্রথম পাঠেই বোঝা উচিত।
★★ — মাঝারি, একটু কৌশল লাগে।
★★★ — গভীর, প্রথম পাঠে কিছু অংশ এড়িয়ে যাওয়া যায় (যথাস্থানে চিহ্নিত)।

স্মরণ — সংজ্ঞা ও সংকেত (§১–২ থেকে)। গোটা অংশে $(\Omega,\mathcal F,\mathbb P)$ একটি probability space, আর $(\mathcal F_n)_{n\ge 0}$ একটি filtration (পরিস্রাবণ) — অর্থাৎ ক্রমবর্ধমান sub-σ-algebra-শৃঙ্খল $\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\subseteq\mathcal F$, যেখানে $\mathcal F_n$ মানে "$n$ সময় পর্যন্ত জানা তথ্য"। একটি process $(X_n)_{n\ge 0}$ adapted (অভিযোজিত) যদি প্রতিটি $X_n$ হয় $\mathcal F_n$-measurable, আর সব $X_n\in L^1$ (অর্থাৎ $\mathbb E\lvert X_n\rvert<\infty$)। এমন adapted, integrable $(X_n)$ একটি martingale যদি

\[ \mathbb E[X_{n+1}\mid\mathcal F_n]\ =\ X_n\quad\text{a.s.}\qquad(\forall\,n\ge 0), \]

submartingale (অধো-মার্টিঙ্গেল) যদি $\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n$ a.s., এবং supermartingale (ঊর্ধ্ব-মার্টিঙ্গেল) যদি $\le$। (এখানে $\mid$ সবসময় conditioning — শর্তাধীনতা — কখনোই $\lvert\cdot\rvert$ নয়।) একটি random variable $\tau:\Omega\to\{0,1,2,\dots\}\cup\{\infty\}$ একটি stopping time (থামার সময়) যদি প্রতিটি $n$-এর জন্য $\{\tau\le n\}\in\mathcal F_n$ — অর্থাৎ "$n$ সময়ের মধ্যে থেমেছি কি না" তা $n$ পর্যন্ত-জানা তথ্যেই নির্ধারিত (ভবিষ্যৎ দেখে থামা যায় না)। $n\wedge\tau:=\min(n,\tau)$, আর predictable (পূর্বানুমেয়) process $(H_n)_{n\ge 1}$ মানে প্রতিটি $H_n$ হয় $\mathcal F_{n-1}$-measurable — অর্থাৎ "$n$-তম বাজি $H_n$ আগের ধাপের তথ্যেই ঠিক করা" (ভবিষ্যৎ না দেখে)।

আগে একবার — দুটি ছোট অথচ বারবার-লাগা মৌলিক fact:

(increment-form / বৃদ্ধি-রূপ) $(X_n)$ martingale হওয়া ⟺ প্রতিটি $n$-এ $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ a.s. (martingale increment বা martingale difference $D_{n+1}:=X_{n+1}-X_n$-এর শর্তাধীন গড় শূন্য) — কারণ $X_n$ নিজে $\mathcal F_n$-measurable, তাই linearity-তে $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=\mathbb E[X_{n+1}\mid\mathcal F_n]-X_n$ (pull-out/ধ্রুবক-নিয়মে $\mathbb E[X_n\mid\mathcal F_n]=X_n$, যেহেতু $X_n$ ইতিমধ্যে $\mathcal F_n$-জানা)। এই $=0$-রূপই নিচে প্রায় সর্বত্র লাগবে।
(stopping time-এর সমতুল্য রূপ) $\{\tau\le n\}\in\mathcal F_n$ সব $n$-তে ⟺ $\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}$ সব $n\ge 1$-তে — কারণ $\{\tau\le n-1\}\in\mathcal F_{n-1}$ (সংজ্ঞা) এবং σ-algebra পরিপূরকে বদ্ধ। তাই indicator $\mathbf 1_{\{\tau\ge n\}}$ হলো $\mathcal F_{n-1}$-measurable — এই একটিমাত্র পর্যবেক্ষণই প্রমাণ ২-কে প্রমাণ ১-এর বিশেষ রূপ বানায়।

প্রমাণ ৬ — martingale property ⇒ ধ্রুব গড়, এবং একটি centered-sum martingale (★)¶

প্রথমে সবচেয়ে মৌলিক দুটি ফল রাখি — একটি গোটা অংশের sanity-check, অন্যটি martingale-এর প্রধান উদাহরণ-কারখানা।

দাবি (ক) — ধ্রুব গড় (constant mean)। যেকোনো martingale $(X_n)$-এর জন্য $\mathbb E[X_n]=\mathbb E[X_0]$ সব $n\ge 0$-তে।

ধাপ ১ — tower নামিয়ে শর্ত মুছে ফেলা। martingale-সংজ্ঞা $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s.। দুই পাশে নিঃশর্ত প্রত্যাশা নিই; বাঁ পাশে tower-এর বিশেষ রূপ (7.7-প্রমাণ ২, $\mathcal H=\{\varnothing,\Omega\}$ তুচ্ছ) — $\mathbb E\bigl[\mathbb E[X_{n+1}\mid\mathcal F_n]\bigr]=\mathbb E[X_{n+1}]$ (law of total expectation), আর ডান পাশে $\mathbb E[X_n]$:

\[ \mathbb E[X_{n+1}]\ =\ \mathbb E\bigl[\mathbb E[X_{n+1}\mid\mathcal F_n]\bigr]\ =\ \mathbb E[X_n]. \]

ধাপ ২ — আরোহ (induction)। তাই $\mathbb E[X_{n+1}]=\mathbb E[X_n]$ সব $n$-তে; $n=0,1,2,\dots$-এ পরপর প্রয়োগে $\mathbb E[X_n]=\mathbb E[X_{n-1}]=\cdots=\mathbb E[X_0]$। $\blacksquare$ (দাবি ক)

(একইভাবে submartingale-এ "$\ge$" দিয়ে $\mathbb E[X_n]$ অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান — কারণ tower শুধু সমতা নয়, অসমতাও সংরক্ষণ করে।)

দাবি (খ) — independent mean-0 যোগফল একটি martingale। ধরা যাক $\xi_1,\xi_2,\dots$ পরস্পর-স্বাধীন (independent), integrable, ও $\mathbb E[\xi_i]=0$ সব $i$-তে। সংজ্ঞা দিই partial sum $S_0:=0$, $S_n:=\sum_{i=1}^n\xi_i$, এবং filtration $\mathcal F_n:=\sigma(\xi_1,\dots,\xi_n)$ (সঙ্গে $\mathcal F_0:=\{\varnothing,\Omega\}$)। তবে $(S_n)$ হলো $(\mathcal F_n)$-martingale।

ধাপ ১ — adapted ও integrable। প্রতিটি $S_n=\xi_1+\cdots+\xi_n$ হলো $\xi_1,\dots,\xi_n$-এর measurable function, তাই $\mathcal F_n$-measurable — অর্থাৎ adapted। আর $\mathbb E\lvert S_n\rvert\le\sum_{i=1}^n\mathbb E\lvert\xi_i\rvert<\infty$ (triangle inequality, প্রতিটি $\xi_i\in L^1$), তাই $S_n\in L^1$। ✓

ধাপ ২ — martingale-শর্ত। increment-রূপ যাচাই করি: $S_{n+1}-S_n=\xi_{n+1}$, তাই

\[ \mathbb E[S_{n+1}-S_n\mid\mathcal F_n]\ =\ \mathbb E[\xi_{n+1}\mid\mathcal F_n]. \]

এখন $\xi_{n+1}$ হলো $\sigma(\xi_1,\dots,\xi_n)=\mathcal F_n$ থেকে স্বাধীন (কারণ $\xi$-গুলো পরস্পর-স্বাধীন, তাই $\xi_{n+1}\perp\!\!\!\perp(\xi_1,\dots,\xi_n)$)। 7.7-এর independence rule ($X\perp\!\!\!\perp\mathcal G\Rightarrow\mathbb E[X\mid\mathcal G]=\mathbb E[X]$) দেয় $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0$। সুতরাং $\mathbb E[S_{n+1}-S_n\mid\mathcal F_n]=0$ a.s., অর্থাৎ $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n$ — martingale। $\blacksquare$ (দাবি খ)

এটিই martingale-এর আদিতম উদাহরণ: mean-0 ধাপের যোগফল (যেমন symmetric random walk, যেখানে $\xi_i=\pm1$ সমসম্ভাব্য)। নিচের প্রমাণ ২–৪ এই $S_n$-কেই বারবার কাজে লাগাবে।

এক বাক্যে: tower দুই পাশে নিঃশর্ত প্রত্যাশা দিয়ে $\mathbb E[X_{n+1}]=\mathbb E[X_n]$ আনে, আরোহে $\mathbb E[X_n]=\mathbb E[X_0]$; আর independent mean-0 $\xi_i$-এর যোগফল $S_n$-এ increment $\xi_{n+1}\perp\!\!\!\perp\mathcal F_n$ বলে independence rule $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0$ দেয় — তাই $(S_n)$ martingale।

প্রমাণ ১ — martingale transform একটি martingale (★★)¶

এটিই অংশটির কারিগরি হৃৎপিণ্ড: "ন্যায্য খেলায় কোনো বাজি-কৌশল গড়ে লাভ আনতে পারে না"-র গাণিতিক রূপ।

দাবি (martingale transform / "discrete stochastic integral")। ধরা যাক $(X_n)_{n\ge 0}$ একটি $(\mathcal F_n)$-martingale, এবং $(H_n)_{n\ge 1}$ একটি predictable (প্রতিটি $H_n$ $\mathcal F_{n-1}$-measurable) ও bounded process (অর্থাৎ কোনো ধ্রুবক $K$-তে $\lvert H_n\rvert\le K$ সর্বত্র)। সংজ্ঞা দিই martingale transform

\[ (H\cdot X)_0\ :=\ 0,\qquad (H\cdot X)_n\ :=\ \sum_{k=1}^n H_k\,(X_k-X_{k-1})\qquad(n\ge 1). \]

তবে $(H\cdot X)_n$ একটি $(\mathcal F_n)$-martingale, এবং $\mathbb E[(H\cdot X)_n]=0$ সব $n$-তে।

ব্যাখ্যা — কেন এটাই "বাজি-কৌশল"। $X_k-X_{k-1}$ হলো $k$-তম খেলায় প্রতি-একক-বাজিতে নিট লাভ (martingale বলে ন্যায্য, শর্তাধীন গড় শূন্য); $H_k$ হলো খেলোয়াড়ের $k$-তম বাজির পরিমাণ, যা সে অবশ্যই খেলার আগে ($\mathcal F_{k-1}$-তথ্যে) ঠিক করে — তাই predictable। $(H\cdot X)_n$ হলো $n$ খেলার পর মোট লাভ। দাবিটা বলছে: যত চতুর কৌশলই হোক, মোট লাভও একটি martingale — গড়ে শূন্য।

ধাপ ১ — adapted ও integrable। প্রতিটি পদ $H_k(X_k-X_{k-1})$-এ $H_k$ হলো $\mathcal F_{k-1}\subseteq\mathcal F_k$-measurable আর $X_k,X_{k-1}$ হলো $\mathcal F_k$-measurable (adapted, $X_{k-1}$ হলো $\mathcal F_{k-1}\subseteq\mathcal F_k$-তেও), তাই গুণফল $\mathcal F_k$-measurable; $k\le n$-এর যোগফল $(H\cdot X)_n$ হলো $\mathcal F_n$-measurable — অর্থাৎ adapted। integrability: $\lvert H_k\rvert\le K$ ও $X_k,X_{k-1}\in L^1$ দিয়ে

\[ \mathbb E\lvert(H\cdot X)_n\rvert\ \le\ \sum_{k=1}^n\mathbb E\bigl[\lvert H_k\rvert\,\lvert X_k-X_{k-1}\rvert\bigr]\ \le\ K\sum_{k=1}^n\bigl(\mathbb E\lvert X_k\rvert+\mathbb E\lvert X_{k-1}\rvert\bigr)\ <\ \infty. \]

তাই $(H\cdot X)_n\in L^1$। ✓

ধাপ ২ — increment আলাদা করা। ধাপে-ধাপে বৃদ্ধি ঠিক একটি পদ:

\[ (H\cdot X)_{n+1}-(H\cdot X)_n\ =\ \sum_{k=1}^{n+1}H_k(X_k-X_{k-1})-\sum_{k=1}^{n}H_k(X_k-X_{k-1})\ =\ H_{n+1}\,(X_{n+1}-X_n). \]

ধাপ ৩ — শর্তাধীন গড় ও pull-out। $\mathcal F_n$-শর্তে এই increment-এর প্রত্যাশা নিই। লক্ষণীয় — $H_{n+1}$ হলো $\mathcal F_n$-measurable (predictable-সংজ্ঞা: $H_{n+1}$ $\mathcal F_{(n+1)-1}=\mathcal F_n$-measurable), তাই 7.7-এর pull-out ($\mathcal F_n$-measurable factor বাইরে আনা যায়; এখানে $H_{n+1}$ bounded ও $X_{n+1}-X_n\in L^1$, তাই pull-out-এর integrability-শর্ত মেটে):

\[ \mathbb E\bigl[(H\cdot X)_{n+1}-(H\cdot X)_n\,\big\rvert\,\mathcal F_n\bigr] \ =\ \mathbb E\bigl[H_{n+1}(X_{n+1}-X_n)\,\big\rvert\,\mathcal F_n\bigr] \ \overset{\text{pull-out}}{=}\ H_{n+1}\,\mathbb E\bigl[X_{n+1}-X_n\,\big\rvert\,\mathcal F_n\bigr]. \]

এখন $(X_n)$ martingale বলে increment-রূপে (উপরের মৌলিক fact) $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ a.s.। সুতরাং

\[ \mathbb E\bigl[(H\cdot X)_{n+1}-(H\cdot X)_n\,\big\rvert\,\mathcal F_n\bigr]\ =\ H_{n+1}\cdot 0\ =\ 0\quad\text{a.s.} \]

increment-রূপে এ-ই বলে $(H\cdot X)_n$ একটি martingale। ✓

ধাপ ৪ — ধ্রুব গড়। martingale বলে প্রমাণ ৬(ক)-তে $\mathbb E[(H\cdot X)_n]=\mathbb E[(H\cdot X)_0]=\mathbb E[0]=0$ সব $n$-তে। অর্থাৎ কোনো (predictable, bounded) বাজি-কৌশল ন্যায্য খেলায় ধনাত্মক প্রত্যাশিত লাভ আনতে পারে না — "no system beats a fair game" (পদ্ধতি দিয়ে ন্যায্য খেলা জেতা যায় না)। $\blacksquare$

(টীকা: $(X_n)$ যদি submartingale হয় আর $H_n\ge 0$ (predictable, bounded), তবে একই হিসাবে $\mathbb E[\cdots\mid\mathcal F_n]=H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\ge 0$ — তাই অঋণাত্মক বাজিতে transform-ও submartingale; প্রমাণ ৫-এর Doob decomposition-এ এই দিকটা কাজে লাগবে।)

এক বাক্যে: increment $(H\cdot X)_{n+1}-(H\cdot X)_n=H_{n+1}(X_{n+1}-X_n)$-এর $\mathcal F_n$-শর্তাধীন গড়ে predictable $H_{n+1}$-কে pull-out করলে অবশিষ্ট $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ (martingale) বলে পুরোটা শূন্য হয়, তাই martingale transform martingale এবং $\mathbb E[(H\cdot X)_n]=0$ — কোনো বাজি-কৌশল ন্যায্য খেলাকে হারাতে পারে না।

প্রমাণ ২ — stopped process $X_{n\wedge\tau}$ একটি martingale (★★)¶

দাবি (optional stopping-এর preliminary)। ধরা যাক $(X_n)$ একটি martingale এবং $\tau$ একটি stopping time। সংজ্ঞা দিই stopped process (থামানো প্রক্রিয়া) $X^{\tau}_n:=X_{n\wedge\tau}$ — অর্থাৎ "$\tau$ আসার পর হিমায়িত": $\tau$-তে পৌঁছানোর পর প্রক্রিয়া আর নড়ে না। তবে $(X_{n\wedge\tau})_{n\ge 0}$ আবার একটি $(\mathcal F_n)$-martingale, এবং বিশেষত $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে।

ধাপ ১ — stopped process-কে একটি transform হিসেবে লেখা। মূল কৌশল: $X_{n\wedge\tau}$-কে $X_0$ + একটি martingale transform রূপে প্রকাশ করা। দাবি:

\[ X_{n\wedge\tau}\ =\ X_0\ +\ \sum_{k=1}^{n}\mathbf 1_{\{\tau\ge k\}}\,(X_k-X_{k-1}). \]

যাচাই (telescoping): ডান পাশের যোগফলে কেবল সেই $k$-গুলো টেকে যেখানে $\tau\ge k$, অর্থাৎ $k\le\tau$ — তাই $k$ চলে $1$ থেকে $\min(n,\tau)=n\wedge\tau$ পর্যন্ত (যদি $\tau\ge 1$); সুতরাং যোগফল $=\sum_{k=1}^{n\wedge\tau}(X_k-X_{k-1})=X_{n\wedge\tau}-X_0$ (টেলিস্কোপ, মাঝের সব পদ কাটাকাটি)। দুই দিকে $X_0$ যোগ করলে অভেদ। (যদি $\tau=0$ হয়, যোগফল খালি $=0$ এবং $X_{0\wedge\tau}=X_0$ — তবু মেলে।)

ধাপ ২ — gain-process $H_k:=\mathbf 1_{\{\tau\ge k\}}$ predictable ও bounded। উপরের মৌলিক fact-এ দেখা গেছে $\{\tau\ge k\}=\{\tau\le k-1\}^c\in\mathcal F_{k-1}$, তাই indicator $H_k=\mathbf 1_{\{\tau\ge k\}}$ হলো $\mathcal F_{k-1}$-measurable — অর্থাৎ predictable। আর $0\le H_k\le 1$ — অর্থাৎ bounded ($K=1$)। (স্বজ্ঞা: "এখনও থামিনি কি না" — $\{\tau\ge k\}$ — তা $k-1$ পর্যন্ত-জানা তথ্যেই নির্ধারিত, কারণ থামা ভবিষ্যৎ দেখে হয় না; তাই $k$-তম ধাপে "বাজি ধরব কি ধরব না" আগেই ঠিক — ঠিক predictable বাজি-কৌশল।)

ধাপ ৩ — প্রমাণ ১ প্রয়োগ। ধাপ ১–২ মিলিয়ে $X_{n\wedge\tau}-X_0=(H\cdot X)_n$ যেখানে $H_k=\mathbf 1_{\{\tau\ge k\}}$ predictable ও bounded, আর $(X_n)$ martingale। তাই প্রমাণ ১ অনুযায়ী $(H\cdot X)_n$ একটি martingale। যেহেতু $X_0$ হলো $\mathcal F_0$-measurable ধ্রুব-সংযোজন (constant shift — একটি adapted, integrable পদ যার increment শূন্য), $X_{n\wedge\tau}=X_0+(H\cdot X)_n$-ও martingale: increment-রূপে $\mathbb E[X_{(n+1)\wedge\tau}-X_{n\wedge\tau}\mid\mathcal F_n]=\mathbb E[(H\cdot X)_{n+1}-(H\cdot X)_n\mid\mathcal F_n]=0$ a.s. (কারণ $X_0$-এর অবদান বিয়োগে কেটে যায়)। ✓

ধাপ ৪ — ধ্রুব গড়। martingale বলে প্রমাণ ৬(ক): $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_{0\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে। এটিই optional stopping-এর বীজ — থামানো প্রক্রিয়ার গড় সবসময় শুরুর গড়; বাকি কাজ হলো $n\to\infty$ নিয়ে $X_{n\wedge\tau}\to X_\tau$-এ গড় টেনে নেওয়া (প্রমাণ ৩)। $\blacksquare$

(একই telescoping submartingale-এও খাটে: $H_k=\mathbf 1_{\{\tau\ge k\}}\ge 0$ predictable, তাই প্রমাণ ১-এর টীকা-অনুযায়ী stopped submartingale আবার submartingale — $\mathbb E[X_{n\wedge\tau}]\ge\mathbb E[X_0]$।)

এক বাক্যে: $X_{n\wedge\tau}=X_0+\sum_{k=1}^n\mathbf 1_{\{\tau\ge k\}}(X_k-X_{k-1})$ লিখে দেখা যায় gain $H_k=\mathbf 1_{\{\tau\ge k\}}=1-\mathbf 1_{\{\tau\le k-1\}}$ হলো $\mathcal F_{k-1}$-measurable (predictable) ও bounded, তাই stopped process একটি martingale transform — প্রমাণ ১-এ martingale, এবং $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে।

প্রমাণ ৩ — Optional Stopping Theorem (★★★)¶

দাবি (Optional Stopping / Optional Sampling Theorem — ঐচ্ছিক-থামার উপপাদ্য)। ধরা যাক $(X_n)$ একটি martingale ও $\tau$ একটি stopping time। প্রমাণ ২ থেকে আমরা জানি $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে। নিচের প্রতিটি অনুমান-গুচ্ছের অধীনে এই সমতা সীমায় টিকে থাকে:

\[ \boxed{\ \mathbb E[X_\tau]\ =\ \mathbb E[X_0].\ } \]

(ক) $\tau\le N$ bounded (কোনো ধ্রুবক $N$-এ); অথবা (খ) $\tau<\infty$ a.s. এবং $(X_n)$ uniformly bounded ($\lvert X_n\rvert\le C$ সব $n,\omega$-তে); অথবা (গ) $\mathbb E[\tau]<\infty$ এবং $(X_n)$-এর bounded increments ($\lvert X_k-X_{k-1}\rvert\le C$ সব $k$-তে)।

স্বীকৃতি — কেন তিনটি অনুমান লাগে (গভীর, প্রথম পাঠে মূল ধারণাটুকুই যথেষ্ট)। $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সবসময় সত্য (প্রমাণ ২), কিন্তু $n\to\infty$-এ বাঁ পাশকে $\mathbb E[X_\tau]$-এ নিতে হলে প্রত্যাশা ও সীমা বদলানো ($\lim_n\mathbb E[X_{n\wedge\tau}]=\mathbb E[\lim_n X_{n\wedge\tau}]$) বৈধ হতে হবে — যা সাধারণভাবে মিথ্যা (চিরায়ত প্রতিউদাহরণ: symmetric random walk-এ $\tau=$ "$+1$-এ প্রথম পৌঁছানো", যেখানে $\tau<\infty$ a.s. অথচ $\mathbb E[X_\tau]=1\ne 0=\mathbb E[X_0]$ — কারণ এখানে কোনোটিই (ক)-(গ) মানে না)। তাই তিনটি অনুমান-গুচ্ছের প্রতিটিই আসলে dominated convergence theorem (DCT, প্রাবল্য-অভিসারণ) বা তার সমতুল্য চালু করার আলাদা-আলাদা শর্ত। সবচেয়ে সহজ (ক), সবচেয়ে ব্যবহারিক (গ)।

ধাপ ০ — সাধারণ সীমা: $X_{n\wedge\tau}\to X_\tau$ a.s. তিন ক্ষেত্রেই $\tau<\infty$ a.s. (ক, খ-এ স্পষ্ট; গ-তে $\mathbb E[\tau]<\infty\Rightarrow\tau<\infty$ a.s.)। যে $\omega$-তে $\tau(\omega)<\infty$, সেখানে $n\ge\tau(\omega)$ হলেই $n\wedge\tau(\omega)=\tau(\omega)$, তাই $X_{n\wedge\tau}(\omega)=X_{\tau}(\omega)$ — অর্থাৎ অনুক্রমটি শেষ পর্যন্ত স্থির এবং সীমা $X_\tau(\omega)$। সুতরাং

\[ X_{n\wedge\tau}\ \xrightarrow[n\to\infty]{}\ X_\tau\quad\text{a.s.} \]

বাকি কাজ কেবল $\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]$ — প্রতিটি ক্ষেত্রে domination দেখিয়ে।

ধাপ ১ — ক্ষেত্র (ক): $\tau\le N$ bounded (সবচেয়ে সহজ)। এখানে সীমা নেওয়ার দরকারই নেই — $n=N$ বসাই। যেহেতু $\tau\le N$, প্রতিটি $\omega$-তে $N\wedge\tau=\tau$, তাই $X_{N\wedge\tau}=X_\tau$ সরাসরি। প্রমাণ ২-এর $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$-তে $n=N$:

\[ \mathbb E[X_\tau]\ =\ \mathbb E[X_{N\wedge\tau}]\ =\ \mathbb E[X_0].\qquad\checkmark \]

(কোনো convergence-যুক্তি লাগে না — bounded stopping time-এ optional stopping নিছক প্রমাণ ২-এর এক-মান-বসানো।)

ধাপ ২ — ক্ষেত্র (খ): $\tau<\infty$ a.s. ও $\lvert X_n\rvert\le C$ (DCT, uniform bound)। প্রতিটি $n$-এ $\lvert X_{n\wedge\tau}\rvert\le C$ — কারণ $X_{n\wedge\tau}$ হলো কোনো-এক সূচকে $X$-এর মান, আর সব $X_m$-ই $C$-আবদ্ধ। তাই ধ্রুব-আবদ্ধক $g\equiv C\in L^1$ (probability space-এ $\mathbb E[C]=C<\infty$) গোটা অনুক্রমকে dominate করে, আর ধাপ ০-তে $X_{n\wedge\tau}\to X_\tau$ a.s.। DCT (7.4) দেয়

\[ \lim_{n\to\infty}\mathbb E[X_{n\wedge\tau}]\ =\ \mathbb E\Bigl[\lim_{n\to\infty}X_{n\wedge\tau}\Bigr]\ =\ \mathbb E[X_\tau]. \]

বাঁ পাশ প্রতিটি $n$-এ $\mathbb E[X_0]$ (প্রমাণ ২), তাই তার সীমাও $\mathbb E[X_0]$। সুতরাং $\mathbb E[X_\tau]=\mathbb E[X_0]$. ✓ (এখানে $X_\tau\in L^1$-ও DCT থেকেই আসে: $\lvert X_\tau\rvert\le C$।)

ধাপ ৩ — ক্ষেত্র (গ): $\mathbb E[\tau]<\infty$ ও $\lvert X_k-X_{k-1}\rvert\le C$ (DCT, $C\tau$-আবদ্ধক)। এখানে $X_n$ নিজে আবদ্ধ না-ও হতে পারে (যেমন random walk), তাই (খ)-এর ধ্রুব-আবদ্ধক খাটে না — পরিবর্তে একটি integrable random আবদ্ধক বানাই। telescoping ও triangle inequality:

\[ \lvert X_{n\wedge\tau}-X_0\rvert\ =\ \Bigl\lvert\sum_{k=1}^{n\wedge\tau}(X_k-X_{k-1})\Bigr\rvert\ \le\ \sum_{k=1}^{n\wedge\tau}\lvert X_k-X_{k-1}\rvert\ \le\ \sum_{k=1}^{n\wedge\tau}C\ =\ C\,(n\wedge\tau)\ \le\ C\,\tau. \]

তাই $\lvert X_{n\wedge\tau}\rvert\le\lvert X_0\rvert+C\tau=:Y$ সব $n$-তে, এবং এই আবদ্ধক $Y$ integrable: $\mathbb E[Y]=\mathbb E\lvert X_0\rvert+C\,\mathbb E[\tau]<\infty$ (যেহেতু $X_0\in L^1$ ও অনুমান $\mathbb E[\tau]<\infty$)। ধাপ ০-তে $X_{n\wedge\tau}\to X_\tau$ a.s., আর $Y\in L^1$ অনুক্রমকে dominate করে — DCT দেয়

\[ \mathbb E[X_\tau]\ =\ \lim_{n\to\infty}\mathbb E[X_{n\wedge\tau}]\ =\ \mathbb E[X_0].\qquad\checkmark \]

(সঙ্গে $\lvert X_\tau\rvert\le\lvert X_0\rvert+C\tau\in L^1$, তাই $X_\tau\in L^1$ — সীমা অর্থবহ।) $\blacksquare$

উপসিদ্ধান্ত — submartingale/supermartingale রূপ। প্রমাণ ২-এর টীকায় submartingale-এ $\mathbb E[X_{n\wedge\tau}]\ge\mathbb E[X_0]$; একই DCT-গুলো দিয়ে (ক)–(গ)-এর যেকোনোটির অধীনে submartingale-এ $\mathbb E[X_\tau]\ge\mathbb E[X_0]$ এবং supermartingale-এ $\mathbb E[X_\tau]\le\mathbb E[X_0]$ — অসমতাগুলোও সীমায় টিকে থাকে।

এক বাক্যে: $\tau<\infty$ a.s. বলে $X_{n\wedge\tau}\to X_\tau$ a.s. (অনুক্রম শেষে স্থির), আর প্রমাণ ২-এর $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$-তে সীমা টানতে domination লাগে — (ক) bounded $\tau$-তে $n=N$ বসালেই $X_{N\wedge\tau}=X_\tau$, (খ) $\lvert X_n\rvert\le C$-তে ধ্রুব-আবদ্ধক $C$ দিয়ে DCT, (গ) bounded increments-এ $\lvert X_{n\wedge\tau}\rvert\le\lvert X_0\rvert+C\tau\in L^1$ দিয়ে DCT — তিন ক্ষেত্রেই $\mathbb E[X_\tau]=\mathbb E[X_0]$।

প্রমাণ ৪ — gambler's ruin via optional stopping (★★)¶

সেটআপ (জুয়াড়ির সর্বনাশ — gambler's ruin)। ধরা যাক $\xi_1,\xi_2,\dots$ i.i.d. (স্বাধীন ও অভিন্ন-বণ্টিত), $\mathbb P(\xi_i=+1)=\mathbb P(\xi_i=-1)=\tfrac12$ — symmetric simple random walk (প্রতিসম সরল দৈবচলন)। $S_0:=0$, $S_n:=\sum_{i=1}^n\xi_i$; প্রমাণ ৬(খ)-তে $(S_n)$ একটি martingale ($\mathbb E[\xi_i]=0$)। দুই ধ্রুব পূর্ণসংখ্যা $a,b>0$ নিয়ে ধরি প্রথম-আঘাত-সময় (first hitting time)

\[ \tau\ :=\ \min\{\,n\ge 0:\ S_n=-a\ \text{অথবা}\ S_n=+b\,\}\,, \]

অর্থাৎ চলন যখন প্রথমবার $-a$ (সর্বনাশ) বা $+b$ (জয়) ছুঁয়ে ফেলে তখন থামা। লক্ষ্য: জয়ের সম্ভাবনা $p:=\mathbb P(S_\tau=+b)$ ও গড় খেলা-দৈর্ঘ্য $\mathbb E[\tau]$ বের করা।

ধাপ ১ — $\tau$ একটি stopping time এবং $\mathbb E[\tau]<\infty$। $\{\tau\le n\}=\bigcup_{m\le n}\{S_m\in\{-a,+b\}\}\in\mathcal F_n$ (প্রতিটি $\{S_m=\cdot\}\in\mathcal F_m\subseteq\mathcal F_n$), তাই stopping time। $\mathbb E[\tau]<\infty$ দেখাই একটি মানক যুক্তিতে: চলন $-a$ ও $+b$-এর মাঝে $a+b$ ধাপ চওড়া একটি ফালিতে আটকে। যেকোনো অবস্থান থেকে পরপর $a+b$ বার $+1$ পেলে নিশ্চয় $+b$ পেরিয়ে যাবে (তাই থেমে যাবে); এই ঘটনার সম্ভাবনা প্রতিটি $(a+b)$-block-এ অন্তত $q:=2^{-(a+b)}>0$। তাই $\tau$ যেকোনো $(a+b)$-দৈর্ঘ্য খণ্ডে সম্ভাবনা $\ge q$-তে শেষ হয়, ফলে $\mathbb P(\tau> k(a+b))\le(1-q)^k$ — অর্থাৎ $\tau$-এর লেজ জ্যামিতিকভাবে ক্ষয়িষ্ণু (geometric tail)। জ্যামিতিক লেজ মানে সব moment সসীম, বিশেষত

\[ \mathbb E[\tau]\ =\ \sum_{n\ge 0}\mathbb P(\tau>n)\ \le\ (a+b)\sum_{k\ge 0}(1-q)^k\ =\ \frac{a+b}{q}\ <\ \infty. \]

আর increments $\lvert S_k-S_{k-1}\rvert=\lvert\xi_k\rvert=1\le C$ ($C=1$)। তাই প্রমাণ ৩-এর অনুমান (গ) পুরোপুরি মেটে। ✓

ধাপ ২ — প্রথম optional stopping: $\mathbb E[S_\tau]=0$ ⇒ $p=\frac{a}{a+b}$। $(S_n)$ martingale, $S_0=0$, আর (গ) সিদ্ধ — তাই প্রমাণ ৩:

\[ \mathbb E[S_\tau]\ =\ \mathbb E[S_0]\ =\ 0. \]

কিন্তু থামার মুহূর্তে $S_\tau$ কেবল দুটি মান নেয়: $+b$ (সম্ভাবনা $p$) বা $-a$ (সম্ভাবনা $1-p$)। তাই $\mathbb E[S_\tau]=b\,p+(-a)(1-p)=bp-a(1-p)$। সমান শূন্য বসিয়ে:

\[ bp-a(1-p)=0\ \Longrightarrow\ bp+ap=a\ \Longrightarrow\ p\,(a+b)=a\ \Longrightarrow\ \boxed{\,p=\dfrac{a}{a+b}\,}. \]

স্বজ্ঞা: ন্যায্য খেলায় জয়ের সম্ভাবনা শুরুর বিন্দুর দূরত্ব-অনুপাতে — $+b$-এর চেয়ে $-a$ যত কাছে, ততই বেশি সম্ভাবনা সেদিকে শেষ (এখানে $-a$ থেকে দূরত্ব $a$, মোট প্রস্থ $a+b$)।

ধাপ ৩ — দ্বিতীয় martingale $M_n:=S_n^2-n$। এবার গড় খেলা-দৈর্ঘ্য বের করতে আরেকটি martingale লাগে। দাবি: $M_n:=S_n^2-n$ একটি martingale। যাচাই: $S_n\in L^1$ ও bounded-by-$n$... আসলে $\lvert S_n\rvert\le n$ তাই $S_n^2\le n^2$, integrable; এবং increment-রূপ — যেহেতু $S_{n+1}=S_n+\xi_{n+1}$ আর $\xi_{n+1}\perp\!\!\!\perp\mathcal F_n$ সঙ্গে $\mathbb E[\xi_{n+1}]=0,\ \mathbb E[\xi_{n+1}^2]=1$:

\[ \mathbb E[S_{n+1}^2\mid\mathcal F_n]=\mathbb E[(S_n+\xi_{n+1})^2\mid\mathcal F_n]=S_n^2+2S_n\,\underbrace{\mathbb E[\xi_{n+1}\mid\mathcal F_n]}_{=\,0}+\underbrace{\mathbb E[\xi_{n+1}^2\mid\mathcal F_n]}_{=\,1}=S_n^2+1, \]

যেখানে $S_n$ হলো $\mathcal F_n$-measurable বলে pull-out, আর $\xi_{n+1}\perp\!\!\!\perp\mathcal F_n$ বলে independence rule (7.7) প্রয়োগ। সুতরাং $\mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[S_{n+1}^2\mid\mathcal F_n]-(n+1)=(S_n^2+1)-(n+1)=S_n^2-n=M_n$ — martingale, $M_0=0$। (এই $S_n^2-n$-ই প্রমাণ ৫-এর Doob decomposition-এ স্বাভাবিকভাবে বেরোবে: $S_n^2$-এর predictable অংশ ঠিক $A_n=n$।)

ধাপ ৪ — দ্বিতীয় optional stopping: $\mathbb E[\tau]=\mathbb E[S_\tau^2]=ab$। $M_n=S_n^2-n$-এ optional stopping প্রয়োগ করতে চাই। সরাসরি (গ) এখানে $M$-এর জন্য খাটে না (increments আবদ্ধ নয়), তাই প্রমাণ ২-এর সমতা $\mathbb E[M_{n\wedge\tau}]=\mathbb E[M_0]=0$ থেকে শুরু করি (যা সবসময় সত্য):

\[ 0\ =\ \mathbb E[M_{n\wedge\tau}]\ =\ \mathbb E[S_{n\wedge\tau}^2]-\mathbb E[n\wedge\tau]\ \Longrightarrow\ \mathbb E[S_{n\wedge\tau}^2]\ =\ \mathbb E[n\wedge\tau]. \]

এখন $n\to\infty$ নিই। ডান পাশে $n\wedge\tau\uparrow\tau$ a.s. (monotone), তাই monotone convergence theorem (MCT) দেয় $\mathbb E[n\wedge\tau]\to\mathbb E[\tau]$। বাঁ পাশে $\lvert S_{n\wedge\tau}\rvert\le\max(a,b)=:R$ (থামার আগে চলন $(-a,b)$-এর ভেতরে, তাই সর্বদা $\lvert S_{n\wedge\tau}\rvert\le R$), অর্থাৎ $S_{n\wedge\tau}^2\le R^2$ — ধ্রুব-আবদ্ধক; আর $S_{n\wedge\tau}^2\to S_\tau^2$ a.s. (ধাপ ০, $\tau<\infty$)। DCT দেয় $\mathbb E[S_{n\wedge\tau}^2]\to\mathbb E[S_\tau^2]$। দুই সীমা মিলিয়ে

\[ \mathbb E[S_\tau^2]\ =\ \mathbb E[\tau]. \]

বাঁ পাশ গণনা করি: $S_\tau\in\{+b,-a\}$, তাই $S_\tau^2\in\{b^2,a^2\}$ এবং (ধাপ ২-এর $p=\frac{a}{a+b}$)

\[ \mathbb E[S_\tau^2]\ =\ b^2\,p+a^2\,(1-p)\ =\ b^2\cdot\frac{a}{a+b}+a^2\cdot\frac{b}{a+b}\ =\ \frac{ab\,(b+a)}{a+b}\ =\ ab. \]

সুতরাং

\[ \boxed{\ \mathbb E[\tau]\ =\ \mathbb E[S_\tau^2]\ =\ ab.\ } \]

সংখ্যাগত যাচাই — $a=8,\ b=4$। তখন জয়ের সম্ভাবনা $p=\dfrac{a}{a+b}=\dfrac{8}{8+4}=\dfrac{8}{12}=\dfrac{2}{3}$, আর গড় খেলা-দৈর্ঘ্য $\mathbb E[\tau]=ab=8\cdot 4=32$। (স্বজ্ঞা: শুরু থেকে $-8$ অনেক দূর, $+4$ কাছে — তাই $+4$-এ শেষ হওয়ার সম্ভাবনা বেশি, $\tfrac23$; আর গড়ে $32$ ধাপ লাগে কোনো-এক প্রান্তে পৌঁছাতে।) $\blacksquare$

এক বাক্যে: $\mathbb E[\tau]<\infty$ (geometric tail) ও $\lvert\xi_k\rvert=1$ বলে অনুমান (গ) মেটে, তাই $(S_n)$-এ optional stopping দেয় $0=\mathbb E[S_\tau]=bp-a(1-p)\Rightarrow p=\frac{a}{a+b}$; আর $M_n=S_n^2-n$-এ $\mathbb E[M_{n\wedge\tau}]=0$ থেকে (MCT ডানে, DCT বামে) $\mathbb E[\tau]=\mathbb E[S_\tau^2]=ab$ — $a=8,b=4$-এ $p=\tfrac23,\ \mathbb E[\tau]=32$।

প্রমাণ ৫ — Doob decomposition (★★)¶

দাবি (Doob decomposition — ডুব-বিভাজন)। ধরা যাক $(X_n)_{n\ge 0}$ একটি submartingale ($\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n$, সব $X_n\in L^1$, adapted)। তবে $X_n$ একমাত্রভাবে (uniquely) লেখা যায়

\[ X_n\ =\ M_n\ +\ A_n, \]

যেখানে $(M_n)$ একটি martingale, আর $(A_n)$ একটি predictable ($A_n$ $\mathcal F_{n-1}$-measurable $n\ge 1$-তে), increasing (অ-হ্রাসমান, $A_{n}\le A_{n+1}$ a.s.) process সঙ্গে $A_0=0$। এই $(A_n)$-কে বলা হয় compensator (ক্ষতিপূরক) বা predictable increasing part।

ধাপ ১ — $A_n$-এর সংজ্ঞা ও তিন বৈশিষ্ট্য। "অনুমান-করে-যাচাই" পদ্ধতিতে $A$-কে আগে নির্মাণ করি। সংজ্ঞা দিই $A_0:=0$ এবং

\[ A_n\ :=\ \sum_{k=1}^{n}\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\qquad(n\ge 1). \]

অর্থাৎ প্রতিটি ধাপে submartingale-এর শর্তাধীন বৃদ্ধি (drift) জমা। এর তিন বৈশিষ্ট্য:

predictable: $A_n$-এর $k$-তম পদ $\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]$ হলো $\mathcal F_{k-1}$-measurable (conditional expectation সবসময় শর্ত-σ-algebra-measurable, 7.7-CE-1); সর্বোচ্চ-সূচক $k=n$ পদ $\mathcal F_{n-1}$-measurable, আর বাকি সব পদ $\mathcal F_{k-1}\subseteq\mathcal F_{n-1}$-তেও — তাই পুরো যোগফল $A_n$ হলো $\mathcal F_{n-1}$-measurable। ✓
increasing: $A_n-A_{n-1}=\mathbb E[X_n-X_{n-1}\mid\mathcal F_{n-1}]\ge 0$ a.s. — ঠিক submartingale-শর্ত ($\mathbb E[X_n\mid\mathcal F_{n-1}]\ge X_{n-1}$)। তাই $A_n$ অ-হ্রাসমান। ✓ (এখানেই "submartingale" অনুমানটা একমাত্রবার লাগে; martingale হলে $A_n\equiv 0$, supermartingale হলে $A_n$ অ-বর্ধমান।)
$A_0=0$: সংজ্ঞা-অনুযায়ী। ✓

ধাপ ২ — $M_n:=X_n-A_n$ একটি martingale। $M_n$ হলো $\mathcal F_n$-measurable ($X_n$ adapted, $A_n$ হলো $\mathcal F_{n-1}\subseteq\mathcal F_n$-measurable) ও integrable ($X_n\in L^1$; $A_n$-এর প্রতিটি পদ $\mathbb E\bigl\lvert\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\bigr\rvert\le\mathbb E\lvert X_k-X_{k-1}\rvert<\infty$, conditional Jensen/contraction)। increment-রূপ যাচাই করি। লক্ষণীয় — $A_n$ হলো $\mathcal F_n$-measurable, আর গুরুত্বপূর্ণভাবে increment $A_{n+1}-A_n=\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]$ হলো $\mathcal F_n$-measurable (predictable):

\[ \mathbb E[M_{n+1}-M_n\mid\mathcal F_n] =\mathbb E[(X_{n+1}-X_n)-(A_{n+1}-A_n)\mid\mathcal F_n] =\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]-(A_{n+1}-A_n), \]

যেখানে $A_{n+1}-A_n$ হলো $\mathcal F_n$-measurable বলে pull-out/ধ্রুবক-নিয়মে $\mathbb E[A_{n+1}-A_n\mid\mathcal F_n]=A_{n+1}-A_n$ (linearity দিয়ে বিয়োগ)। কিন্তু সংজ্ঞা-অনুযায়ী $A_{n+1}-A_n=\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]$ — অর্থাৎ দুই পদ ঠিক পরস্পর কাটাকাটি:

\[ \mathbb E[M_{n+1}-M_n\mid\mathcal F_n]\ =\ \mathbb E[X_{n+1}-X_n\mid\mathcal F_n]-\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\ =\ 0\quad\text{a.s.} \]

তাই $(M_n)$ martingale। আর $X_n=M_n+A_n$ অভেদ-সংজ্ঞা থেকে স্পষ্ট। অস্তিত্ব প্রমাণিত। ✓

ধাপ ৩ — অনন্যতা (uniqueness)। ধরা যাক দুটি বিভাজন $X_n=M_n+A_n=M_n'+A_n'$, যেখানে $M,M'$ martingale ও $A,A'$ predictable-increasing সঙ্গে $A_0=A_0'=0$। সংজ্ঞা দিই $D_n:=A_n-A_n'=M_n'-M_n$। তবে $D_n$ একদিকে predictable (দুই predictable-এর পার্থক্য, $\mathcal F_{n-1}$-measurable), অন্যদিকে martingale (দুই martingale-এর পার্থক্য)। martingale বলে increment-রূপে $\mathbb E[D_{n+1}-D_n\mid\mathcal F_n]=0$; কিন্তু $D_{n+1}$ হলো $\mathcal F_n$-measurable (predictable), তাই $\mathbb E[D_{n+1}\mid\mathcal F_n]=D_{n+1}$ আর $\mathbb E[D_n\mid\mathcal F_n]=D_n$ — সুতরাং $D_{n+1}-D_n=0$ a.s., অর্থাৎ $D_n$ a.s. ধ্রুব in $n$। যেহেতু $D_0=A_0-A_0'=0$, পাই $D_n=0$ a.s. সব $n$-তে — অর্থাৎ $A_n=A_n'$ এবং $M_n=M_n'$ a.s.। বিভাজন একমাত্র। $\blacksquare$

ধাপ ৪ — প্রয়োগ: $S_n^2$ ও $A_n=n$। symmetric random walk-এ $X_n:=S_n^2$ একটি submartingale (কারণ conditional Jensen-এ $\mathbb E[S_{n+1}^2\mid\mathcal F_n]\ge(\mathbb E[S_{n+1}\mid\mathcal F_n])^2=S_n^2$; অথবা সরাসরি প্রমাণ ৪-ধাপ ৩-এর হিসাব $\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2$)। তার compensator:

\[ A_n=\sum_{k=1}^{n}\mathbb E[S_k^2-S_{k-1}^2\mid\mathcal F_{k-1}]=\sum_{k=1}^{n}\bigl((S_{k-1}^2+1)-S_{k-1}^2\bigr)=\sum_{k=1}^{n}1=n, \]

(প্রতিটি পদে প্রমাণ ৪-ধাপ ৩-এর $\mathbb E[S_k^2\mid\mathcal F_{k-1}]=S_{k-1}^2+1$ বসিয়ে)। তাই Doob decomposition $S_n^2=M_n+n$ দেয় $M_n=S_n^2-n$ — অর্থাৎ $S_n^2-n$ একটি martingale, যা প্রমাণ ৪-ধাপ ৩-এ হাতে যাচাই করা হয়েছিল, এখানে decomposition-এর স্বাভাবিক ফল হিসেবে পুনঃপ্রতিষ্ঠিত। ($A_n=n$-কে বলা হয় random walk-এর predictable quadratic variation $\langle S\rangle_n$ — যা 7.9-এ martingale convergence ও CLT-তে কেন্দ্রীয়।) $\blacksquare$

এক বাক্যে: $A_n:=\sum_{k=1}^n\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]$ হলো predictable (conditional expectation শর্ত-measurable) ও increasing (submartingale-শর্তে প্রতিটি পদ $\ge 0$), আর $M_n:=X_n-A_n$-এর increment-এ $A$-এর drift ঠিক $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]$-কে কাটে বলে $M$ martingale; অনন্যতা আসে "predictable martingale ⇒ ধ্রুব" থেকে, আর $S_n^2$-এ $A_n=n$, তাই $S_n^2-n$ martingale।

এ-অংশের ছয়টি প্রমাণ মিলে martingale-যন্ত্রের পূর্ণ কঙ্কাল দাঁড় করায়: প্রমাণ ৬ ভিত্তি (ধ্রুব গড় + উদাহরণ-কারখানা); প্রমাণ ১ "no system beats a fair game"; প্রমাণ ২ stopped process হিমায়িত-martingale; প্রমাণ ৩ optional stopping (তিন domination-শর্ত); প্রমাণ ৪ তার চমকপ্রদ ফসল gambler's ruin ($p=\frac{a}{a+b},\ \mathbb E[\tau]=ab$); আর প্রমাণ ৫ Doob decomposition, যা submartingale-কে martingale + predictable-increasing অংশে ভেঙে $S_n^2-n$-কে martingale দেখায়। প্রতিটি পদক্ষেপ 7.7-এর tower, pull-out, linearity, independence rule, ও 7.4-এর MCT/DCT-র উপর দাঁড়িয়ে — এই একই যন্ত্র 7.9-এ martingale convergence theorem ও SLLN-এর দ্বিতীয় প্রমাণে, এবং 7.10-এ rigorous CLT-তে ফিরবে।

৫ · কোড ল্যাব (Python)¶

এই অধ্যায়ের কেন্দ্রীয় বস্তু martingale (মার্টিঙ্গেল — "ন্যায্য খেলা"র random process) পুরোপুরি বিমূর্ত একটা শর্তাধীন-প্রত্যাশা সমীকরণ $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ দিয়ে সংজ্ঞায়িত — "আজ পর্যন্ত সব তথ্য দিয়ে আগামীকালের সেরা অনুমান = আজকের মান"। কিন্তু সংজ্ঞাটি যত বিমূর্তই হোক, তার প্রতিটি ফল simulation-এ সংখ্যায় চোখে দেখা যায়: একটা symmetric random walk-এর গড় সব সময়ে শূন্যে থিতু থাকে, যদিও পৃথক পথ বুনোভাবে দোলে; gambler's ruin-এ optional stopping theorem-এর হিসাব ($\mathbb P(+b)$, $\mathbb E[S_\tau]$, $\mathbb E[\tau]$) empirically মিলে যায়; কিন্তু hypothesis ভাঙলে — first-passage-এ — সেই উপপাদ্যই ভেঙে পড়ে; আর একটা product martingale-এর গড় গুণফল-ক্ষেত্রেও $1$-এ আটকে থাকে। এই ল্যাবে একটিমাত্র runnable স্ক্রিপ্ট (শুধু numpy-নির্ভর, বাড়তি কোনো library নয়) চারটি অংশে এই চারটি মুখ একে একে যাচাই করে।

স্ক্রিপ্টের কাঠামো ও পুনরুৎপাদনযোগ্যতা (reproducibility)¶

পুরো ল্যাবটা একটাই runnable স্ক্রিপ্ট — _code/lab_7-8.py — চারটে ব্যাখ্যাযুক্ত অংশে ভাগ করা, নির্ভরতা শুধু numpy। চারটি অংশই একটিমাত্র generator থেকে টানে — np.random.default_rng(20260619) — এবং default_rng-এর ফলাফল স্রোত (stream) থেকে টানার ক্রমের উপর নির্ভরশীল: একই seed হলেও আগে-পরে টানলে আলাদা সংখ্যা আসে। তাই ফল পুনরুৎপাদনযোগ্য রাখতে নিচের ঠিক এই ক্রমেই স্রোত টানা হয় —

Part 1 — plain symmetric-walk increment array (shape $200000\times50$, প্রতিটি $\pm1$), সবার আগে;
Part 2 — gambler's-ruin loop (barrier $-8,+4$), প্রতিটি পদক্ষেপ একই generator থেকে;
Part 3 — first-passage-to-$+1$ loop (cap $N=10^5$), একই generator থেকে;
Part 4 — product-martingale increment array ($\pm1$ fair coins, shape $200000\times40$), সবার শেষে।

প্রতিটি $\pm1$ ন্যায্য মুদ্রা স্বাধীন ও past থেকে স্বাধীন — এটিই martingale-ধর্মের কাঁচামাল: increment-এর শর্তাধীন গড় শূন্য (যোগফলে), শর্তাধীন গড় এক (গুণফলে)। নিচের set-up লাইনটি গোটা স্ক্রিপ্টে একবারই চলে—

import numpy as np

np.set_printoptions(precision=4, suppress=True)

# ---- one generator, seeded once; every draw below pulls from it in order ----
rng = np.random.default_rng(20260619)

প্রতিটি অংশ এই একই rng-এ ক্রমানুসারে টানে, তাই draw-ক্রম স্থির এবং নিচের সব সংখ্যা হুবহু পুনরুৎপাদনযোগ্য।

৫.১ · Random walk একটি martingale — গড় সব সময়ে শূন্য¶

সবচেয়ে চেনা martingale: ন্যায্য মুদ্রার symmetric random walk, $\xi_k=\pm1$, $S_n=\sum_{k\le n}\xi_k$, $S_0=0$। যেহেতু $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0$, তাই $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n$ — martingale। এর সরাসরি ফল ধ্রুব গড়: $\mathbb E[S_n]=\mathbb E[S_0]=0$ প্রতিটি $n$-এ — যদিও পৃথক পথ $\sqrt n$-মাপে ছড়িয়ে দূরে চলে যায়। এখানে $200000$ পথে $\mathbb E[S_{50}]\approx0$ যাচাই, এবং কয়েকটা পথের running mean $S_n/n$ যে শূন্যের দিকে নামে তা দেখা — মনে রাখতে হবে, martingale মানে বায়াসহীন, নিশ্চল নয়।

# =====================================================================
# PART 1 -- A symmetric random walk is a martingale.
#           xi_k = +-1 fair coin, S_n = sum_{k<=n} xi_k, S_0 = 0.
#           E[xi_{n+1} | F_n] = 0  =>  E[S_{n+1} | F_n] = S_n  (martingale).
#           Consequence: E[S_n] = E[S_0] = 0 for EVERY n (constant mean),
#           even though individual paths wander far.  We check E[S_50] ~ 0
#           across many paths, and watch a few paths' running mean -> 0.
# =====================================================================
n_paths = 200_000
n_steps = 50
# (1) draw the plain-walk increments FIRST: shape (n_paths, n_steps), +-1
inc = rng.choice(np.array([-1, 1]), size=(n_paths, n_steps))
walks = np.cumsum(inc, axis=1)                  # S_1 .. S_50 per path
S50 = walks[:, -1]                              # S_50 per path

mean_S50 = S50.mean()
std_S50 = S50.std()
# E[S_n] along the time axis, averaged over all paths: should hug 0
mean_path = walks.mean(axis=0)                  # E[S_1]..E[S_50]

print("PART 1 -- symmetric random walk S_n is a martingale (E[S_n] = 0)")
print(f"  paths = {n_paths},  steps = {n_steps}")
print(f"  E[S_50]            = {mean_S50:+.4f}   (theory 0)")
print(f"  sd(S_50)           = {std_S50:.4f}   (theory sqrt(50) = "
      f"{np.sqrt(50):.4f})")
print(f"  max |E[S_n]| over n=1..50 = {np.abs(mean_path).max():.4f}   "
      f"(theory 0 at every n)")
print("  a few sample paths' RUNNING MEAN  S_n / n  (-> 0 as n grows):")
print(f"  {'path':>5} | {'S_10/10':>9} | {'S_30/30':>9} | {'S_50/50':>9}")
print("  " + "-" * 40)
for i in range(5):
    r10 = walks[i, 9] / 10.0
    r30 = walks[i, 29] / 30.0
    r50 = walks[i, 49] / 50.0
    print(f"  {i:>5} | {r10:>9.4f} | {r30:>9.4f} | {r50:>9.4f}")

PART 1 -- symmetric random walk S_n is a martingale (E[S_n] = 0)
  paths = 200000,  steps = 50
  E[S_50]            = -0.0034   (theory 0)
  sd(S_50)           = 7.0782   (theory sqrt(50) = 7.0711)
  max |E[S_n]| over n=1..50 = 0.0245   (theory 0 at every n)
  a few sample paths' RUNNING MEAN  S_n / n  (-> 0 as n grows):
   path |   S_10/10 |   S_30/30 |   S_50/50
  ----------------------------------------
      0 |    0.4000 |    0.3333 |    0.2400
      1 |   -0.2000 |   -0.2000 |   -0.1200
      2 |    0.0000 |    0.0667 |    0.0800
      3 |    0.2000 |    0.2667 |    0.2000
      4 |   -0.4000 |   -0.0667 |    0.0400

পাঠোদ্ধার (read-off)।

গড় সব সময়ে শূন্য, পৃথক পথ নয়। $200000$ পথে $\mathbb E[S_{50}]=\mathbf{-0.0034}$ ($\approx0$), আর গোটা $n=1,\dots,50$ জুড়ে $\max_n\lvert\mathbb E[S_n]\rvert=\mathbf{0.0245}$ — অর্থাৎ প্রতিটি সময়ে গড় শূন্যেই আটকে, ঠিক যেমন martingale-এর ধ্রুব-গড় দাবি করে। এটিই "ন্যায্য": কোনো drift নেই, কোনো গোপন প্রবণতা নেই।
শূন্য গড় ≠ নিশ্চলতা। $S_{50}$-এর standard deviation $\mathbf{7.0782}\approx\sqrt{50}=7.0711$ — অর্থাৎ পৃথক পথ গড়ে $\pm7$ মাপে দূরে ছিটকে যায়, যদিও তাদের গড় শূন্য। martingale তাই বায়াসহীন, নিশ্চল নয় — গড় সমতল, কিন্তু পথ বুনোভাবে দোলে।
running mean শূন্যের দিকে নামে। কয়েকটা পথের $S_n/n$ দেখায় $n$ বড় হলে ওঠানামা কমে শূন্যের দিকে গুটিয়ে আসে (যেমন path $4$: $-0.40\to-0.07\to0.04$) — এ-ই strong law-এর ($S_n/n\to0$) আগাম ঝলক, আর martingale convergence (7.9)-এর সেতু।

৫.২ · Gambler's ruin — optional stopping theorem (যখন উপপাদ্য খাটে)¶

এবার stopping time (থামার সময়) যোগ হয়। symmetric $\pm1$ walk শূন্য থেকে শুরু, শোষক বাধা (absorbing barrier) $-a=-8$ ও $+b=+4$; $\tau$ = প্রথম যখন walk কোনো বাধা ছোঁয়। এখানে $\tau$ a.s. সসীম এবং $\mathbb E[\tau]<\infty$ ও increment bounded — তাই optional stopping theorem খাটে: $\mathbb E[S_\tau]=\mathbb E[S_0]=0$। এটিই ruin-সম্ভাবনা পিন করে — $\mathbb P(+b)=\frac{a}{a+b}=\frac{8}{12}=0.6667$ — আর যেহেতু $S_n^2-n$-ও martingale (Doob decomposition, §৪), গড় থামার সময় $\mathbb E[\tau]=ab=8\times4=32$।

# =====================================================================
# PART 2 -- Gambler's ruin / optional stopping (the theorem HOLDS).
#           Symmetric +-1 walk from 0, absorbing barriers at -a = -8
#           and +b = +4.  tau = first time the walk hits -a or +b.
#           tau is finite a.s. AND E[tau] < infinity with bounded
#           increments -> optional stopping applies to the martingale S:
#               E[S_tau] = E[S_0] = 0.
#           This pins the ruin probabilities:
#               P(hit +b) = a/(a+b) = 8/12 = 0.6667,
#               P(hit -a) = b/(a+b) = 4/12 = 0.3333,
#           and (since S^2 - n is also a martingale) E[tau] = a*b = 32.
# =====================================================================
a, b = 8, 4                                     # barriers at -8 and +4
n_games = 200_000
hit_top = np.empty(n_games, dtype=bool)         # did this game hit +b ?
S_tau = np.empty(n_games)                        # value of S at stopping
tau = np.empty(n_games)                          # stopping time

for g in range(n_games):
    pos = 0
    t = 0
    # (2) gambler's-ruin loop pulls +-1 steps from the SAME generator
    while -a < pos < b:
        pos += 1 if rng.random() < 0.5 else -1
        t += 1
    hit_top[g] = (pos == b)
    S_tau[g] = pos
    tau[g] = t

p_top = hit_top.mean()
mean_Stau = S_tau.mean()
mean_tau = tau.mean()

print("\nPART 2 -- gambler's ruin, barriers -8 and +4 : optional stopping HOLDS")
print(f"  games = {n_games}")
print(f"  P(hit +b=+4)   = {p_top:.4f}   (theory a/(a+b) = 8/12 = "
      f"{a/(a+b):.4f})")
print(f"  P(hit -a=-8)   = {1 - p_top:.4f}   (theory b/(a+b) = 4/12 = "
      f"{b/(a+b):.4f})")
print(f"  E[S_tau]       = {mean_Stau:+.4f}   (theory E[S_0] = 0)")
print(f"  E[tau]         = {mean_tau:.4f}   (theory a*b = 8*4 = {a*b})")
print(f"  check: a*P(top) - b*(1-P(top)) = "
      f"{a*p_top - b*(1 - p_top):+.4f}   (= E[S_tau] ~ 0)")

PART 2 -- gambler's ruin, barriers -8 and +4 : optional stopping HOLDS
  games = 200000
  P(hit +b=+4)   = 0.6654   (theory a/(a+b) = 8/12 = 0.6667)
  P(hit -a=-8)   = 0.3346   (theory b/(a+b) = 4/12 = 0.3333)
  E[S_tau]       = -0.0152   (theory E[S_0] = 0)
  E[tau]         = 31.9944   (theory a*b = 8*4 = 32)
  check: a*P(top) - b*(1-P(top)) = +3.9848   (= E[S_tau] ~ 0)

পাঠোদ্ধার।

ruin-সম্ভাবনা তত্ত্ব ছুঁয়ে ফেলে। $\mathbb P(\text{hit }+4)=\mathbf{0.6654}\approx\frac{8}{12}=0.6667$, এবং $\mathbb P(\text{hit }-8)=\mathbf{0.3346}\approx\frac{4}{12}=0.3333$। লক্ষণীয়, কাছের বাধা ($+4$) ছোঁয়ার সম্ভাবনা বেশি, দূরের ($-8$) কম — অনুপাত ঠিক উল্টো দূরত্বে $a:b=8:4$, যা optional stopping থেকে সরাসরি বেরোয়।
$\mathbb E[S_\tau]=0$ — ন্যায্যতা থামার পরেও টিকে থাকে। $\mathbb E[S_\tau]=\mathbf{-0.0152}\approx0=\mathbb E[S_0]$; আর হিসাব $a\,\mathbb P(+b)-b\,\mathbb P(-a)=8(0.6654)-4(0.3346)=\mathbf{+3.9848}$ — অর্থাৎ $b\cdot\frac{a}{a+b}-a\cdot\frac{b}{a+b}$-কে সংখ্যায় ভেরিফাই করে দেখায় শোষক বাধায় থেমেও martingale-এর গড় শূন্যই থাকে। ন্যায্য খেলা যেকোনো (বৈধ) থামার নিয়মেও ন্যায্য।
$\mathbb E[\tau]=ab=32$। গড় থামার সময় $\mathbf{31.9944}\approx32$ — এটি দ্বিতীয় martingale $S_n^2-n$-এর optional stopping থেকে আসে ($\mathbb E[S_\tau^2]=\mathbb E[\tau]$, §৪-এর Doob decomposition)। তাই একই simulation দুটো martingale-পরিচয় একসাথে যাচাই করে — drift-হীন $S_n$ এবং compensator-অপসারিত $S_n^2-n$।

৫.৩ · Optional stopping ভেঙে পড়ে — যখন hypothesis মেটে না¶

optional stopping theorem শর্তসাপেক্ষ — তিন hypothesis-গুচ্ছের অন্তত একটি লাগে (§৪)। একটিও না মিটলে উপপাদ্য ভাঙে। ধ্রুপদী পাল্টা-উদাহরণ: একই ন্যায্য $\pm1$ walk, কিন্তু $\tau=$ প্রথম $+1$-এ পৌঁছানোর সময় (first passage to $+1$)। walk recurrent, তাই $\tau<\infty$ a.s. এবং প্রতিটি থামা-পথে $S_\tau=+1$ — অর্থাৎ $\mathbb E[S_\tau]=1\ne0=\mathbb E[S_0]$। বিরোধ নয়: এখানে $\mathbb E[\tau]=\infty$ (এবং $\tau$ ও $S$ unbounded), তাই কোনো hypothesis-ই মেটে না। এটি ফাঁস করতে $N=10^5$ ধাপে cap বসানো হয় — $+1$ ছুঁলে থামা ($S_\tau=+1$), নইলে cap-এ আটকে যাওয়া; cap-এ আটকা পথের ভগ্নাংশ শূন্যের বেশি এবং তাদের অবস্থান গভীর-ঋণাত্মক — এ-ই $\mathbb E[\tau]=\infty$-এর প্রত্যক্ষ প্রমাণ।

# =====================================================================
# PART 3 -- Optional stopping FAILS without a hypothesis.
#           Same fair +-1 walk, but tau = first passage to +1.
#           THEORY: the walk is recurrent, so tau < infinity a.s. and
#           S_tau = +1 on EVERY path  =>  E[S_tau] = 1 != 0 = E[S_0].
#           Optional stopping is NOT contradicted: its hypotheses fail,
#           because E[tau] = INFINITY (and tau is unbounded, S is
#           unbounded).  We expose this by CAPPING at N = 1e5 steps:
#             - whenever a path hits +1 it stops with S_tau = +1;
#             - the cap is hit on a noticeable fraction of paths, and
#               among capped paths tau is enormous -> E[tau] diverges.
#           Conclusion: E[S_tau] ~ 1 (not 0); the "E[tau] < inf"
#           hypothesis is violated, so E[S_tau] = E[S_0] need not hold.
# =====================================================================
n_fp = 20_000
CAP = 100_000                                    # N = 1e5 step cap
S_fp = np.empty(n_fp)                            # S at stop-or-cap
tau_fp = np.empty(n_fp)                          # steps used (capped)
capped = np.empty(n_fp, dtype=bool)             # cap reached before +1 ?

for g in range(n_fp):
    pos = 0
    t = 0
    # (3) first-passage loop, same generator, hard cap at CAP steps
    while pos < 1 and t < CAP:
        pos += 1 if rng.random() < 0.5 else -1
        t += 1
    capped[g] = (pos < 1)                        # never reached +1 in time
    S_fp[g] = pos
    tau_fp[g] = t

frac_capped = capped.mean()
med_tau_fp = np.median(tau_fp)                    # typical tau is tiny ...
mean_tau_fp = tau_fp.mean()                       # ... but the MEAN blows up
# paths that actually reached +1 -> S_tau = +1 EXACTLY (this is the theorem
# target: tau<inf a.s., S_tau=1 on every stopped path).  The capped paths
# are precisely the rare-but-heavy negative tail that makes E[tau] = inf.
reached = ~capped
Stau_reached = S_fp[reached].mean()              # must be exactly 1.0000
mean_tau_reached = tau_fp[reached].mean() if reached.any() else float("nan")
max_tau_reached = tau_fp[reached].max() if reached.any() else float("nan")
mean_pos_capped = S_fp[capped].mean() if capped.any() else float("nan")

print("\nPART 3 -- first passage to +1 : optional stopping FAILS (E[tau]=inf)")
print(f"  paths = {n_fp},  step cap N = {CAP}")
print(f"  E[S_tau | reached +1] = {Stau_reached:+.4f}   "
      f"(EXACT: S_tau = +1 on every stopped path,  != 0 = E[S_0])")
print(f"  fraction NOT done after {CAP} steps (cap hit) = {frac_capped:.4f}   "
      f"(> 0  =>  tau is unbounded)")
print(f"  median tau            = {med_tau_fp:.1f}   "
      f"(typical first passage is SHORT)")
print(f"  mean   tau (capped)   = {mean_tau_fp:.1f}   "
      f"(already huge & still grows with the cap -> true E[tau] = INFINITY)")
print(f"  among paths reaching +1:  mean tau = {mean_tau_reached:.1f},  "
      f"max tau = {max_tau_reached:.0f}")
print(f"  capped paths sit deep below 0:  mean position = {mean_pos_capped:.1f}")
print(f"  => S_tau = +1 (not 0) on every stopped path: the conserved-mean")
print(f"     identity E[S_tau]=E[S_0] BREAKS because E[tau]=inf (hypothesis")
print(f"     violated); the rare deep-negative capped paths carry the gap.")

PART 3 -- first passage to +1 : optional stopping FAILS (E[tau]=inf)
  paths = 20000,  step cap N = 100000
  E[S_tau | reached +1] = +1.0000   (EXACT: S_tau = +1 on every stopped path,  != 0 = E[S_0])
  fraction NOT done after 100000 steps (cap hit) = 0.0027   (> 0  =>  tau is unbounded)
  median tau            = 3.0   (typical first passage is SHORT)
  mean   tau (capped)   = 564.7   (already huge & still grows with the cap -> true E[tau] = INFINITY)
  among paths reaching +1:  mean tau = 290.5,  max tau = 98395
  capped paths sit deep below 0:  mean position = -400.1
  => S_tau = +1 (not 0) on every stopped path: the conserved-mean
     identity E[S_tau]=E[S_0] BREAKS because E[tau]=inf (hypothesis
     violated); the rare deep-negative capped paths carry the gap.

পাঠোদ্ধার।

$\mathbb E[S_\tau]=1$, শূন্য নয় — উপপাদ্য ভেঙেছে। যে পথগুলো আসলে থেমেছে, তাদের প্রতিটিতে $S_\tau$ ঠিক $+1$, তাই $\mathbb E[S_\tau\mid\text{reached}]=\mathbf{+1.0000}$ (হুবহু, কোনো approximation নয়) $\ne0=\mathbb E[S_0]$। ৫.২-এর gambler's ruin-এ যেখানে $\mathbb E[S_\tau]=0$ মিলেছিল, এখানে একই martingale, একই walk, কিন্তু থামার নিয়ম বদলানোয় গড় $0$ থেকে $1$-এ লাফ দিল — থামার নিয়ম নির্দোষ নয়।
কারণ $\mathbb E[\tau]=\infty$। typical first passage ছোট (median $\tau=\mathbf{3.0}$), কিন্তু $10^5$ ধাপেও $\mathbf{0.0027}$ ভগ্নাংশ পথ থামেনি, আর তাদের অবস্থান গড়ে $\mathbf{-400.1}$ — গভীর ঋণাত্মক। এই বিরল-কিন্তু-ভারী লেজই গড় $\tau$-কে ($\mathbf{564.7}$, cap বাড়ালে আরও বাড়ে) অসীমে ঠেলে দেয়। তিন hypothesis ($\tau$ bounded / $S$ bounded / $\mathbb E[\tau]<\infty$) — একটিও মেটে না।
শিক্ষা — শর্ত পড়েই উপপাদ্য খাটাতে হয়। martingale হলেই $\mathbb E[S_\tau]=\mathbb E[S_0]$ "এমনিতেই" সত্য নয়; doubling-কৌশল ও first-passage এই কারণেই বাস্তবে কাজ করে না (অসীম পুঁজি/সময় লাগে)। ৫.২ আর ৫.৩-এর বৈপরীত্যই অধ্যায়ের কেন্দ্রীয় সতর্কবার্তা: optional stopping একটি শর্তসাপেক্ষ উপপাদ্য।

৫.৪ · Product martingale — গুণফলেও গড় এক¶

শেষ অংশ যোগ-কাঠামো থেকে গুণ-কাঠামোয় যায়। $\xi_i=\pm1$ ন্যায্য, $M_n=\prod_{i\le n}(1+0.05\,\xi_i)$, $M_0=1$ — প্রতিটি গুণনীয়ক $\{0.95,1.05\}$, আর $\mathbb E[1+0.05\,\xi]=1$। গুণনীয়কগুলো past থেকে স্বাধীন, তাই $\mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\cdot\mathbb E[1+0.05\,\xi_{n+1}]=M_n$ — martingale, এবং $\mathbb E[M_n]=\mathbb E[M_0]=1$ সব $n$-এ। এটি ৫.১-এর যোগাত্মক walk-এর গুণাত্মক অ্যানালগ (likelihood-ratio martingale-এর গোড়াও এখানেই), আর এটি সর্বদা ধনাত্মক থাকে। $200000$ পথে $\mathbb E[M_{40}]\approx1$ ও তার কম ছড়ানো যাচাই—

# =====================================================================
# PART 4 -- A product martingale.
#           xi_i = +-1 fair, M_n = prod_{i<=n} (1 + 0.05 * xi_i), M_0 = 1.
#           Each factor has E[1 + 0.05 xi] = 1, and the factors are
#           independent of the past, so
#               E[M_{n+1} | F_n] = M_n * E[1 + 0.05 xi_{n+1}] = M_n.
#           Hence M_n is a martingale with E[M_n] = E[M_0] = 1 for all n.
#           We check E[M_40] ~ 1 with low spread (the multiplicative
#           analogue of the additive walk in Part 1).
# =====================================================================
n_prod = 200_000
m_steps = 40
# (4) draw the product-martingale increments LAST: +-1 fair coins
xi = rng.choice(np.array([-1.0, 1.0]), size=(n_prod, m_steps))
factors = 1.0 + 0.05 * xi                        # each in {0.95, 1.05}
M = np.prod(factors, axis=1)                     # M_40 per path

mean_M40 = M.mean()
std_M40 = M.std()
# theory sd of M_40: E[M^2] = (E[(1+0.05xi)^2])^40 = (1 + 0.05^2)^40
e_m2 = (1.0 + 0.05**2) ** m_steps
var_M40_theory = e_m2 - 1.0
sd_M40_theory = np.sqrt(var_M40_theory)

print("\nPART 4 -- product martingale M_n = prod(1 + 0.05*xi_i) : E[M_40] = 1")
print(f"  paths = {n_prod},  steps = {m_steps}")
print(f"  E[M_40]        = {mean_M40:.4f}   (theory 1)")
print(f"  sd(M_40)       = {std_M40:.4f}   (theory sqrt((1+0.05^2)^40 - 1) = "
      f"{sd_M40_theory:.4f})")
print(f"  min / max M_40 = {M.min():.4f} / {M.max():.4f}   "
      f"(stays positive; M_n > 0 always)")
print(f"  fraction with M_40 < 1 = {(M < 1).mean():.4f}   "
      f"(~ half, by symmetry of the spread about 1)")

PART 4 -- product martingale M_n = prod(1 + 0.05*xi_i) : E[M_40] = 1
  paths = 200000,  steps = 40
  E[M_40]        = 1.0000   (theory 1)
  sd(M_40)       = 0.3244   (theory sqrt((1+0.05^2)^40 - 1) = 0.3241)
  min / max M_40 = 0.2343 / 3.8617   (stays positive; M_n > 0 always)
  fraction with M_40 < 1 = 0.5635   (~ half, by symmetry of the spread about 1)

পাঠোদ্ধার।

গুণফলেও গড় ঠিক এক। $\mathbb E[M_{40}]=\mathbf{1.0000}$ (তত্ত্ব $1$) — যদিও কাঠামো এবার গুণাত্মক। এটিই martingale-ধর্মের সর্বজনীনতা: যোগে increment-এর শর্তাধীন গড় $0$, গুণে গুণনীয়কের শর্তাধীন গড় $1$ — দুই ক্ষেত্রেই $\mathbb E[X_n]=\mathbb E[X_0]$ অটুট।
কম ছড়ানো, এবং সর্বদা ধনাত্মক। $\mathrm{sd}(M_{40})=\mathbf{0.3244}\approx\sqrt{(1+0.05^2)^{40}-1}=0.3241$ — তত্ত্বের সাথে হুবহু; আর $M_{40}\in[\mathbf{0.2343},\mathbf{3.8617}]$, কখনো $\le0$ নয় (গুণনীয়ক সব ধনাত্মক)। প্রায় অর্ধেক পথে ($\mathbf{0.5635}$) $M_{40}<1$ — অর্থাৎ গড় $1$ হলেও অধিকাংশ পথ $1$-এর নিচে, কারণ গুণফল-বণ্টন ডানদিকে লেজ-টানা (right-skewed)। গড় টানে কম-সংখ্যক বড় মান।
সংযোগ। এই ধনাত্মক martingale-ই likelihood-ratio martingale ও finance-এর discounted-price martingale-এর প্রোটোটাইপ; তার সর্বদা-ধনাত্মকতা ও ধ্রুব-গড় ($=1$) পরে martingale convergence (7.9) — $M_n\to M_\infty$ a.s. — এবং change-of-measure-এর ভিত্তি।

সারসংক্ষেপ¶

চারটি অংশ একসুতোয় গাঁথে এই অধ্যায়ের যুক্তি-শৃঙ্খল — martingale → stopping → optional sampling (ও তার শর্ত) → গুণাত্মক রূপ:

অংশ	দাবি	মূল সংখ্যা
৫.১	symmetric walk martingale; $\mathbb E[S_n]=0$ সব $n$-এ	$\mathbb E[S_{50}]=\mathbf{-0.0034}$, $\max_n\lvert\mathbb E[S_n]\rvert=\mathbf{0.0245}$, $\mathrm{sd}=\mathbf{7.08}$
৫.২	gambler's ruin; optional stopping খাটে	$\mathbb P(+4)=\mathbf{0.6654}$ ($\approx\tfrac{8}{12}$), $\mathbb E[S_\tau]=\mathbf{-0.015}$ ($\approx0$), $\mathbb E[\tau]=\mathbf{31.99}$ ($\approx32$)
৫.৩	first passage to $+1$; optional stopping ভাঙে	$\mathbb E[S_\tau]=\mathbf{+1.0000}\ne0$; cap-hit $\mathbf{0.27\%}$; $\mathbb E[\tau]=\infty$
৫.৪	product martingale; $\mathbb E[M_n]=1$	$\mathbb E[M_{40}]=\mathbf{1.0000}$, $\mathrm{sd}=\mathbf{0.3244}$ ($\approx0.3241$)

একই মূল ধারণা — $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ থেকে ধ্রুব-গড় $\mathbb E[X_n]=\mathbb E[X_0]$ — চার মুখে ধরা দিল। যোগাত্মক walk-এ গড় সব সময়ে শূন্য, যদিও পথ $\sqrt n$-মাপে দোলে (৫.১); সেই martingale-কে একটা stopping time-এ থামালে — শর্ত মিটলে — গড় থামার পরেও সংরক্ষিত থাকে, যা gambler's ruin-এর $\mathbb P(+b)=\tfrac{a}{a+b}$ ও $\mathbb E[\tau]=ab$ পিন করে (৫.২); কিন্তু শর্ত ($\mathbb E[\tau]<\infty$) ভাঙলে — first passage-এ — সেই সংরক্ষণ ভেঙে $\mathbb E[S_\tau]=1\ne0$ হয়ে যায়, যা optional stopping theorem একটি শর্তসাপেক্ষ উপপাদ্য এই কেন্দ্রীয় সতর্কবার্তা দেয় (৫.৩); আর একই ধ্রুব-গড় গুণাত্মক কাঠামোতেও ($\mathbb E[M_n]=1$, সর্বদা ধনাত্মক, কম ছড়ানো) টিকে থাকে (৫.৪)। একটিমাত্র seed (20260619), একটিমাত্র draw-ক্রম — martingale-এর সংজ্ঞা থেকে optional sampling ও তার সীমা পর্যন্ত গোটা শৃঙ্খল সংখ্যায় ধরা পড়ল, এবং এটিই 7.9-এর martingale convergence ও Doob's inequalities-এর সরাসরি প্রস্তুতি।

৬ · ভিজ্যুয়ালাইজেশন¶

§১–৫-এর গোটা martingale (মার্টিঙ্গেল)-তত্ত্ব এতক্ষণ চলেছে শর্তাধীন প্রত্যাশা, $\sigma$-বীজগণিত আর অসমতার ভাষায় — বিমূর্ত, কিন্তু প্রতিটি বিবৃতির পিছনে আছে একটা ভীষণ দৃশ্যমান ছবি: এলোমেলো-হাঁটা পথ কীভাবে ছড়ায়, কোথায় থামে, কোথায় ন্যায্যতা টিকে থাকে আর কোথায় ভেঙে পড়ে। এই অংশে চারটে ছবি সেই স্বজ্ঞাকে চোখের সামনে এনে দেয়। প্রতিটি ছবি একই বীজে (np.random.default_rng(20260619)) সিমুলেট করা, তাই পুনরুৎপাদনযোগ্য — আপনি নিজে কোড চালালে হুবহু একই পথ পাবেন। ছবির ভেতরের সব লেখা ইংরেজিতে (matplotlib-এ বাংলা হরফ বিশ্বস্তভাবে আসে না), কিন্তু তার পাঠ ও তাৎপর্য নিচের বাংলা গদ্যে গুছিয়ে দেওয়া। চারটে ছবি একসঙ্গে গল্পের একটা চাপ তৈরি করে: প্রথমে martingale-এর সংজ্ঞা ("গড় সমতল, ছড়ানো বাড়ে"), তারপর optional stopping-এর সফল প্রয়োগ (gambler's ruin), তারপর তার নাটকীয় ব্যর্থতা (অসীম প্রত্যাশিত থামার সময়), আর শেষে Doob পচন — submartingale-কে martingale ও ক্ষতিপূরকে ভাঙা।

৬.১ martingale পথ — গড় সমতল, ছড়ানো বাড়ে¶

প্রথম ছবিটা martingale-এর হৃদয় ছুঁয়ে দেখায়। নিরপেক্ষ মুদ্রা-হাঁটা $S_n=\sum_{i=1}^n\xi_i$ ($\xi_i=\pm1$ সমসম্ভাব্য) থেকে ১২টা স্বাধীন পথ আঁকা। চোখে পড়ে দুটো জিনিস একসঙ্গে। এক, কোনো একটা পথ কোথায় যাবে তা মোটেই অনুমেয় নয় — কেউ উপরে ভাসে, কেউ নিচে ডোবে। দুই, তবু পুরো গুচ্ছটা গড়ে $0$-এর গা ঘেঁষেই থাকে: কালো ভাঙা-রেখা $\mathbb E[S_n]=0$ একদম সমতল। এটাই martingale-সমতা $\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n$-এর প্রত্যক্ষ ছাপ — tower property দিয়ে $\mathbb E[S_n]=\mathbb E[S_0]=0$ সব $n$-তে, যত দূরই হাঁটা যাক।

কিন্তু "গড় সমতল" মানে "কিছু ঘটছে না" নয়। ধূসর বিন্দু-রেখা দুটো $\pm\sqrt{n}$ দেখায় — এক প্রমিত বিচ্যুতির খাম, কারণ $\operatorname{Var}(S_n)=n$, তাই $\operatorname{sd}(S_n)=\sqrt n$। সময়ের সঙ্গে এই খাম ক্রমশ চওড়া হয়: গড় না-সরলেও অনিশ্চয়তা বাড়ে। martingale তাই "স্থির" নয়, "ন্যায্য" — প্রতি ধাপের প্রত্যাশিত লাভ ঠিক শূন্য, কিন্তু ঝুঁকি জমতে থাকে। এই দুই বৈশিষ্ট্যের টানাপোড়েন — সমতল কেন্দ্র বনাম বর্ধমান ছড়ানো — পরের তিন ছবিরই ভিত্তি।

steps, n_paths = 60, 12
n = np.arange(steps + 1)
xi = rng.choice([-1, 1], size=(n_paths, steps))
S = np.zeros((n_paths, steps + 1), dtype=int)
S[:, 1:] = xi.cumsum(axis=1)                  # S_0=0, then partial sums

for k in range(n_paths):
    ax.plot(n, S[k], lw=1.1, alpha=0.8, color=plt.cm.viridis(k / n_paths))
ax.plot(n,  np.sqrt(n), color=GREY, ls=":")   # +1 s.d. envelope
ax.plot(n, -np.sqrt(n), color=GREY, ls=":")
ax.axhline(0.0, color="black", ls="--")        # E[S_n] = 0 stays flat

$১২টি নিরপেক্ষ random-walk martingale পথ; গড় $\mathbb E[S_n]=0$ সমতল, ছড়ানো $\sqrt n$ হারে বাড়ে।$

৬.২ optional stopping সফল — gambler's ruin¶

দ্বিতীয় ছবিটা optional stopping theorem (ঐচ্ছিক-থামার উপপাদ্য)-এর সবচেয়ে সুন্দর প্রয়োগ — gambler's ruin (জুয়াড়ির সর্বনাশ)। খেলোয়াড় $0$ থেকে শুরু করে; থামে যখন হয় ভাগ্য $+4$-এ ওঠে (জয়, $b=4$) নয়তো $-8$-এ নামে (সর্বনাশ, $a=8$)। প্রতিটি পথ তার থামার বিন্দু stopping time (থামার সময়) $\tau$-তে একটা বিন্দু দিয়ে চিহ্নিত — সবুজ হলে জয়, লাল হলে সর্বনাশ। লক্ষণীয়, $\tau$ একটা বৈধ stopping time, কারণ "এখনই থামব কিনা" সিদ্ধান্ত শুধু এ-পর্যন্ত দেখা পথের উপরেই নির্ভর করে, ভবিষ্যৎ-জ্ঞান লাগে না।

এখন জাদুটা। $(S_n)$ martingale আর $S_\tau$ পরিবদ্ধ ($-8\le S_\tau\le 4$), তাই optional stopping বলে $\mathbb E[S_\tau]=\mathbb E[S_0]=0$। কিন্তু $S_\tau$ মাত্র দুটো মান নেয়: $+4$ (সম্ভাবনা $p$) বা $-8$ (সম্ভাবনা $1-p$)। তাই $0=4p-8(1-p)$, যা মেলালে $p=\tfrac{8}{12}=\tfrac{a}{a+b}=\tfrac23$। অর্থাৎ একটামাত্র সমীকরণ — $\mathbb E[S_\tau]=0$ — থেকে জয়ের সম্ভাবনা সরাসরি বেরিয়ে আসে, কোনো কঠিন পুনরাবৃত্ত হিসাব ছাড়াই। ছবিতে দেখুন কাছের ($+4$) বাধা দূরের ($-8$) বাধার চেয়ে বেশি পথ টানছে — এই জ্যামিতিই $\tfrac23$ বনাম $\tfrac13$ অনুপাতের মূল।

lo, hi = -8, 4                          # ruin and win barriers
for k in range(n_paths):
    S = walk(max_steps)                  # one symmetric +/-1 walk
    t = np.where((S >= hi) | (S <= lo))[0][0]   # first barrier hit = tau
    path = S[:t + 1]
    col = GREEN if path[-1] >= hi else RED
    ax.plot(np.arange(t + 1), path, color=col)
    ax.plot(t, path[-1], "o", color=col)         # mark the stopping point

ax.axhline(hi, color=GREEN, ls="--")     # P(hit +4) = a/(a+b) = 2/3, so E[S_tau]=0
ax.axhline(lo, color=RED,   ls="--")

$Gambler's ruin: $-8$ ও $+4$ বাধার মাঝে নিরপেক্ষ হাঁটা, প্রতিটি $\tau$-তে থামানো; $P(\text{hit }+4)=\tfrac23$।$

৬.৩ optional stopping ভেঙে পড়ে — অসীম থামার সময়¶

তৃতীয় ছবিটা সমান গুরুত্বপূর্ণ: কখন উপপাদ্যটা ব্যর্থ হয়। এখানে $\tau=$ "$+1$-এ প্রথম পৌঁছানোর সময়"। নিরপেক্ষ হাঁটা recurrent (পুনরাবৃত্ত) বলে $+1$-এ পৌঁছানো নিশ্চিত (সম্ভাবনা $1$), তাই $S_\tau=1$ সবসময় — মান একটাই, ছড়ানো নেই। তাহলে কি $\mathbb E[S_\tau]=1$? কিন্তু $\mathbb E[S_0]=0$! optional stopping তাহলে এখানে $0=1$ বলবে — যা অসম্ভব। উপপাদ্যটা ভাঙল কোথায়?

ছবি উত্তরটা চিৎকার করে বলে। দুটো পথ আঁকা: একটা $+1$ ছোঁয়ার আগে $-27$-এ নামে, আরেকটা ভয়াবহভাবে $-101$ পর্যন্ত ডুবে যায়, আর তা ঘটে কয়েক হাজার ধাপ পরে ($\tau\approx 485$ ও $\tau\approx 4291$)। এটাই সূত্র: $+1$ ছোঁয়া নিশ্চিত হলেও তাতে কত সময় লাগবে তার প্রত্যাশা অসীম — $\mathbb E[\tau]=\infty$। optional stopping-এর শর্ত (যেমন $\tau$ পরিবদ্ধ, বা থামা-পর্যন্ত প্রক্রিয়াটি uniformly integrable) এখানে গুঁড়িয়ে যায়, কারণ গভীর-ঋণাত্মক ভ্রমণ যত-বড়-ইচ্ছা হতে পারে। শিক্ষা: $\mathbb E[X_\tau]=\mathbb E[X_0]$ এমনি-এমনি খাটে না; $\tau$-এর উপর নিয়ন্ত্রণ-শর্ত আবশ্যক। এই একটা পাল্টা-উদাহরণ মনে রাখলে উপপাদ্যটা যান্ত্রিকভাবে প্রয়োগ করার ভুল আর হবে না।

target = 1
S = walk(big)                            # very long symmetric walk
t = np.where(S >= target)[0][0]          # tau = first hit of +1
path = S[:t + 1]
ax.plot(np.arange(t + 1), path)          # dips to min(path) (e.g. -101) before the hit
ax.plot(t, path[-1], "o")                # S_tau = 1 always...
ax.axhline(target, color=GREEN, ls="--") # ...but E[tau]=inf => E[S_tau]=1 != 0

$$+1$-এ প্রথম পৌঁছানো: $S_\tau=1$ সর্বদা, কিন্তু গভীর ঋণাত্মক ভ্রমণে $\mathbb E[\tau]=\infty$, তাই $\mathbb E[S_\tau]\neq0$।$

৬.৪ Doob পচন — submartingale = martingale + ক্ষতিপূরক¶

শেষ ছবিটা Doob decomposition (ডুব পচন) চোখের সামনে খুলে দেয়। $S_n^2$ নিন। যেহেতু $\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2$ (এক ধাপে ভেদ ঠিক $1$ বাড়ে), $(S_n^2)$ একটা submartingale (সাব-মার্টিঙ্গেল) — গড়ে উপরে টানে। নীল রেখায় দেখুন: $S_n^2$ এবড়োখেবড়োভাবে লাফায় (যখন $S_n$ শূন্যে ফেরে, $S_n^2$ও $0$-এ নামে), কিন্তু সামগ্রিক প্রবণতা ঊর্ধ্বমুখী।

Doob পচন বলে যেকোনো submartingale-কে অনন্যভাবে দুটো অংশে ভাঙা যায়: একটা martingale যোগ একটা বর্ধমান predictable (পূর্বানুমেয়) compensator (ক্ষতিপূরক)। এখানে হিসাব পরিষ্কার — ক্ষতিপূরক $A_n=n$ (কমলা সরলরেখা), কারণ প্রতি ধাপের প্রত্যাশিত বৃদ্ধি ঠিক $1$, আর সেই অনুমেয় বৃদ্ধি জমে $A_n=n$ হয়; বাকিটা martingale $M_n=S_n^2-n$ (সবুজ রেখা)। সবুজ রেখা $0$-এর চারপাশে ওঠানামা করে কিন্তু কোনো প্রবণতা নেই — ঠিক যা martingale-এর কাছে আশা করা যায় ($\mathbb E[M_n]=0$)। তিন রেখা একসঙ্গে সমীকরণটা দৃশ্যমান করে: প্রতি $n$-তে $\text{(নীল)}=\text{(সবুজ)}+\text{(কমলা)}$, অর্থাৎ এবড়োখেবড়ো বৃদ্ধি = বিশুদ্ধ ভাগ্য (martingale) + অনুমেয় প্রবণতা (ক্ষতিপূরক)। এই বিভাজনই ভেদ-প্রক্রিয়া (variance process), stochastic calculus আর quadratic variation-এর বীজ।

S = walk(60)
n = np.arange(len(S))
sub  = S ** 2                            # submartingale S_n^2 (jagged, rising)
comp = n.astype(float)                    # predictable compensator A_n = n
mart = sub - n                            # martingale part M_n = S_n^2 - n

ax.plot(n, sub,  color=BLUE,   marker="o", label=r"submartingale $S_n^2$")
ax.plot(n, comp, color=ORANGE, ls="--",   label=r"compensator $A_n = n$")
ax.plot(n, mart, color=GREEN,             label=r"martingale $M_n = S_n^2 - n$")
# S_n^2  =  (S_n^2 - n)  +  n   ==>  submartingale = martingale + compensator

$Doob পচন: submartingale $S_n^2$ (নীল) = martingale $S_n^2-n$ (সবুজ, $0$-এর চারপাশে) + ক্ষতিপূরক $n$ (কমলা সরলরেখা)।$

৭ · অনুশীলনী¶

নিচের অনুশীলনীগুলো অধ্যায়ের কেন্দ্রীয় বস্তু martingale (মার্টিঙ্গেল — ন্যায্য খেলা)-কে চার দিক থেকে যাচাই করে: কাঠামো (filtration $(\mathcal F_n)$, adapted vs predictable, এবং martingale-এর তিন শর্ত — integrability, adapted, $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$); মূল হাতিয়ার (martingale transform $(H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})$ — "ন্যায্য খেলা হারানো যায় না"); stopping time $\tau$ ও stopped process $X_{n\wedge\tau}$; optional stopping theorem (OST) $\mathbb E[X_\tau]=\mathbb E[X_0]$ — তার তিন hypothesis-গুচ্ছ, gambler's ruin প্রয়োগ, ও hypothesis ভাঙলে failure; এবং Doob decomposition (submartingale = martingale + predictable বর্ধমান compensator)। সমস্যাগুলো চার দলে সাজানো — ক (ধারণাগত), খ (গণনামূলক), গ (প্রমাণভিত্তিক), ঘ (কোডিং)। প্রতিটির শিরোনামে কঠিনতা-চিহ্ন (difficulty tag): ★ মৌলিক, ★★ মাঝারি, ★★★ গভীর। প্রতিটিতে একটি Hint: দেওয়া আছে।

পূর্ণাঙ্গ সমাধান (ধাপে-ধাপে): _solutions/07-08-martingales-solutions.md। আগে নিজে চেষ্টা করুন, তারপর মেলান।

প্রসঙ্গত গোটা অংশে একটা filtered probability space $(\Omega,\mathcal F,(\mathcal F_n)_{n\ge0},\mathbb P)$ ধরা; random variable বলতে measurable $X:\Omega\to\mathbb R$ (7.3), $\mathbb E[X]=\int_\Omega X\,d\mathbb P$ (7.4), $X\in L^1\iff\mathbb E\lvert X\rvert<\infty$। একটা process $(X_n)$ adapted যদি $X_n$ $\mathcal F_n$-measurable, predictable যদি $H_n$ $\mathcal F_{n-1}$-measurable। $(X_n)$ একটা martingale যদি তা integrable, adapted, এবং $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s. ($\ge$ হলে submartingale, $\le$ হলে supermartingale)। সর্বত্র conditioning-এ $\mid$ (raw উল্লম্ব-দণ্ড নয়), $\lvert\cdot\rvert$ পরম-মান, $\lVert\cdot\rVert$ norm। সব সিমুলেশন seed np.random.default_rng(20260619)-এ চালানো, যাতে সংখ্যাগুলো পুনরুৎপাদনযোগ্য থাকে।

ক · ধারণাগত¶

অনুশীলন ১ (★)¶

একটা integrable, adapted process $(X_n)$ কখন একটা martingale (মার্টিঙ্গেল) — অর্থাৎ "ন্যায্য খেলা" — তা ঠিক তিনটি শর্তে দাঁড়ায়। (ক) তিনটি শর্ত হুবহু লিখুন: (i) integrability, (ii) adapted, (iii) martingale property ($\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$) — এবং এক বাক্যে বলুন প্রতিটি কেন দরকার (যেমন integrability না-থাকলে $\mathbb E[\cdot\mid\mathcal F_n]$ সংজ্ঞায়িতই নয়, adapted না-হলে "$=X_n$" তুলনাই অর্থহীন)। (খ) submartingale ও supermartingale-এর সংজ্ঞা লিখুন (শর্ত iii-তে "$=$"-এর বদলে যথাক্রমে কী), এবং কোনটা "গড়ে বাড়ে", কোনটা "গড়ে কমে" তা চিহ্নিত করুন। (গ) এক বাক্যে: কেন martingale মানে "বায়াসহীন", কিন্তু "নিশ্চল" নয় — অর্থাৎ $(X_n)$ দিব্যি দুলতে-লাফাতে পারে, শর্ত কেবল পরবর্তী পদক্ষেপের গড় (বর্তমান তথ্যের সাপেক্ষে) শূন্য।

Hint: তিন শর্ত — (i) $X_n\in L^1$ (নইলে শর্তাধীন প্রত্যাশা অর্থহীন); (ii) $X_n$ $\mathcal F_n$-measurable ("এখনই জানা"); (iii) $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ ("আগামীকালের সেরা পূর্বাভাস = আজকের মান")। $\ge$ ⇒ submartingale (পক্ষে-ঝোঁকা, গড়ে বাড়ে), $\le$ ⇒ supermartingale (বিপক্ষে-ঝোঁকা, গড়ে কমে)। "বায়াসহীন": প্রতি ধাপের গড়-বৃদ্ধি শূন্য — কিন্তু পথ যত-খুশি দুলতে পারে। (← §২.৩)

অনুশীলন ২ (★)¶

একটা martingale $(X_n)$ ও একটা stopping time (থামার সময়) $\tau$ নিলে stopped process (থামানো প্রক্রিয়া) $X_n^\tau:=X_{n\wedge\tau}$ আবার একটা martingale — এই কথাটাই OST-এর ভিত্তি। (ক) এক-দুই বাক্যে স্বজ্ঞা দিন কেন থামালেও ন্যায্যতা টেকে — অর্থাৎ "$\tau$-তে থেমে যাওয়া" নিজেই কেন একটা ন্যায্য (predictable) বাজি-কৌশল, কোনো প্রতারণা নয়। (খ) দেখান "থামা" আসলে একটা martingale transform — বাজি $H_n=\mathbf 1_{\{\tau\ge n\}}$ ("$\tau$ পর্যন্ত প্রতি ধাপে এক-একক বাজি, তারপর শূন্য") নিলে $X_{n\wedge\tau}-X_0=(H\cdot X)_n$; এবং যুক্তি দিন কেন এই $H_n$ predictable (অর্থাৎ $\{\tau\ge n\}\in\mathcal F_{n-1}$ কেন)। (গ) এক বাক্যে: $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ প্রতিটি স্থির $n$-তে খাটলেও, কেন এটি এখনও $\mathbb E[X_\tau]=\mathbb E[X_0]$ নয় — কোথায় বাড়তি যত্ন লাগে।

Hint: (ক) থামা একটা valid কৌশল — প্রতি ধাপে আপনি জানেন থেমেছেন কিনা, তাই ন্যায্যতা ভাঙে না। (খ) $\{\tau\ge n\}=\{\tau\le n-1\}^c$, আর $\{\tau\le n-1\}\in\mathcal F_{n-1}$ (stopping time-এর সংজ্ঞা), তাই পরিপূরকও $\mathcal F_{n-1}$-এ — $H_n$ predictable; martingale transform (§২.৫) থেকেই $X_{n\wedge\tau}$ martingale। (গ) $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ থেকে $\mathbb E[X_\tau]=\mathbb E[X_0]$ পেতে $n\to\infty$-সীমা পার করতে হয় — সেখানেই OST-এর hypothesis (DCT/MCT) লাগে। (← §২.৭)

অনুশীলন ৩ (★★)¶

optional stopping theorem (OST) বলে $\mathbb E[X_\tau]=\mathbb E[X_0]$ — কিন্তু শর্তসাপেক্ষে। (ক) তিন hypothesis-গুচ্ছের যেকোনো একটি লিখুন যার অধীনে OST সত্য (যেমন: $\tau$ bounded; বা $X$ bounded ও $\tau<\infty$; বা $\mathbb E[\tau]<\infty$ ও bounded increments), এবং এক বাক্যে বলুন প্রতিটি শর্ত আসলে কোন সীমা-বিনিময় ($n\to\infty$-এ $\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]$) বৈধ করতে কাজ করে। (খ) নিচের ব্যর্থতাটি বিশ্লেষণ করুন: ন্যায্য simple random walk $S_n$ ($S_0=0$), $\tau=$ "প্রথম যখন $S_n=1$"। জানা যায় $\tau<\infty$ a.s., তাই $S_\tau\equiv1$ — অর্থাৎ $\mathbb E[S_\tau]=1\ne0=\mathbb E[S_0]$। কোন hypothesis-টি ভেঙেছে তা নাম ধরে বলুন (এক বা একাধিক)। (গ) এক বাক্যে: এই ব্যর্থতা কীভাবে বিখ্যাত doubling (martingale) কৌশল-এর "অমোঘ জয়"-কে একটা বিভ্রম হিসেবে ব্যাখ্যা করে।

Hint: (ক) তিনটির যেকোনো একটি যথেষ্ট; প্রতিটিই $\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]$ সীমা-বিনিময়কে বৈধ করে — (ক) তুচ্ছভাবে ($n\ge N$-এ $X_{n\wedge\tau}=X_\tau$), (খ) bounded convergence (DCT), (গ) bounded increments + $\mathbb E[\tau]<\infty$ দিয়ে dominating function। (খ) first-passage-এ সব ভাঙে: $\tau$ unbounded, $S$ unbounded, এবং $\mathbb E[\tau]=\infty$ — যেকোনো একটিই যথেষ্ট। (গ) "নিশ্চিত ৳১ লাভ" পেতে দরকার অসীম পুঁজি ও অসীম সময় ($\mathbb E[\tau]=\infty$), যা বাস্তবে নেই। (← §২.৮)

খ · গণনামূলক¶

অনুশীলন ৪ (★★)¶

gambler's ruin (জুয়াড়ির সর্বনাশ) — দুই বাধায় থামা। নিরপেক্ষ simple random walk $S_n$ শুরু $S_0=0$, দুই বাধা: নিচে $-a$, উপরে $+b$ (এখানে $a=8,\ b=4$); $\tau=$ "প্রথম যখন $-a$ অথবা $+b$-এ পৌঁছাই"। martingale $S_n$ ও $S_n^2-n$ ব্যবহার করে কষুন: (ক) প্রথমে OST প্রয়োগযোগ্যতা যাচাই করুন (কোন hypothesis-গুচ্ছ মেটে — $\mathbb E[\tau]<\infty$ ও bounded increments $\lvert S_n-S_{n-1}\rvert=1$), তারপর $\mathbb E[S_\tau]=\mathbb E[S_0]=0$ ও দুই-মান $S_\tau\in\{-a,+b\}$ ভেঙে $\mathbb P(\text{hit }+b)$ বের করুন। (খ) $S_n^2-n$ martingale-এ OST লাগিয়ে $\mathbb E[\tau]$ বের করুন ($\mathbb E[\tau]=\mathbb E[S_\tau^2]$ থেকে শুরু করে)। (গ) সংখ্যা দুটি লিখুন এবং সাধারণ সূত্রে ($a,b$-তে) প্রকাশ করুন।

Hint: (ক) $0=\mathbb E[S_\tau]=(-a)(1-p)+(b)p$ যেখানে $p=\mathbb P(\text{hit }+b)$, তাই $p=\frac{a}{a+b}=\frac{8}{12}=\frac23\approx0.6667$। (খ) OST-এ $\mathbb E[S_\tau^2-\tau]=0\Rightarrow\mathbb E[\tau]=\mathbb E[S_\tau^2]=b^2p+a^2(1-p)=\frac{ab(a+b)}{a+b}=ab$, তাই $\mathbb E[\tau]=ab=8\times4=32$। (গ) $\mathbb P(+b)=\frac{a}{a+b}=\frac23$, $\mathbb E[\tau]=ab=32$। (← §২.৮)

অনুশীলন ৫ (★)¶

একটা প্রক্রিয়া (sub/super)martingale কিনা যাচাই করুন — সংজ্ঞা প্রয়োগ করে। $\eta_1,\eta_2,\dots$ স্বাধীন, $\eta_k\ge0$, $\mathbb E[\eta_k]=1$; $M_0=1$, $M_n=\prod_{k=1}^n\eta_k$, $\mathcal F_n=\sigma(\eta_1,\dots,\eta_n)$ (product martingale / গুণফল)। (ক) তিন শর্ত (integrability, adapted, martingale property) যাচাই করে দেখান $(M_n)$ একটা martingale — মূল ধাপে pull-out ($M_n$ $\mathcal F_n$-measurable) ও independence ($\eta_{n+1}\perp\mathcal F_n$, $\mathbb E[\eta_{n+1}]=1$) ব্যবহার করুন; এবং $\mathbb E[M_n]$ বের করুন। (খ) এবার ধরুন $\mathbb E[\eta_k]=\mu$ সাধারণভাবে: কোন $\mu$-তে $(M_n)$ submartingale, কোন $\mu$-তে supermartingale, কোন $\mu$-তে martingale (ধরে নিন $M_n\ge0$)? (গ) এক বাক্যে: কেন একই প্রক্রিয়া $\log M_n=\sum\log\eta_k$ সাধারণত martingale নয় (Jensen-এর দিকে ইঙ্গিত করুন)।

Hint: (ক) $\mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[M_n\eta_{n+1}\mid\mathcal F_n]=M_n\,\mathbb E[\eta_{n+1}]=M_n\cdot1=M_n$ (pull-out + independence); integrability: $\mathbb E\lvert M_n\rvert=\mathbb E[M_n]=\prod\mathbb E[\eta_k]=1<\infty$, তাই $\mathbb E[M_n]=1$ সব $n$-তে। (খ) $\mathbb E[M_{n+1}\mid\mathcal F_n]=\mu M_n$, তাই $\mu>1$ ⇒ sub, $\mu<1$ ⇒ super, $\mu=1$ ⇒ martingale। (গ) $\log$ concave ⇒ Jensen-এ $\mathbb E[\log\eta]\le\log\mathbb E[\eta]=0$, তাই $\log M_n$ গড়ে কমে (supermartingale), সমান নয়। (← §২.৪)

অনুশীলন ৬ (★★)¶

Doob decomposition — compensator $A_n$ বের করুন। $S_n$ নিরপেক্ষ simple random walk ($\xi_k=\pm1$ সমসম্ভাব্য, $\mathbb E[\xi_k]=0$, $\xi_k^2=1$), $S_0=0$। (ক) $X_n:=S_n^2$ যে একটা submartingale তা $\mathbb E[X_{n+1}\mid\mathcal F_n]$ কষে দেখান ($S_{n+1}^2=S_n^2+2S_n\xi_{n+1}+\xi_{n+1}^2$ ভেঙে প্রতি পদে শর্তাধীন প্রত্যাশা)। (খ) Doob decomposition $X_n=M_n+A_n$-এর predictable বর্ধমান compensator $A_n$ বের করুন (সংজ্ঞা $A_n=\sum_{k=1}^n(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})$ ব্যবহার করে), এবং martingale-অংশ $M_n=X_n-A_n$ লিখুন। (গ) এক বাক্যে: এই $A_n$-কে quadratic variation $\langle S\rangle_n$ বলা হয় কেন — অর্থাৎ এটি কোন জমা-হওয়া রাশি মাপে, এবং $\mathbb E[S_n^2]$-এর সঙ্গে এর সম্পর্ক কী।

Hint: (ক) $\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+2S_n\cdot0+1=S_n^2+1\ge S_n^2$ (কারণ $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0$, $\mathbb E[\xi_{n+1}^2\mid\mathcal F_n]=1$) — submartingale। (খ) প্রতি পদ $\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1}=1$, তাই $A_n=\sum_{k=1}^n 1=n$ (predictable, $A_n-A_{n-1}=1\ge0$), আর $M_n=S_n^2-n$ (martingale)। (গ) $A_n=\langle S\rangle_n=\sum_k\mathbb E[\xi_k^2\mid\mathcal F_{k-1}]=n$ = জমা-হওয়া শর্তাধীন ভেদ; $\mathbb E[M_n]=0\Rightarrow\mathbb E[S_n^2]=n=\operatorname{Var}(S_n)$। (← §২.৯)

গ · প্রমাণভিত্তিক¶

অনুশীলন ৭ (★★)¶

martingale transform একটা martingale — প্রমাণ করুন (pull-out দিয়ে)। $(X_n)$ একটা martingale, $(H_n)_{n\ge1}$ predictable ও bounded ($\lvert H_n\rvert\le C$); সংজ্ঞা $(H\cdot X)_n=\sum_{k=1}^n H_k(X_k-X_{k-1})$, $(H\cdot X)_0=0$। দেখান $(H\cdot X)_n$ আবার একটা martingale। (ক) integrability ও adapted যাচাই করুন: $(H\cdot X)_n$ কেন $L^1$-এ ($H$ bounded, $X_k\in L^1$) এবং কেন $\mathcal F_n$-measurable। (খ) মূল ধাপ — এক-ধাপের increment $\Delta_{n+1}=(H\cdot X)_{n+1}-(H\cdot X)_n=H_{n+1}(X_{n+1}-X_n)$-এর শর্তাধীন প্রত্যাশা $\mathbb E[\Delta_{n+1}\mid\mathcal F_n]$ কষুন; দেখান pull-out-এ $H_{n+1}$ (যা $\mathcal F_n$-measurable, কারণ predictable) বেরিয়ে আসে এবং $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ (martingale property)। (গ) এক বাক্যে: কেন এই প্রমাণ ঠিক "you cannot beat a fair game" — এবং predictability শর্তটি কোথায় সিদ্ধান্তকারী (যদি $H_{n+1}$ ভবিষ্যৎ "দেখতে" পারত)।

Hint: (খ) $\mathbb E[\Delta_{n+1}\mid\mathcal F_n]=\mathbb E[H_{n+1}(X_{n+1}-X_n)\mid\mathcal F_n]\overset{\text{pull-out}}{=}H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=H_{n+1}\cdot0=0$ — তাই $\mathbb E[(H\cdot X)_{n+1}\mid\mathcal F_n]=(H\cdot X)_n$। (গ) সঞ্চিত মুনাফা গড়ে শূন্য — কোনো predictable কৌশল ন্যায্যতা ভাঙে না; predictability ($H_{n+1}$ $\mathcal F_n$-measurable) ছাড়া pull-out অবৈধ, আর তখন কৌশলটা প্রতারণা (আজকের ফল আগে-জানা)। (← §২.৫, ← 7.7 pull-out)

অনুশীলন ৮ (★★)¶

stopped process $X_{n\wedge\tau}$ একটা martingale — প্রমাণ করুন। $(X_n)$ martingale ও $\tau$ stopping time। দেখান $X_n^\tau:=X_{n\wedge\tau}$ একটা martingale, এবং উপসংহারে $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব $n$-তে। (ক) দেখান $X_{n\wedge\tau}-X_0=(H\cdot X)_n$ যেখানে $H_n=\mathbf 1_{\{\tau\ge n\}}=\mathbf 1_{\{n\le\tau\}}$ (telescoping যোগফল লিখে যাচাই করুন)। (খ) যুক্তি দিন $H$ predictable ও bounded — অর্থাৎ $\{\tau\ge n\}\in\mathcal F_{n-1}$ (stopping time-এর সংজ্ঞা থেকে) এবং $0\le H_n\le1$। (গ) অনুশীলন ৭-এর martingale-transform ফল প্রয়োগ করে উপসংহার দিন, এবং এক বাক্যে বলুন কেন super-/submartingale-ও থামালে তা-ই থাকে।

Hint: (ক) $\sum_{k=1}^n\mathbf 1_{\{\tau\ge k\}}(X_k-X_{k-1})$-এ $\tau\ge k$ মানে $k$-তম ধাপ এখনো "চালু" — যোগফল ঠিক $X_{n\wedge\tau}-X_0$ পর্যন্ত telescope করে (থামার পর সব increment-এর সহগ $0$)। (খ) $\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}$ — predictable; $H_n\in\{0,1\}$ — bounded। (গ) martingale transform-এ predictable bounded $H\ge0$ হলে super-/sub-ত্ব সংরক্ষিত। (← §২.৭)

অনুশীলন ৯ (★)¶

$\mathbb E[X_n]=\mathbb E[X_0]$ প্রমাণ করুন — martingale-এ গড় ধ্রুব। $(X_n)$ একটা martingale। (ক) এক-ধাপের ফল দিয়ে দেখান $\mathbb E[X_{n+1}]=\mathbb E[X_n]$ — মূল ধাপ: total expectation/tower $\mathbb E[\mathbb E[X_{n+1}\mid\mathcal F_n]]=\mathbb E[X_{n+1}]$ এবং martingale property $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ একত্র করুন। (খ) আরোহণ (induction) দিয়ে উপসংহার দিন $\mathbb E[X_n]=\mathbb E[X_0]$ সব $n$-তে; এবং দেখান submartingale-এ $\mathbb E[X_n]$ অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান। (গ) এক বাক্যে: এটি কীভাবে "ন্যায্য খেলায় কোনো স্থির সময়ে গড়ে লাভ-ক্ষতি নেই"-র গাণিতিক রূপ — এবং কেন এটি এখনও এলোমেলো $\tau$-তে ($\mathbb E[X_\tau]=\mathbb E[X_0]$) বলে না।

Hint: (ক) $\mathbb E[X_{n+1}]=\mathbb E[\mathbb E[X_{n+1}\mid\mathcal F_n]]=\mathbb E[X_n]$ — প্রথম সমতা $\mathcal H=\{\varnothing,\Omega\}$-এ tower (7.7), দ্বিতীয়টা martingale property। (খ) $\mathbb E[X_0]=\mathbb E[X_1]=\cdots=\mathbb E[X_n]$; $\ge$ হলে $\mathbb E[X_{n+1}]\ge\mathbb E[X_n]$ (অ-হ্রাসমান)। (গ) স্থির $n$-এ গড় অপরিবর্তিত, কিন্তু এলোমেলো (data-dependent) $\tau$-তে গড় পার করতে OST-এর hypothesis লাগে (অনুশীলন ৩)। (← §২.৩)

ঘ · কোডিং¶

অনুশীলন ১০ (★★)¶

gambler's ruin সিমুলেট করে $\mathbb P(+b)=2/3$ ও $\mathbb E[\tau]=32$ ফিরে পাওয়া। seed np.random.default_rng(20260619), বাধা $-a=-8,\ +b=+4$, বহু (যেমন $200{,}000$) নিরপেক্ষ random walk চালান, প্রতিটি $-a$ অথবা $+b$-এ থামা পর্যন্ত। (ক) তিন রাশি মাপুন: $\mathbb P(\text{hit }+b)$ (canonical $\approx0.6667$), $\mathbb E[S_\tau]$ (canonical $\approx0$ — OST), $\mathbb E[\tau]$ (canonical $\approx32$)। (খ) তিনটিই §২.৮/§৩-এর তত্ত্বের ($\frac{a}{a+b}=\frac23$, $0$, $ab=32$) সঙ্গে মেলান (একটা ছোট তুলনা-টেবিল ছাপুন)। (গ) এক বাক্যে কোড-comment-এ লিখুন কেন $\mathbb E[S_\tau]\approx0$ এখানে বৈধ — কোন OST-শর্ত মিটছে।

Hint:

import numpy as np
rng = np.random.default_rng(20260619)
a, b, trials = 8, 4, 200_000
hitB = np.zeros(trials); Stau = np.zeros(trials); tau = np.zeros(trials)
for t in range(trials):
    s, n = 0, 0
    while -a < s < b:                      # দুই বাধার মাঝে যতক্ষণ
        s += rng.choice([-1, 1]); n += 1
    hitB[t] = (s == b); Stau[t] = s; tau[t] = n
print("P(hit +b) ≈", round(hitB.mean(), 4))   # ≈ 0.667  (= a/(a+b) = 2/3)
print("E[S_tau]  ≈", round(Stau.mean(), 4))   # ≈ 0      (OST: E[τ]<∞ ও |ΔS|=1)
print("E[tau]    ≈", round(tau.mean(), 2))    # ≈ 32     (= ab)

$\mathbb E[S_\tau]\approx0$ বৈধ কারণ $\mathbb E[\tau]<\infty$ (দুই বাধায় আটকে) ও বৃদ্ধি পরিবদ্ধ ($\lvert\Delta S\rvert=1$) — OST-শর্ত (গ) মেটে।

অনুশীলন ১১ (★★)¶

optional-stopping failure দেখানো — first passage to $+1$, $\mathbb E[S_\tau]=1$। seed 20260619, নিরপেক্ষ simple random walk ($S_0=0$), $\tau=$ "প্রথম যখন $S_n=1$"। $\mathbb E[\tau]=\infty$ বলে কম্পিউটারে $\tau$ পুরো চালানো যায় না; বরং সময়-সীমা $T$ বাড়িয়ে stopped-process $S_{T\wedge\tau}$-এর আচরণ দেখুন। (ক) কয়েকটা বাড়তে-থাকা $T$-তে (যেমন $100,1000,10000$) বহু path চালিয়ে $\mathbb P(\tau\le T)$ ও $\mathbb E[S_{T\wedge\tau}]$ ছাপুন; দেখান স্থির $T$-তে $\mathbb E[S_{T\wedge\tau}]\approx0$ (martingale অটুট), যদিও $\mathbb P(\tau\le T)$ ধীরে-ধীরে $1$-এর দিকে ওঠে। (খ) এক বাক্যে ব্যাখ্যা করুন কেন $T\to\infty$-এর সীমায় $S_\tau\equiv1$ হয়ে $\mathbb E[S_\tau]=1\ne0$ — অর্থাৎ "ভর কোথায় পালায়"। (গ) এক বাক্যে: কোন OST-শর্তগুলো ভেঙেছে এবং এটি কোন limit-interchange (DCT) ব্যর্থতার মুখোশ।

Hint:

import numpy as np
rng = np.random.default_rng(20260619)
paths = 100_000
for T in (100, 1_000, 10_000):
    s = np.zeros(paths); stopped = np.zeros(paths, bool)
    for _ in range(T):
        live = ~stopped
        s[live] += rng.choice([-1, 1], size=live.sum())
        stopped |= (s >= 1)               # +1 ছুঁলে থামা
    print(f"T={T:>6}: P(τ≤T)≈{stopped.mean():.3f}, E[S_(T∧τ)]≈{s.mean():+.3f}")
# স্থির T-তে E[S_(T∧τ)]≈0; শুধু T→∞ সীমায় S_τ≡1 ⇒ E[S_τ]=1≠0  (DCT-ভঙ্গ)

স্থির $T$-তে martingale ⇒ $\mathbb E[S_{T\wedge\tau}]\approx0$; নিচে-ঝুলে-থাকা ভর সীমায় অসীম-গভীরে সরে যায় বলে $\lim\mathbb E[S_{T\wedge\tau}]\ne\mathbb E[S_\tau]=1$। ভাঙা শর্ত: $\tau$ unbounded, $S$ unbounded, $\mathbb E[\tau]=\infty$ — কোনোটিই মেটে না।

অনুশীলন ১২ (★★)¶

$S_n^2-n$ সিমুলেট করে গড়-শূন্য/সমতল যাচাই। seed 20260619, বহু (যেমন $400{,}000$) নিরপেক্ষ random-walk path প্রতিটি $40$ ধাপ চালিয়ে প্রতি $n$-তে $\mathbb E[S_n^2]$ আনুমান করুন। (ক) দেখান $\mathbb E[S_n^2]\approx n$ সব $n$-তে (যেমন $\mathbb E[S_5^2]\approx5$, $\mathbb E[S_{40}^2]\approx40$), তাই $\mathbb E[S_n^2-n]\approx0$ — $M_n=S_n^2-n$ একটা গড়-শূন্য martingale। (খ) $\max_n\lvert\mathbb E[S_n^2]-n\rvert\approx0$ ছাপিয়ে নিশ্চিত করুন রেখাটি সমতল (compensator ঠিক $A_n=n$)। (গ) এক বাক্যে কোড-comment-এ লিখুন এটি কীভাবে Doob decomposition $S_n^2=(S_n^2-n)+n$-কে সংখ্যায় নিশ্চিত করে, এবং $\mathbb E[S_n^2]=n$ কেন ঠিক $\operatorname{Var}(S_n)$।

Hint:

import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 400_000, 40
xi = rng.choice([-1, 1], size=(paths, steps))
S  = xi.cumsum(axis=1)
n  = np.arange(1, steps+1)
ES2 = (S**2).mean(axis=0)                  # E[S_n^2] প্রতি n-এ
print("E[S_5^2]  =", round(ES2[4],  3), " (তত্ত্ব 5 )")    # ≈ 5
print("E[S_40^2] =", round(ES2[39], 3), " (তত্ত্ব 40)")    # ≈ 40
print("max|E[S_n^2 - n]| =", round(np.abs(ES2 - n).max(), 3))  # ≈ 0
# M_n = S_n^2 - n গড়-শূন্য ⇒ Doob: S_n^2 = M_n + n, compensator A_n = n = Var(S_n)

$\mathbb E[S_n^2]\approx n$ বলে $M_n=S_n^2-n$ সমতল (গড় $0$); যেহেতু $\mathbb E[S_n]=0$, $\mathbb E[S_n^2]=\operatorname{Var}(S_n)=n$ — compensator $A_n=n=\langle S\rangle_n$।

৮ · সারসংক্ষেপ ও সংযোগ¶

এই অধ্যায়ে 7.7-এর একক-σ-algebra শর্তাধীন প্রত্যাশা $\mathbb E[X\mid\mathcal G]$-কে সময়ে ছড়িয়ে দেওয়া হয়েছে: তথ্যের জমে-ওঠা প্রবাহকে একটা বর্ধমান σ-algebra-অনুক্রম filtration $(\mathcal F_n)$ দিয়ে ধরে, "ন্যায্য খেলা"-র কঠোর গাণিতিক রূপ martingale গড়া হয়েছে, এবং তার দুই বড় ফল — "ন্যায্য খেলা হারানো যায় না" (martingale transform) ও "কখন থামলে গড় বদলায় না" (optional stopping) — প্রতিষ্ঠা করা হয়েছে।

১. filtration ও martingale। filtration $(\mathcal F_n)_{n\ge0}$ হলো বর্ধমান sub-σ-algebra-অনুক্রম ($\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots$, "তথ্য জমে, হারায় না"); সবচেয়ে স্বাভাবিক উদাহরণ natural filtration $\mathcal F_n=\sigma(X_0,\dots,X_n)$। একটা process adapted যদি $X_n$ $\mathcal F_n$-measurable ("এখনই জানা"), predictable যদি $H_n$ $\mathcal F_{n-1}$-measurable ("এক-ধাপ-আগেই জানা", যেমন বাজির আকার)। $(X_n)$ একটা martingale যদি তা integrable, adapted, এবং $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s. ($\ge$ ⇒ submartingale, গড়ে বাড়ে; $\le$ ⇒ supermartingale, গড়ে কমে)। tower থেকে $\mathbb E[X_m\mid\mathcal F_n]=X_n$ ($m>n$) ও $\mathbb E[X_n]=\mathbb E[X_0]$ ধ্রুব; convex $\varphi$-তে conditional Jensen martingale→submartingale বানায়। canonical উদাহরণ: mean-0 random walk ($\mathbb E[S_n]=0$), mean-1 iid-এর গুণফল ($\mathbb E[M_n]=1$), Doob martingale $X_n=\mathbb E[Y\mid\mathcal F_n]$, likelihood-ratio, Pólya urn।

২. martingale transform — "ন্যায্য খেলা হারানো যায় না"। $H$ predictable ও bounded হলে martingale transform $(H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})$ আবার একটা martingale — প্রমাণ এক-লাইন pull-out ($H_{n+1}$ $\mathcal F_n$-measurable বলে বের করে $\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0$ গুণ)। অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজি-কৌশল ন্যায্যতা ভাঙতে পারে না — you cannot beat a fair game; এটিই discrete stochastic integral, আর continuous-time-এ Itô-ইন্টিগ্রালের বিচ্ছিন্ন পূর্বসূরি।

৩. stopping time ও stopped process। stopping time $\tau$: $\{\tau\le n\}\in\mathcal F_n$ ("থামার সিদ্ধান্ত কেবল অতীত-তথ্যে"; যেমন hitting time $\tau_B=\min\{n:X_n\in B\}$)। stopped process $X_{n\wedge\tau}$ আবার একটা martingale — কারণ "থামা" হলো predictable bounded বাজি $H_n=\mathbf 1_{\{\tau\ge n\}}$ ($\{\tau\ge n\}\in\mathcal F_{n-1}$) দিয়ে একটা martingale transform — তাই $\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]$ সব স্থির $n$-তে।

৪. optional stopping theorem ও তার সীমা। OST: martingale ও stopping time $\tau$-তে $\mathbb E[X_\tau]=\mathbb E[X_0]$ — যদি (ক) $\tau$ bounded, (খ) $X$ bounded ও $\tau<\infty$, বা (গ) $\mathbb E[\tau]<\infty$ ও bounded increments (প্রতিটিই $n\to\infty$-এ $\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]$ সীমা-বিনিময়কে DCT/MCT দিয়ে বৈধ করে)। প্রয়োগ — gambler's ruin ($-a=-8,+b=+4$): $\mathbb E[S_\tau]=0$ থেকে $\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac23\approx0.6667$, আর $S_n^2-n$ martingale থেকে $\mathbb E[\tau]=ab=32$। failure — hypothesis ছাড়া: first-passage-to-$+1$-এ $S_\tau\equiv1$, তাই $\mathbb E[S_\tau]=1\ne0$ (কারণ $\mathbb E[\tau]=\infty$, $\tau$ ও $S$ unbounded) — যা doubling-কৌশলের "অমোঘ জয়"-এর বিভ্রম ব্যাখ্যা করে। নৈতিকতা: $\mathbb E[X_\tau]=\mathbb E[X_0]$ লেখার আগে সবসময় একটা OST-শর্ত আগে যাচাই করুন।

৫. Doob decomposition। যেকোনো submartingale $X_n=M_n+A_n$ অনন্যভাবে (a.s.), যেখানে $M$ martingale (বিশুদ্ধ গোলমাল) ও $A$ predictable অ-হ্রাসমান compensator ($A_n=\sum_{k\le n}(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})$, drift) — অর্থাৎ ঝোঁক ও গোলমাল আলাদা। canonical উদাহরণ $S_n^2=(S_n^2-n)+n$, যেখানে $A_n=\langle S\rangle_n=n$ ঠিক জমা-হওয়া variance (quadratic variation) — যা gambler's-ruin-এর $\mathbb E[\tau]$ বের করতে কাজে লাগে।

মূল সংজ্ঞা/উপপাদ্য (mini-list)। - filtration / adapted / predictable: $\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots$; $X_n$ $\mathcal F_n$-measurable (adapted); $H_n$ $\mathcal F_{n-1}$-measurable (predictable)। - martingale: integrable + adapted + $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ a.s.; $\ge$ ⇒ submartingale, $\le$ ⇒ supermartingale; tower ⇒ $\mathbb E[X_m\mid\mathcal F_n]=X_n$ ($m>n$), $\mathbb E[X_n]=\mathbb E[X_0]$। - martingale transform: $H$ predictable, bounded ⇒ $(H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})$ martingale (pull-out)। - stopping time: $\{\tau\le n\}\in\mathcal F_n$; stopped process $X_{n\wedge\tau}$ martingale ($H_n=\mathbf 1_{\{\tau\ge n\}}$)। - optional stopping (Doob): $\mathbb E[X_\tau]=\mathbb E[X_0]$ যদি $\tau$ bounded, বা $X$ bounded, বা $\mathbb E[\tau]<\infty$ ও bounded increments; gambler's ruin $\mathbb P(+b)=\frac{a}{a+b}=\frac23$, $\mathbb E[\tau]=ab=32$; failure: first passage $\mathbb E[S_\tau]=1\ne0$, $\mathbb E[\tau]=\infty$। - Doob decomposition: submartingale $X_n=M_n+A_n$ অনন্য; $A_n=\sum_k(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})$ predictable বর্ধমান; $S_n^2=(S_n^2-n)+n$, $\langle S\rangle_n=n$।

পেছনের সংযোগ: - ← 7.7 (Conditional expectation): এই অধ্যায়ের একমাত্র মৌলিক ইঞ্জিন — martingale-এর সংজ্ঞা $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ আক্ষরিকভাবে একটা conditional-expectation সমীকরণ; tower $m>n$-এ $\mathbb E[X_m\mid\mathcal F_n]=X_n$ টানে, pull-out martingale transform-এর প্রাণ ($H_k$ বের করা), conditional Jensen convex $\varphi$-তে martingale→submartingale বানায়, আর Doob martingale $X_n=\mathbb E[Y\mid\mathcal F_n]$ সরাসরি 7.7-এর ক্রমবর্ধমান-তথ্যে-অনুমান। - ← 7.6 (Independence, 0–1 law, SLLN): martingale-এর চেনা উদাহরণগুলোর কাঁচামাল — iid increment $\xi_k$ থেকে random walk $S_n=\sum\xi_k$ (mean-0 ⇒ martingale), mean-1 iid-এর গুণফল (likelihood-ratio martingale-এর গোড়া); স্বাধীনতা থেকেই $\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]$ আসে — martingale-যাচাইয়ের প্রথম ধাপ। - ← 3.5 (Random processes ও random walk): এই অধ্যায়ের স্বজ্ঞাগত মঞ্চ — সেখানকার simple random walk $S_n=\sum\xi_k$ ও gambler's-ruin-এর elementary রূপকে এখানে measure-তাত্ত্বিকভাবে কঠোর করা হলো; random walk-ই canonical martingale, gambler's ruin-ই OST-এর সরাসরি প্রয়োগ।

সামনের সংযোগ: - → 7.9 (Martingale convergence ও Doob's inequalities): এই অধ্যায়ের সরাসরি পুরস্কার — martingale convergence theorem ("bounded martingale a.s. converges", যা Doob martingale $X_n=\mathbb E[Y\mid\mathcal F_n]\to Y$ ও SLLN-এর martingale-প্রমাণ দেয়) এবং Doob's maximal ও $L^p$ inequalities (convex-submartingale $\lvert X_n\rvert,X_n^2$ ও quadratic variation $\langle S\rangle_n$ যার ভিত্তি)। - → 7.10 (Rigorous CLT ও characteristic functions): martingale-CLT ও martingale-difference কাঠামো সেখানকার কঠোর central limit theorem-এর একটা পথ।

উৎস: Klenke, Probability Theory: A Comprehensive Course, অধ্যায় ৯ (Martingales) ও অধ্যায় ১০ (Optional Sampling Theorems) — filtration, adapted/predictable process, martingale/sub-/supermartingale-এর সংজ্ঞা ও মৌলিক উদাহরণ (random walk, Doob martingale, likelihood ratio); martingale transform ও "a gambling strategy cannot beat a fair game"; stopping time, stopped process $X_{n\wedge\tau}$, এবং optional sampling/stopping theorem-এর সম্পূর্ণ hypothesis-গুচ্ছ (bounded $\tau$ / bounded $X$ / $\mathbb E[\tau]<\infty$ ও bounded increments) সহ gambler's ruin ও hypothesis-ভাঙা failure; এবং Doob decomposition — এই অধ্যায়ের কঠোর মেরুদণ্ড ও 7.9-এর martingale convergence-এর সরাসরি প্রস্তুতি।

এক বাক্যে: তথ্যের জমে-ওঠা প্রবাহকে একটা বর্ধমান filtration $(\mathcal F_n)$ দিয়ে ধরে, martingale হলো ন্যায্য খেলার কঠোর রূপ $\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n$ — যার প্রথম ফল "predictable কোনো বাজি-কৌশল ন্যায্য খেলা হারাতে পারে না" (martingale transform), আর দ্বিতীয় ফল "এলোমেলো stopping time $\tau$-তে থামলেও $\mathbb E[X_\tau]=\mathbb E[X_0]$ — তবে শর্তসাপেক্ষে" (optional stopping: gambler's ruin-এ $\mathbb P(+b)=\frac23$ ও $\mathbb E[\tau]=32$, কিন্তু first-passage-এ $\mathbb E[S_\tau]=1\ne0$ বলে hypothesis ভাঙলে তা-ও ভাঙে), সঙ্গে Doob decomposition যা submartingale-কে martingale ও predictable compensator-এ ($S_n^2=(S_n^2-n)+n$) আলাদা করে — এই martingale-ভিত্তিই 7.9-এর convergence ও Doob's inequalities-এর সরা

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
\(\mathbb E[S_{10}]\)	\(0\)	\(\approx0\)
\(\mathbb E[S_{50}]\)	\(0\)	\(\approx0\)
\(\operatorname{Var}(S_{50})\)	\(n=50\)	\(\approx50\)

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
\(\mathbb P(\text{hit }+b)\)	\(\tfrac{a}{a+b}=\tfrac23\approx0.6667\)	\(\approx0.67\)
\(\mathbb E[S_\tau]\)	\(0\)	\(\approx0\)
\(\mathbb E[\tau]\)	\(ab=32\)	\(\approx32\)

সময়-সীমা \(T\)	\(\mathbb P(\tau\le T)\)	\(\mathbb E[S_{T\wedge\tau}]\) (martingale ⇒ \(\approx0\))
\(100\)	\(<1\)	\(\approx0\)
\(1{,}000\)	\(\uparrow\) ১-এর দিকে	\(\approx0\)
\(10{,}000\)	আরও কাছে	\(\approx0\)

পরিমাণ	তত্ত্ব	সিমুলেশন (MC)
\(\mathbb E[S_5^2]\)	\(5\)	\(\approx5\)
\(\mathbb E[S_{40}^2]\)	\(40\)	\(\approx40\)
\(\mathbb E[M_n]=\mathbb E[S_n^2-n]\)	\(0\) (সব \(n\))	\(\approx0\)

অংশ	দাবি	মূল সংখ্যা
৫.১	symmetric walk martingale; \(\mathbb E[S_n]=0\) সব \(n\)-এ	\(\mathbb E[S_{50}]=\mathbf{-0.0034}\), \(\max_n\lvert\mathbb E[S_n]\rvert=\mathbf{0.0245}\), \(\mathrm{sd}=\mathbf{7.08}\)
৫.২	gambler's ruin; optional stopping খাটে	\(\mathbb P(+4)=\mathbf{0.6654}\) (\(\approx\tfrac{8}{12}\)), \(\mathbb E[S_\tau]=\mathbf{-0.015}\) (\(\approx0\)), \(\mathbb E[\tau]=\mathbf{31.99}\) (\(\approx32\))
৫.৩	first passage to \(+1\); optional stopping ভাঙে	\(\mathbb E[S_\tau]=\mathbf{+1.0000}\ne0\); cap-hit \(\mathbf{0.27\%}\); \(\mathbb E[\tau]=\infty\)
৫.৪	product martingale; \(\mathbb E[M_n]=1\)	\(\mathbb E[M_{40}]=\mathbf{1.0000}\), \(\mathrm{sd}=\mathbf{0.3244}\) (\(\approx0.3241\))

7.8 — Martingales: Filtration, Stopping Time ও Optional Sampling (ন্যায্য খেলার গণিত)¶

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶

১.১ একটা ন্যায্য খেলা — যেখানে কোনো পক্ষপাত নেই¶

১.২ filtration — তথ্য যেভাবে ধাপে ধাপে জমে¶

১.৩ কেন এটি গুরুত্বপূর্ণ — "ন্যায্য খেলা হারানো যায় না" থেকে আধুনিক প্রয়োগ¶

১.৪ কখন থামলে গড় বদলায় না — optional stopping-এর পূর্বাভাস¶

১.৫ এই অধ্যায়ের পথরেখা¶

২ · মূল ধারণা ও সংজ্ঞা¶

২.১ filtration — তথ্যপ্রবাহের গাণিতিক রূপ¶

২.২ adapted ও predictable — দুই মৌলিক ভূমিকা¶

২.৩ martingale, submartingale, supermartingale¶

২.৪ মূল উদাহরণ — random walk, গুণফল, Doob martingale, likelihood ratio, Pólya urn¶

২.৫ martingale transform — "ন্যায্য খেলা হারানো যায় না"¶

২.৬ stopping time — কেবল অতীত-তথ্যে থামা¶

২.৭ stopped process — থামালেও martingale থেকে যায়¶

২.৮ optional stopping theorem — তিন hypothesis-গুচ্ছ ও তার সীমা¶

২.৯ Doob decomposition — ঝোঁক বনাম গোলমাল আলাদা করা¶

৩ · পূর্ণাঙ্গ উদাহরণ¶

উদাহরণ ১ — random walk একটি martingale (★)¶

উদাহরণ ২ — Doob martingale \(\mathbb E[Y\mid\mathcal F_n]\) (★)¶

উদাহরণ ৩ — martingale transform: ন্যায্য খেলা হারানো যায় না (★★)¶

উদাহরণ ৪ — optional stopping ও gambler's ruin (★★)¶

উদাহরণ ৫ — কখন optional stopping ভাঙে (★★)¶

উদাহরণ ৬ — Doob decomposition \(S_n^2-n\) (★★)¶

৪ · প্রমাণ ও উৎপাদন¶

প্রমাণ ৬ — martingale property ⇒ ধ্রুব গড়, এবং একটি centered-sum martingale (★)¶

প্রমাণ ১ — martingale transform একটি martingale (★★)¶

প্রমাণ ২ — stopped process \(X_{n\wedge\tau}\) একটি martingale (★★)¶

প্রমাণ ৩ — Optional Stopping Theorem (★★★)¶

প্রমাণ ৪ — gambler's ruin via optional stopping (★★)¶

প্রমাণ ৫ — Doob decomposition (★★)¶

৫ · কোড ল্যাব (Python)¶

স্ক্রিপ্টের কাঠামো ও পুনরুৎপাদনযোগ্যতা (reproducibility)¶

৫.১ · Random walk একটি martingale — গড় সব সময়ে শূন্য¶

৫.২ · Gambler's ruin — optional stopping theorem (যখন উপপাদ্য খাটে)¶

৫.৩ · Optional stopping ভেঙে পড়ে — যখন hypothesis মেটে না¶

৫.৪ · Product martingale — গুণফলেও গড় এক¶

সারসংক্ষেপ¶

৬ · ভিজ্যুয়ালাইজেশন¶

৬.১ martingale পথ — গড় সমতল, ছড়ানো বাড়ে¶

৬.২ optional stopping সফল — gambler's ruin¶

৬.৩ optional stopping ভেঙে পড়ে — অসীম থামার সময়¶

৬.৪ Doob পচন — submartingale = martingale + ক্ষতিপূরক¶

৭ · অনুশীলনী¶

ক · ধারণাগত¶

অনুশীলন ১ (★)¶

অনুশীলন ২ (★)¶

অনুশীলন ৩ (★★)¶

খ · গণনামূলক¶

অনুশীলন ৪ (★★)¶

অনুশীলন ৫ (★)¶

অনুশীলন ৬ (★★)¶

গ · প্রমাণভিত্তিক¶

অনুশীলন ৭ (★★)¶

অনুশীলন ৮ (★★)¶

অনুশীলন ৯ (★)¶

ঘ · কোডিং¶

অনুশীলন ১০ (★★)¶

অনুশীলন ১১ (★★)¶

অনুশীলন ১২ (★★)¶

৮ · সারসংক্ষেপ ও সংযোগ¶