7.8 — Martingales: Filtration, Stopping Time ও Optional Sampling (ন্যায্য খেলার গণিত)¶
১ · ভূমিকা ও insight (অন্তর্দৃষ্টি)¶
১.১ একটা ন্যায্য খেলা — যেখানে কোনো পক্ষপাত নেই¶
কল্পনা করা যাক একটা নিখুঁত ন্যায্য খেলা (fair game): প্রতিটি দানে আপনি কিছু বাজি ধরেন, আর খেলাটা এমন সাজানো যে গড়ে আপনি জেতেনও না, হারেনও না। ধরা যাক \(X_n\) হলো \(n\)-তম দানের পর আপনার মোট সম্পদ। "ন্যায্য" শব্দটার গাণিতিক অর্থ ঠিক কী? — স্বজ্ঞা বলে: আজ পর্যন্ত যা-কিছু ঘটেছে তার সমস্ত তথ্য হাতে নিয়েও, আগামী দানের পর আপনার প্রত্যাশিত সম্পদ ঠিক আজকের সম্পদের সমান। আপনি এগিয়েও যাবেন না, পিছিয়েও না — গড়-অর্থে। এই একটিমাত্র বাক্যই martingale (মার্টিঙ্গেল) ধারণার পুরো প্রাণ: $$ \mathbb E[X_{n+1}\mid\mathcal F_n]\;=\;X_n, $$ যেখানে \(\mathcal F_n\) মানে "\(n\) সময় পর্যন্ত জমে-ওঠা সমস্ত তথ্য"। ডান পাশে \(X_n\) — আজকের পরিচিত মান; বাঁ পাশে \(\mathbb E[X_{n+1}\mid\mathcal F_n]\) — সেই সব তথ্য দিয়ে আগামীকালের সেরা অনুমান (7.7-এর শর্তাধীন প্রত্যাশা)। দুই সমান হওয়া মানে: আগামীকালের সেরা পূর্বাভাস = আজকের মান। কোনো গোপন প্রবণতা নেই, কোনো drift নেই।
এর দুই স্বাভাবিক প্রতিবেশী: যদি খেলাটা আপনার পক্ষে ঝোঁকা থাকে (গড়ে বাড়ে), তখন \(\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n\) — একে বলে submartingale; আর যদি বিপক্ষে ঝোঁকা (গড়ে কমে, যেমন বাস্তব ক্যাসিনো, যেখানে ঘর-সুবিধা আছে), তখন \(\le\) — supermartingale। নামের উল্টো-সম্পর্কটা প্রথমে ধাঁধার মতো লাগে (sub = বাড়ে?), কিন্তু তা subharmonic ফাংশনের সাদৃশ্য থেকে আসে — §২-এ মনে রাখার সহজ সূত্র দেব।
লক্ষণীয়, martingale মানে "নিশ্চল" নয়। \(X_n\) দিব্যি লাফাতে-ঝাঁপাতে পারে, পথ বুনোভাবে দুলতে পারে — শর্ত শুধু একটাই: প্রতিটি মুহূর্তে পরবর্তী পদক্ষেপের গড় শূন্য (বর্তমান তথ্যের সাপেক্ষে)। তাই martingale মানে বায়াসহীন, নিশ্চল নয় — একটা গুরুত্বপূর্ণ পার্থক্য যা চিত্র 7-8-martingale-paths-এ চোখে দেখব: বহু পথ, প্রতিটি দোলে, কিন্তু তাদের গড় সমতল থাকে।
এক বাক্যে সূচনা। martingale হলো ন্যায্য খেলার কঠোর গাণিতিক রূপ — \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\), অর্থাৎ আজ পর্যন্ত সব তথ্য \(\mathcal F_n\) দিয়ে আগামীকালের সেরা অনুমান ঠিক আজকের মান; পক্ষে-ঝোঁকা হলে \(\ge\) (submartingale), বিপক্ষে \(\le\) (supermartingale) — আর martingale মানে "বায়াসহীন", "নিশ্চল" নয়।
১.২ filtration — তথ্য যেভাবে ধাপে ধাপে জমে¶
7.7-এ "তথ্য" ছিল একটামাত্র sub-σ-algebra \(\mathcal G\) — একটা স্থির ছবি। কিন্তু খেলা, পরিভ্রমণ, পর্যবেক্ষণ — সবই সময়ে গড়ায়, আর তথ্য জমে ক্রমশ। প্রথম দান দেখার আগে আমরা প্রায় কিছুই জানি না; প্রথম দানের পর কিছুটা জানি; দ্বিতীয় দানের পর আরও বেশি — এবং একবার-জানা তথ্য কখনো হারায় না। এই জমে-ওঠা তথ্যপ্রবাহ ধরার গাণিতিক বস্তুই filtration (ফিল্ট্রেশন): একটা বর্ধমান σ-algebra-অনুক্রম $$ \mathcal F_0\;\subseteq\;\mathcal F_1\;\subseteq\;\mathcal F_2\;\subseteq\;\cdots\;\subseteq\;\mathcal F, $$ যেখানে \(\mathcal F_n\) = "সময় \(n\) পর্যন্ত যা-কিছু পর্যবেক্ষণযোগ্য, তার সমস্ত সংগ্রহ"। nested (বর্ধমান) হওয়াটাই সিদ্ধান্তকারী — এটিই "তথ্য জমে, হারায় না"-র গণিত, আর এটিই 7.7-এর tower property-কে (\(\mathcal H\subseteq\mathcal G\)) সময়ের অক্ষে বসিয়ে দেয়।
সবচেয়ে স্বাভাবিক filtration আসে প্রক্রিয়াটা নিজে থেকে: \(\mathcal F_n=\sigma(X_0,X_1,\dots,X_n)\) — "এ-পর্যন্ত দেখা সব \(X\)-এর তথ্য", একে বলে natural filtration (স্বাভাবিক ফিল্ট্রেশন)। এই কাঠামোয় দুটো ভূমিকা আলাদা করা মৌলিক:
- একটা process \((X_n)\) adapted (অভিযোজিত) যদি প্রতিটি \(X_n\) \(\mathcal F_n\)-measurable — অর্থাৎ এখনই, বর্তমান তথ্যেই \(X_n\) জানা। (martingale হতে গেলে adapted হওয়া আবশ্যক — যা জানাই নেই তার সাথে "বর্তমান মান" তুলনা করা অর্থহীন।)
- একটা process \((H_n)\) predictable (পূর্বানুমেয়) যদি প্রতিটি \(H_n\) \(\mathcal F_{n-1}\)-measurable — অর্থাৎ এক-ধাপ-আগেই \(H_n\) জানা, \(n\)-তম ঘটনা ঘটার আগেই। বাজির আকার এর নিখুঁত উদাহরণ: আপনি \(n\)-তম দান গড়ানোর আগে ঠিক করেন কত বাজি ধরবেন (\(H_n\)), ফলাফল দেখার পর নয়।
এই "এক-ধাপের ব্যবধান" — adapted (\(\mathcal F_n\)) বনাম predictable (\(\mathcal F_{n-1}\)) — দেখতে সামান্য, কিন্তু এটিই "ভবিষ্যৎ উঁকি দিয়ে দেখা যায় না" নীতির গণিত, এবং ১.৩-এর "ন্যায্য খেলা হারানো যায় না"-র পুরো যুক্তি এর উপরেই দাঁড়ায়।
এক বাক্যে। তথ্যের জমে-ওঠা প্রবাহকে ধরে একটা বর্ধমান σ-algebra-অনুক্রম filtration \((\mathcal F_n)\) (\(\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\), তথ্য জমে—হারায় না); একটা process adapted যদি \(X_n\) \(\mathcal F_n\)-measurable (এখনই জানা), predictable যদি \(H_n\) \(\mathcal F_{n-1}\)-measurable (এক-ধাপ-আগেই জানা, যেমন বাজির আকার) — এই এক-ধাপের ব্যবধানই "ভবিষ্যৎ উঁকি দেওয়া যায় না"-র গণিত।
১.৩ কেন এটি গুরুত্বপূর্ণ — "ন্যায্য খেলা হারানো যায় না" থেকে আধুনিক প্রয়োগ¶
martingale কেন আধুনিক সম্ভাব্যতার অন্যতম শক্তিশালী হাতিয়ার — তার সবচেয়ে সুন্দর ছোট-উপপাদ্য দিয়েই শুরু করা যাক। প্রশ্ন: একটা ন্যায্য খেলায় কোনো চতুর বাজির কৌশল কি আপনাকে গড়ে এগিয়ে দিতে পারে? — যেমন "জেতার পর বড় বাজি, হারার পর ছোট", বা যেকোনো জটিল নিয়ম যা শুধু অতীত-ফলাফলের উপর নির্ভর করে। উত্তর — না, কখনো নয়। আপনার কৌশল \(H_n\) (n-তম দানের বাজি) যদি predictable হয় (অতীত দিয়ে স্থির, ভবিষ্যৎ না-দেখে) ও bounded, তবে আপনার সঞ্চিত মুনাফা $$ (H\cdot X)n\;=\;\sum) $$ আবার একটা }^{n}H_k\,(X_k-X_{k-1martingale — গড়ে শূন্য-লাভ। একে বলে martingale transform, আর এর তাৎপর্য গভীর: "You cannot beat a fair game by any betting system." ন্যায্যতা একটা সংরক্ষিত (conserved) ধর্ম — কোনো অতীত-নির্ভর কৌশলে তাকে ভাঙা যায় না। এর প্রমাণ একলাইনে 7.7-এর pull-out থেকে আসে (\(H_k\) predictable, তাই \(\mathcal F_{k-1}\)-এ ধ্রুবকের মতো বের করে আনা যায়) — §২.৬-এ দেখব।
এই একটিমাত্র অন্তর্দৃষ্টি থেকে জন্ম নেয় বিশাল প্রয়োগ-জগৎ:
- stochastic approximation ও SGD। আধুনিক মেশিন-লার্নিং যে stochastic gradient descent-এ মডেল শেখায়, তার অভিসরণ-প্রমাণের কেন্দ্রে martingale: প্রতিটি ধাপে gradient-এর noise-অংশ একটা martingale difference (\(\mathbb E[\text{noise}\mid\text{অতীত}]=0\)), আর তার সঞ্চয় একটা martingale — যার convergence (7.9) থেকেই "SGD থামে কোথায়" প্রমাণ হয়।
- sequential analysis (অনুক্রমিক পরীক্ষণ)। ক্লিনিকাল ট্রায়াল বা A/B টেস্টে আমরা তথ্য আসতে-আসতে সিদ্ধান্ত নিই — "এখনই থামব, না আরও তথ্য নেব?"। likelihood-ratio martingale ও stopping time এর গাণিতিক ভিত্তি (Wald-এর SPRT), এবং কখন থামলে সিদ্ধান্ত পক্ষপাতহীন থাকে তা ঠিক optional stopping theorem বলে।
- finance (অর্থায়ন)। আধুনিক গাণিতিক অর্থায়নের মূল স্বীকার্য — একটা ন্যায্য (arbitrage-মুক্ত) বাজারে discounted দামের প্রক্রিয়া একটা martingale (\"efficient market\"); option-মূল্যায়ন থেকে ঝুঁকি-নিরপেক্ষ মূল্যায়ন — সবই martingale-ভাষায়।
- probability-র নিজস্ব যন্ত্রপাতি। সবচেয়ে গভীর — 7.9-এর martingale convergence theorem (\"bounded martingale a.s. converges\") ও Doob's inequalities, যা SLLN-এর দ্বিতীয় প্রমাণ, concentration inequality, এবং আরও বহু ফলের একক, সর্বজনীন ইঞ্জিন। এই অধ্যায় ঠিক সেই যন্ত্রের ভিত্তি গাঁথে।
এক বাক্যে। martingale-এর প্রথম বড় ফল — martingale transform \((H\cdot X)_n=\sum H_k(X_k-X_{k-1})\) আবার martingale (\(H\) predictable ও bounded), অর্থাৎ "কোনো বাজির কৌশল ন্যায্য খেলাকে হারাতে পারে না" — আর এই কাঠামোই SGD/stochastic approximation, sequential analysis, finance, এবং 7.9-এর martingale convergence ও concentration-যন্ত্রের সর্বজনীন ভিত্তি।
১.৪ কখন থামলে গড় বদলায় না — optional stopping-এর পূর্বাভাস¶
martingale-এর দ্বিতীয় বড় প্রশ্ন — এবং এই অধ্যায়ের মুকুটমণি — থামার (stopping) সাথে জড়িত। ন্যায্য খেলায় \(\mathbb E[X_n]=\mathbb E[X_0]\) প্রতিটি স্থির সময় \(n\)-তে (গড়ে কোনো লাভ-ক্ষতি নেই)। কিন্তু আমরা প্রায়ই এলোমেলো, তথ্য-নির্ভর সময়ে থামি — "যখন প্রথম ৳\(N\) জিতব তখন থামব", বা "যখন প্রথম দেউলিয়া হব"। এমন একটা এলোমেলো থামার-সময় \(\tau\)-কে বলে stopping time — যার একমাত্র শর্ত: থামার সিদ্ধান্ত \(\{\tau\le n\}\) কেবল অতীত তথ্য \(\mathcal F_n\)-এর উপর নির্ভর করে, ভবিষ্যৎ উঁকি দিয়ে নয় (\"আজ থামব কিনা তা আজ পর্যন্ত যা দেখেছি তাতেই ঠিক করতে হবে\")।
স্বাভাবিক আশা: এমন এলোমেলো \(\tau\)-তে থামলেও কি গড় অপরিবর্তিত — \(\mathbb E[X_\tau]=\mathbb E[X_0]\)? — এটিই optional stopping (বা optional sampling) theorem। এর উত্তর একটা সাবধানী "হ্যাঁ, তবে শর্তসাপেক্ষে": এটি সত্য যখন (ক) \(\tau\) bounded, বা (খ) \(X\) bounded, বা (গ) \(\mathbb E[\tau]<\infty\) ও increment bounded — কিন্তু এই hypothesis ছাড়া মিথ্যা হয়ে যেতে পারে। সবচেয়ে শিক্ষণীয় ব্যর্থতা: একটা ন্যায্য simple random walk যদি আপনি "প্রথম যখন +১ ছোঁব" তখন থামেন, তাহলে নিশ্চিতভাবে (a.s.) +১-এ থামবেন — তাই \(\mathbb E[X_\tau]=1\ne0=\mathbb E[X_0]\)! এখানে \(\tau\) অসীম গড়-সময়ের (\(\mathbb E[\tau]=\infty\)), তাই কোনো শর্ত মেটে না — আর এই ফাঁকটাই বিখ্যাত doubling (martingale) কৌশল-এর "অমোঘ জয়"-এর বিভ্রম ও তার বাস্তব অসারতা ব্যাখ্যা করে। চিত্র 7-8-optional-stopping-ruin (সফল প্রয়োগ — gambler's ruin) ও 7-8-optional-stopping-fails (ব্যর্থতা — first-passage/doubling) এই দুই দিক পাশাপাশি দেখাবে।
এক বাক্যে। optional stopping theorem বলে এলোমেলো stopping time \(\tau\)-তে থামলেও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) — কিন্তু কেবল শর্তসাপেক্ষে (\(\tau\) bounded, বা \(X\) bounded, বা \(\mathbb E[\tau]<\infty\) ও bounded increments); hypothesis ভাঙলে (first-passage-এ \(\mathbb E[X_\tau]=1\ne0\), বা doubling-কৌশল) তা মিথ্যা — যা gambler's ruin-এর সঠিক হিসাব ও doubling-জয়ের বিভ্রম দুই-ই ব্যাখ্যা করে।
১.৫ এই অধ্যায়ের পথরেখা¶
- §২ সব মূল বস্তুর precise সংজ্ঞা ও বিবৃতি — filtration ও তথ্যপ্রবাহ (২.১); adapted ও predictable process (২.২); martingale / sub- / supermartingale (conditional-expectation-সংজ্ঞা, ২.৩); মূল উদাহরণ — random walk, গুণফল, Doob martingale, likelihood ratio, Pólya urn (২.৪); martingale transform ও "ন্যায্য খেলা হারানো যায় না" (২.৫); stopping time ও basic উদাহরণ (২.৬); stopped process \(X_{n\wedge\tau}\) যে martingale (২.৭); optional stopping theorem-এর তিন hypothesis-গুচ্ছ, gambler's ruin, ও hypothesis-ভাঙা failure (২.৮); Doob decomposition (২.৯)। ভারী প্রমাণ §৪-এ স্থগিত, স্পষ্ট forward pointer সহ।
- §৪ ভারী প্রমাণ — martingale transform martingale (pull-out দিয়ে); stopped process martingale (predictable indicator \(H_n=\mathbf 1_{\{n\le\tau\}}\) দিয়ে transform হিসেবে); optional stopping (প্রথমে bounded \(\tau\)-তে সরাসরি, তারপর DCT/MCT দিয়ে তিন hypothesis-গুচ্ছে উন্নয়ন); gambler's ruin-এর ruin-সম্ভাবনা ও গড়-সময়; এবং Doob decomposition-এর অস্তিত্ব ও a.s.-uniqueness।
- §৫–৬ simulation ও চিত্র (seed 20260619) — 7-8-martingale-paths (বহু martingale-পথ — গড়ে স্থির, পৃথক পথ দোলে), 7-8-optional-stopping-ruin (gambler's ruin — সীমানায় থামা, ruin-সম্ভাবনা ও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) empirically মেলা), 7-8-optional-stopping-fails (first-passage/doubling — \(\mathbb E[X_\tau]\ne\mathbb E[X_0]\)), এবং 7-8-doob-decomposition (submartingale \(S_n^2\) = martingale + predictable compensator \(n\))।
এর পরে Part VII-এর পুরস্কার: 7.9 — martingale convergence theorem (bounded martingale a.s. converges), Doob's maximal ও \(L^p\) inequalities, এবং SLLN-এর martingale-প্রমাণ; তারপর 7.10 — rigorous central limit theorem-এর দিকে।
এক বাক্যে পথরেখা। §২ সংজ্ঞা ও বিবৃতি (filtration + adapted/predictable + martingale/sub/super + উদাহরণ + martingale transform + stopping time + stopped process + optional stopping-এর তিন hypothesis + Doob decomposition) → §৪ প্রমাণ (transform via pull-out, stopped via predictable indicator, optional stopping via bounded-\(\tau\)+DCT, gambler's ruin, Doob uniqueness) → §৫–৬ চার চিত্র (seed 20260619); আর এই martingale-ভিত্তির উপর Part VII গড়ে 7.9 (martingale convergence ও Doob's inequalities) → 7.10 (rigorous CLT)।
২ · মূল ধারণা ও সংজ্ঞা¶
এই বিভাগে এ অধ্যায়ের সব formal বস্তুর precise সংজ্ঞা ও বিবৃতি দিই — প্রতিটি প্রতীক প্রথম ব্যবহারেই খুলে। কাঠামো §১-এর সুতো ধরে: প্রথমে filtration ও তথ্যপ্রবাহ (২.১); তারপর adapted ও predictable (২.২); তারপর কেন্দ্রীয় সংজ্ঞা — martingale / sub- / supermartingale (২.৩) ও মূল উদাহরণ (২.৪); তারপর martingale transform ও "ন্যায্য খেলা হারানো যায় না" (২.৫); তারপর stopping time (২.৬), stopped process (২.৭) ও optional stopping theorem তার তিন hypothesis-গুচ্ছ ও failure সহ (২.৮); শেষে Doob decomposition (২.৯)। ভারী প্রমাণগুলো §৪-এ — এখানে কেবল বিবৃতি ও অন্তর্দৃষ্টি, স্পষ্ট forward pointer সহ।
জুড়ে আমরা একটা probability space \((\Omega,\mathcal F,\mathbb P)\) ধরে কাজ করি, এবং discrete সময় \(n\in\{0,1,2,\dots\}\)। random variable বলতে measurable \(X:\Omega\to\mathbb R\) (7.3); \(\mathbb E[X]=\int_\Omega X\,d\mathbb P\) (7.4), \(X\in L^1\iff\mathbb E\lvert X\rvert<\infty\)। 7.7-এর শর্তাধীন প্রত্যাশা \(\mathbb E[\cdot\mid\mathcal G]\) ও তার সব ধর্ম (linearity, tower, pull-out, conditional Jensen, monotonicity) নিঃশব্দে ধরে নেওয়া। প্রতিটি conditional-expectation সমতা — \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) ইত্যাদি — by default a.s. (almost surely) অর্থে বোঝা, যেহেতু conditional expectation কেবল a.s.-অনন্যভাবে সংজ্ঞায়িত (7.7)।
২.১ filtration — তথ্যপ্রবাহের গাণিতিক রূপ¶
প্রথম ইট — সময়ে জমে-ওঠা তথ্যকে গণিতে বসানো। একটা একক sub-σ-algebra (7.7) ছিল একটা স্থির ছবি; এখন দরকার তার একটা সময়-নির্ভর, বর্ধমান অনুক্রম।
সংজ্ঞা (filtration)। \((\Omega,\mathcal F,\mathbb P)\)-এর উপর একটা filtration (ফিল্ট্রেশন — তথ্যপ্রবাহ) হলো sub-σ-algebra-গুলোর একটা অনুক্রম \((\mathcal F_n)_{n\ge0}\) যা বর্ধমান (increasing): $$ \mathcal F_0\;\subseteq\;\mathcal F_1\;\subseteq\;\mathcal F_2\;\subseteq\;\cdots\;\subseteq\;\mathcal F. $$ আমরা ভাবি \(\mathcal F_n\) = "সময় \(n\) পর্যন্ত পর্যবেক্ষণযোগ্য সমস্ত তথ্য"। nested কাঠামোই বলে তথ্য জমে, কখনো হারায় না। \((\Omega,\mathcal F,(\mathcal F_n),\mathbb P)\)-কে একটা filtered probability space বলে।
সবচেয়ে স্বাভাবিক উৎস প্রক্রিয়াটা নিজে: একটা random-variable-অনুক্রম \((X_n)\) দিলে তার natural filtration (স্বাভাবিক ফিল্ট্রেশন) $$ \mathcal F_n\;:=\;\sigma(X_0,X_1,\dots,X_n)\qquad(\text{"এ-পর্যন্ত দেখা সব }X\text{-এর তথ্য"}). $$ এটি স্বয়ংক্রিয়ভাবে বর্ধমান, কারণ generator-সেট বাড়ছে। দুই চরম সবসময় মনে রাখা ভালো (sanity-check): \(\mathcal F_n=\{\emptyset,\Omega\}\) সব \(n\)-তে ("কখনো কোনো তথ্য নেই") এবং \(\mathcal F_n=\mathcal F\) সব \(n\)-তে ("শুরুতেই সব জানা")। আর nested \(\mathcal F_n\subseteq\mathcal F_{n+1}\)-ই ঠিক সেই \(\mathcal H\subseteq\mathcal G\)-কাঠামো যা 7.7-এর tower property-কে এখানে কর্মক্ষম করে।
এক বাক্যে। filtration \((\mathcal F_n)_{n\ge0}\) হলো বর্ধমান sub-σ-algebra-অনুক্রম (\(\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\)) — সময়ে জমে-ওঠা তথ্যের গাণিতিক রূপ ("তথ্য জমে, হারায় না"); সবচেয়ে স্বাভাবিক উদাহরণ প্রক্রিয়াটার natural filtration \(\mathcal F_n=\sigma(X_0,\dots,X_n)\), আর এর nested কাঠামোই 7.7-এর tower-কে এখানে চালায়।
২.২ adapted ও predictable — দুই মৌলিক ভূমিকা¶
filtration বসানোর পর, একটা process-এর তথ্যপ্রবাহের সাথে সম্পর্ক দুই রকম — আর এই দুইয়ের পার্থক্যই পরের সব কিছুর চাবি।
সংজ্ঞা (adapted)। একটা process \((X_n)_{n\ge0}\) adapted (অভিযোজিত) \((\mathcal F_n)\)-এর সাপেক্ষে যদি প্রতিটি \(n\)-তে \(X_n\) একটা \(\mathcal F_n\)-measurable random variable — অর্থাৎ বর্তমান তথ্য \(\mathcal F_n\)-এ \(X_n\)-এর মান ইতিমধ্যে জানা। (natural filtration-এ প্রতিটি \((X_n)\) স্বয়ংক্রিয়ভাবে adapted।)
সংজ্ঞা (predictable)। একটা process \((H_n)_{n\ge1}\) predictable (পূর্বানুমেয়) যদি প্রতিটি \(n\ge1\)-তে \(H_n\) একটা \(\mathcal F_{n-1}\)-measurable random variable — অর্থাৎ এক ধাপ আগেই, \(\mathcal F_{n-1}\)-তে \(H_n\)-এর মান জানা, \(n\)-তম ঘটনা ঘটার আগেই।
পার্থক্যটা ঠিক এক-ধাপের সূচক-ব্যবধান — adapted-এ \(X_n\leftrightarrow\mathcal F_n\), predictable-এ \(H_n\leftrightarrow\mathcal F_{n-1}\) — কিন্তু অর্থে বিশাল। adapted মানে "এখন জানা" (যেমন আপনার বর্তমান সম্পদ); predictable মানে "আগেই জানা, ফলাফল দেখার আগে" (যেমন বাজির আকার, যা দান গড়ানোর আগে স্থির)। এই predictability-ই হলো "ভবিষ্যৎ উঁকি দিয়ে দেখা যায় না" নীতির আনুষ্ঠানিক রূপ — একটা বাজির কৌশল কেবল অতীত ব্যবহার করতে পারে, ভবিষ্যৎ নয়। ২.৫-এর martingale transform-এ ঠিক এই predictability-ই pull-out-কে বৈধ করে, আর তা থেকেই "ন্যায্য খেলা হারানো যায় না" বেরোয়।
এক বাক্যে। একটা process adapted যদি \(X_n\) \(\mathcal F_n\)-measurable ("এখনই জানা", যেমন বর্তমান সম্পদ), predictable যদি \(H_n\) \(\mathcal F_{n-1}\)-measurable ("এক-ধাপ-আগেই জানা", যেমন বাজির আকার ফলাফল দেখার আগে) — এই এক-ধাপের ব্যবধানই "ভবিষ্যৎ উঁকি দেওয়া যায় না"-র গণিত এবং martingale transform-এর চাবি।
২.৩ martingale, submartingale, supermartingale¶
এবার কেন্দ্রীয় সংজ্ঞা, পূর্ণ আকারে। §১.১-এর "ন্যায্য খেলা"-কে formally বসাই।
সংজ্ঞা (martingale)। একটা process \((X_n)_{n\ge0}\) একটা martingale (মার্টিঙ্গেল) filtration \((\mathcal F_n)\)-এর সাপেক্ষে যদি— 1. (integrability) প্রতিটি \(n\)-তে \(X_n\in L^1\) (অর্থাৎ \(\mathbb E\lvert X_n\rvert<\infty\)); 2. (adapted) প্রতিটি \(X_n\) \(\mathcal F_n\)-measurable; এবং 3. (martingale property) \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s. সব \(n\ge0\)-তে।
যদি ৩-এ "\(=\)"-এর বদলে \(\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n\) a.s. হয়, তবে \((X_n)\) একটা submartingale (পক্ষে-ঝোঁকা — গড়ে বাড়ে); আর \(\le\) হলে supermartingale (বিপক্ষে-ঝোঁকা — গড়ে কমে)।
শর্ত তিনটির ভূমিকা: integrability না-থাকলে \(\mathbb E[\cdot\mid\mathcal F_n]\) সংজ্ঞায়িতই নয় (7.7); adapted না-হলে "\(=X_n\)" তুলনাটাই অর্থহীন; আর শর্ত ৩-ই হৃদয় — "আগামীকালের সেরা পূর্বাভাস = আজকের মান"। নাম মনে রাখার সহজ সূত্র: supermartingale নিচে নামে (super = উপরে শুরু, পড়ে), submartingale উপরে ওঠে — উল্টোটা, subharmonic ফাংশনের সাদৃশ্যে (একটা convex/subharmonic ছবি সাব-নাম পায় যদিও বাড়ে)।
দুটো অবিলম্বে-পরিণতি, tower (7.7) থেকে, যা সারা অধ্যায়ে ব্যবহৃত:
- (দূর-ভবিষ্যৎ) martingale-এ \(m>n\) হলে \(\mathbb E[X_m\mid\mathcal F_n]=X_n\) — শুধু পরের ধাপ নয়, যেকোনো ভবিষ্যৎ ধাপের সেরা অনুমানও আজকের মান। (প্রমাণ: \(\mathbb E[X_m\mid\mathcal F_n]=\mathbb E[\mathbb E[X_m\mid\mathcal F_{m-1}]\mid\mathcal F_n]=\mathbb E[X_{m-1}\mid\mathcal F_n]\), পুনরাবৃত্তি — tower; §৪।)
- (ধ্রুব গড়) \(\mathbb E[X_n]=\mathbb E[X_0]\) সব \(n\)-তে (martingale); submartingale-এ \(\mathbb E[X_n]\) অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান। (\(G=\Omega\)-এ total expectation।)
আরেকটা দরকারি সেতু: \((X_n)\) martingale ও \(\varphi\) convex (\(\varphi(X_n)\in L^1\)) হলে \((\varphi(X_n))\) একটা submartingale — সরাসরি conditional Jensen (7.7): \(\varphi(X_n)=\varphi(\mathbb E[X_{n+1}\mid\mathcal F_n])\le\mathbb E[\varphi(X_{n+1})\mid\mathcal F_n]\)। বিশেষত \(\lvert X_n\rvert\) ও \(X_n^2\) (যদি \(L^1\)-এ) submartingale — যা 7.9-এর Doob's inequalities-এর গোড়া।
এক বাক্যে। \((X_n)\) একটা martingale যদি তা integrable, adapted, এবং \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s. (ন্যায্য খেলা); \(\ge\) হলে submartingale (গড়ে বাড়ে), \(\le\) হলে supermartingale (গড়ে কমে) — tower থেকে \(\mathbb E[X_m\mid\mathcal F_n]=X_n\) (\(m>n\)) ও \(\mathbb E[X_n]=\mathbb E[X_0]\) ধ্রুব, আর convex \(\varphi\)-তে conditional Jensen martingale→submartingale বানায়।
২.৪ মূল উদাহরণ — random walk, গুণফল, Doob martingale, likelihood ratio, Pólya urn¶
সংজ্ঞা জীবন্ত হয় উদাহরণে। প্রতিটির জন্য আসল কাজ একটাই — শর্ত ৩ (\(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\)) যাচাই করা; নিচে স্কেচ, পূর্ণ হিসাব §৩-৪।
- (ক) mean-0 random walk। \(\xi_1,\xi_2,\dots\) স্বাধীন (7.6), \(\mathbb E[\xi_k]=0\), \(\mathbb E\lvert\xi_k\rvert<\infty\); \(S_0=0\), \(S_n=\sum_{k=1}^n\xi_k\), \(\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)\)। তখন \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+\mathbb E[\xi_{n+1}\mid\mathcal F_n]=S_n+\mathbb E[\xi_{n+1}]=S_n\) (pull-out + independence, 7.7) — তাই \((S_n)\) একটা martingale। যদি \(\mathbb E[\xi_k]>0\), তবে submartingale; \(<0\) হলে supermartingale। (3.5-এর random walk-ই canonical martingale।)
- (খ) mean-1 iid-এর গুণফল। \(\eta_1,\eta_2,\dots\) স্বাধীন, \(\eta_k\ge0\), \(\mathbb E[\eta_k]=1\); \(M_0=1\), \(M_n=\prod_{k=1}^n\eta_k\)। তখন \(\mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\,\mathbb E[\eta_{n+1}]=M_n\) (pull-out: \(M_n\) \(\mathcal F_n\)-measurable, \(\eta_{n+1}\) স্বাধীন) — তাই martingale। (গুণমূলক ন্যায্যতা; likelihood ratio-র গোড়া।)
- (গ) Doob martingale। যেকোনো \(Y\in L^1\) ও filtration \((\mathcal F_n)\) নিয়ে সংজ্ঞা \(X_n:=\mathbb E[Y\mid\mathcal F_n]\) — "\(Y\)-এর সেরা অনুমান, সময় \(n\)-এর তথ্যে"। tower সরাসরি দেয় \(\mathbb E[X_{n+1}\mid\mathcal F_n]=\mathbb E[\mathbb E[Y\mid\mathcal F_{n+1}]\mid\mathcal F_n]=\mathbb E[Y\mid\mathcal F_n]=X_n\) — তাই স্বয়ংক্রিয়ভাবে martingale। এটি martingale-এর সবচেয়ে গুরুত্বপূর্ণ উৎস: একটা স্থির লক্ষ্য \(Y\) সম্পর্কে আমাদের অনুমান যত তথ্য জমে তত পরিশীলিত হয় (Bayesian updating-এর গতিশীল রূপ), আর 7.9-এর martingale convergence বলবে \(X_n\to Y\)।
- (ঘ) likelihood-ratio martingale। ডেটা \(Z_1,Z_2,\dots\) iid, দুই সম্ভাব্য density \(f\) ও \(g\) (\(f\) সত্য)। \(L_n=\prod_{k=1}^n\frac{g(Z_k)}{f(Z_k)}\) হলো \(f\)-এর অধীনে একটা martingale (কারণ \(\mathbb E_f[\frac{g(Z)}{f(Z)}]=\int g=1\) — (খ)-এর বিশেষ রূপ) — sequential hypothesis testing (Wald's SPRT)-এর কেন্দ্রীয় বস্তু।
- (ঙ) Pólya urn। একটা কলসে শুরুতে কিছু লাল ও সাদা বল; প্রতি ধাপে একটা বল তুলে তার রঙের আরেকটা বল সঙ্গে ফেরত দিই। সময় \(n\)-এ লালের অনুপাত \(X_n\) একটা martingale (\(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) — যাচাই §৩) — একটা চমকপ্রদ স্ব-শক্তিশালী (self-reinforcing) প্রক্রিয়া যেখানেও অনুপাত গড়ে স্থির থাকে।
প্রতিটিতে যন্ত্রপাতি একই — 7.7-এর pull-out (\(\mathcal F_n\)-measurable অংশ বের করা) ও independence (\(\mathbb E[\cdot\mid\mathcal F_n]=\mathbb E[\cdot]\) স্বাধীন অংশে) — তাই martingale-যাচাই প্রায় সবসময় এই দুই ধর্মের সরাসরি প্রয়োগ।
এক বাক্যে। canonical martingale — mean-0 random walk \(S_n=\sum\xi_k\), mean-1 iid-এর গুণফল \(M_n=\prod\eta_k\), Doob martingale \(X_n=\mathbb E[Y\mid\mathcal F_n]\) (tower থেকে স্বয়ংক্রিয়; লক্ষ্য \(Y\)-এর ক্রমে-পরিশীলিত অনুমান), likelihood ratio \(L_n\), ও Pólya urn-এর রঙ-অনুপাত — প্রতিটিই \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) যাচাই করে পাওয়া যায়, যন্ত্র সবসময় 7.7-এর pull-out ও independence।
২.৫ martingale transform — "ন্যায্য খেলা হারানো যায় না"¶
§১.৩-এর প্রথম বড় ফলটা এবার formally। একটা ন্যায্য খেলায় বাজির কৌশল প্রয়োগ করলে কী হয়?
সংজ্ঞা ও উপপাদ্য (martingale transform)। \((X_n)\) একটা martingale এবং \((H_n)_{n\ge1}\) একটা predictable process (\(H_n\) \(\mathcal F_{n-1}\)-measurable)। martingale transform (বা discrete stochastic integral) সংজ্ঞায়িত করি $$ (H\cdot X)n\;:=\;\sum),\qquad (H\cdot X)_0:=0. $$ তখন যদি }^{n}H_k\,(X_k-X_{k-1\(H\) bounded হয় (বা যথাযথ integrability মেটে), \((H\cdot X)_n\) আবার একটা martingale (এবং \(X\) super-/submartingale হলে \(H\ge0\)-তে যথাক্রমে super-/submartingale)।
স্বজ্ঞা: \(X_k-X_{k-1}\) হলো \(k\)-তম দানে প্রতি-একক-বাজির ন্যায্য মুনাফা, \(H_k\) আপনার বেছে নেওয়া বাজির আকার (যা \(\mathcal F_{k-1}\)-এ আগেই স্থির), তাই \((H\cdot X)_n\) আপনার সঞ্চিত মুনাফা একটা কৌশল \(H\)-এর অধীনে। উপপাদ্য বলে: এই সঞ্চিত মুনাফাও martingale — গড়ে শূন্য-লাভ। অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজির কৌশল ন্যায্য খেলার ন্যায্যতা ভাঙতে পারে না: you cannot beat a fair game. প্রমাণ একলাইন, 7.7-এর pull-out: \(\mathbb E[(H\cdot X)_{n+1}-(H\cdot X)_n\mid\mathcal F_n]=\mathbb E[H_{n+1}(X_{n+1}-X_n)\mid\mathcal F_n]=H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=H_{n+1}\cdot0=0\) — কারণ \(H_{n+1}\) \(\mathcal F_n\)-measurable (predictable), তাই বের করে আনা যায় (§৪)। এই predictability-ই সিদ্ধান্তকারী; \(H\) যদি ভবিষ্যৎ "দেখতে" পারত (adapted কিন্তু predictable নয়), কৌশলটা খেলা হারাতে পারত — কিন্তু সেটা প্রতারণা, গণিত নয়।
এক বাক্যে। martingale transform \((H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})\), যেখানে \(H\) predictable ও bounded, আবার একটা martingale — অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজির কৌশল ন্যায্য খেলাকে হারাতে পারে না; প্রমাণ এক-লাইন pull-out (\(H_{n+1}\) \(\mathcal F_n\)-measurable বলে বের করে \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) গুণ)।
২.৬ stopping time — কেবল অতীত-তথ্যে থামা¶
optional stopping-এর দিকে প্রথম ধাপ — "এলোমেলো থামার-সময়"-কে গণিতে বসানো, এমনভাবে যাতে ভবিষ্যৎ উঁকি দেওয়া না-যায়।
সংজ্ঞা (stopping time)। একটা random variable \(\tau:\Omega\to\{0,1,2,\dots\}\cup\{\infty\}\) একটা stopping time (থামার-সময়) filtration \((\mathcal F_n)\)-এর সাপেক্ষে যদি প্রতিটি \(n\ge0\)-তে $$ {\tau\le n}\in\mathcal F_n\qquad(\text{সমতুল্যভাবে } {\tau=n}\in\mathcal F_n). $$ অর্থাৎ "\(n\) সময়ের মধ্যে থেমে গেছি কিনা" — এই সিদ্ধান্ত কেবল সময় \(n\) পর্যন্ত পর্যবেক্ষিত তথ্য-এর উপর নির্ভর করে, ভবিষ্যৎ না-দেখে।
মূল স্বজ্ঞা: stopping time হলো এমন থামার-নিয়ম যা আপনি বাস্তবে অনুসরণ করতে পারতেন — প্রতি মুহূর্তে আপনি জানেন থামবেন কিনা, ভবিষ্যৎ জানার দরকার নেই। উদাহরণ:
- hitting time (পৌঁছানোর সময়)। একটা adapted process \((X_n)\) ও একটা সেট \(B\) নিয়ে \(\tau_B=\min\{n:X_n\in B\}\) ("\(B\)-তে প্রথম পৌঁছানো") একটা stopping time — কারণ \(\{\tau_B\le n\}=\bigcup_{k\le n}\{X_k\in B\}\in\mathcal F_n\)। (gambler's-ruin-এর "\(0\) বা \(N\)-এ প্রথম পৌঁছানো" এর বিশেষ রূপ।)
- কিন্তু "\(X\) তার সর্বোচ্চে পৌঁছানোর সময়" (পুরো ভবিষ্যৎ-পথ জানা লাগে) stopping time নয় — ভবিষ্যৎ উঁকি দিতে হয়।
আরও দুটো দরকারি তথ্য: যেকোনো ধ্রুব সময় \(\tau\equiv m\) একটা (তুচ্ছ) stopping time; আর দুটো stopping time-এর \(\min\) (যেমন \(\tau\wedge m=\min(\tau,m)\), "\(\tau\) অথবা \(m\) — যেটা আগে") আবার stopping time — ২.৭-এ এটিই \(X_{n\wedge\tau}\)-কে অর্থ দেবে।
এক বাক্যে। stopping time \(\tau\) হলো এমন এলোমেলো থামার-সময় যেখানে \(\{\tau\le n\}\in\mathcal F_n\) — থামার সিদ্ধান্ত কেবল অতীত-তথ্যে, ভবিষ্যৎ উঁকি দিয়ে নয় (যেমন "\(B\)-তে প্রথম পৌঁছানো" \(\tau_B\) হলো stopping time, কিন্তু "সর্বোচ্চে পৌঁছানোর সময়" নয়)।
২.৭ stopped process — থামালেও martingale থেকে যায়¶
stopping time হাতে নিয়ে এখন martingale-কে "\(\tau\)-তে থামিয়ে" দিই, এবং দেখি ন্যায্যতা টিকে থাকে।
সংজ্ঞা ও উপপাদ্য (stopped process)। \((X_n)\) martingale ও \(\tau\) একটা stopping time হলে, stopped process (থামানো প্রক্রিয়া) $$ X_n^\tau\;:=\;X_{n\wedge\tau}\qquad(\text{যেখানে } n\wedge\tau=\min(n,\tau)) $$ আবার একটা martingale (এবং super-/submartingale হলে তা-ই থাকে)। বিশেষত \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে।
স্বজ্ঞা: \(X_{n\wedge\tau}\) মানে "\(\tau\) পর্যন্ত খেলো, তারপর থেমে যাও — মান আর বদলায় না"। উপপাদ্য বলে, থেমে যাওয়া নিজে একটা ন্যায্য কৌশল — তাই থামালেও খেলা ন্যায্যই থাকে। আর প্রমাণটা ২.৫-এর সরাসরি ফল: থামাটা ঠিক একটা predictable bounded transform — বাজি \(H_n=\mathbf 1_{\{n\le\tau\}}=\mathbf 1_{\{\tau\ge n\}}\) নিন ("\(\tau\) পর্যন্ত প্রতি ধাপে এক-একক বাজি, তারপর শূন্য")। লক্ষণীয় \(\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}\) — তাই \(H_n\) predictable! তখন \(X_{n\wedge\tau}-X_0=(H\cdot X)_n\), আর martingale transform (২.৫) থেকেই \(X_{n\wedge\tau}\) martingale (§৪)। অর্থাৎ "\(\tau\)-তে থামা" আর "একটা বিশেষ predictable কৌশল খেলা" — একই কথা।
একটা সতর্কতা: \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সবসময় খাটে (প্রতিটি স্থির \(n\)-তে), কিন্তু এটি এখনও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) নয় — \(n\to\infty\)-এ সীমা নেওয়া দরকার, আর ঠিক সেখানেই (২.৮-এর) hypothesis লাগে।
এক বাক্যে। stopped process \(X_{n\wedge\tau}\) আবার একটা martingale (তাই \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে) — কারণ "থামা" হলো predictable bounded বাজি \(H_n=\mathbf 1_{\{\tau\ge n\}}\) (\(\{\tau\ge n\}\in\mathcal F_{n-1}\)) দিয়ে একটা martingale transform; তবে \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) এখনও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) নয় — \(n\to\infty\)-সীমায় শর্ত লাগে।
২.৮ optional stopping theorem — তিন hypothesis-গুচ্ছ ও তার সীমা¶
এই অধ্যায়ের মুকুটমণি। প্রশ্নটা ছিল: এলোমেলো \(\tau\)-তে থামলে কি \(\mathbb E[X_\tau]=\mathbb E[X_0]\)? ২.৭ দিয়েছে \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\); এখন \(n\to\infty\) পার করতে হবে, আর সেটাই শর্ত দাবি করে।
উপপাদ্য (optional stopping / optional sampling)। \((X_n)\) একটা martingale ও \(\tau\) একটা stopping time। তাহলে \(X_\tau\in L^1\) এবং $$ \boxed{\ \mathbb E[X_\tau]\;=\;\mathbb E[X_0]\ } $$ — যদি নিচের যেকোনো একটি শর্ত মেটে: - (ক) \(\tau\) bounded: কোনো ধ্রুবক \(N\)-তে \(\tau\le N\) a.s.; - (খ) \(X\) bounded ও \(\tau<\infty\) a.s.: কোনো ধ্রুবক \(C\)-তে \(\lvert X_{n\wedge\tau}\rvert\le C\) a.s. সব \(n\)-তে; - (গ) \(\mathbb E[\tau]<\infty\) এবং bounded increments: কোনো ধ্রুবক \(C\)-তে \(\lvert X_{n+1}-X_n\rvert\le C\) a.s.
(submartingale-এ "\(=\)"-এর বদলে \(\mathbb E[X_\tau]\ge\mathbb E[X_0]\), supermartingale-এ \(\le\)।)
প্রতিটি শর্ত একটাই কাজ করে — \(n\to\infty\)-এ \(\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]\) সীমা-বিনিময়কে বৈধ করা: (ক) তুচ্ছভাবে \(n\ge N\)-এ \(X_{n\wedge\tau}=X_\tau\); (খ) bounded convergence (7.4-এর DCT, \(C\) dominating); (গ) increment-যোগফলে \(\sum\)–\(\mathbb E\) বিনিময় (\(\mathbb E[\tau]<\infty\) ও bounded increments দিয়ে dominating function বানিয়ে DCT)। স্বজ্ঞা এক বাক্যে: খেলা যদি বাস্তবে শেষ হয় (অসীম পুঁজি বা অসীম সময় না-লাগিয়ে), তবে গড়-ন্যায্যতা টিকে থাকে।
প্রয়োগ — gambler's ruin। simple random walk \(S_n\) (\(\pm1\), ন্যায্য), শুরু \(S_0=k\), থামি \(\tau=\) "\(0\) অথবা \(N\)-এ প্রথম পৌঁছানো" (\(0<k<N\))। \(X\) bounded (মান \([0,N]\)-এ) ও \(\tau<\infty\) a.s. — শর্ত (খ) মেটে, তাই \(\mathbb E[S_\tau]=S_0=k\)। কিন্তু \(S_\tau\in\{0,N\}\), তাই \(k=\mathbb E[S_\tau]=0\cdot\mathbb P(\text{ruin})+N\cdot\mathbb P(\text{win})\), যা সরাসরি দেয় ruin-সম্ভাবনা \(\mathbb P(\text{win})=k/N\), \(\mathbb P(\text{ruin})=1-k/N\)। আর \(S_n^2-n\) একটা martingale (২.৯) — তাতে optional stopping প্রয়োগ করলে গড়-সময় \(\mathbb E[\tau]=k(N-k)\) বেরোয় (§৩)। এটিই 3.5-এর gambler's ruin-এর কঠোর, পূর্ণ হিসাব (চিত্র 7-8-optional-stopping-ruin)।
ব্যর্থতা — hypothesis ছাড়া। সতর্কতা সবচেয়ে শিক্ষণীয়। একই ন্যায্য simple random walk (\(S_0=0\)), কিন্তু এবার \(\tau=\) "প্রথম যখন \(S_n=1\)"। জানা যায় \(\tau<\infty\) a.s. (recurrence), তাই \(S_\tau=1\) নিশ্চিতভাবে — অর্থাৎ $$ \mathbb E[S_\tau]\;=\;1\;\ne\;0\;=\;\mathbb E[S_0]\;! $$ optional stopping এখানে মিথ্যা — কারণ কোনো শর্তই মেটে না: \(\tau\) unbounded, \(X=S\) unbounded, এবং \(\mathbb E[\tau]=\infty\) (first-passage-এর গড় অসীম)। এটিই বিখ্যাত doubling (martingale) কৌশল-এর রহস্য: হারলে বাজি দ্বিগুণ করতে থাকুন, প্রথম জয়ে থামুন — তাত্ত্বিকভাবে "নিশ্চিত ৳১ লাভ", কিন্তু তার জন্য দরকার অসীম পুঁজি ও অসীম সময় (\(\mathbb E[\tau]=\infty\), unbounded loss) — যা বাস্তবে নেই, তাই "অমোঘ জয়" একটা বিভ্রম। hypothesis-ই সেই বিভ্রম থেকে রক্ষাকবচ (চিত্র 7-8-optional-stopping-fails)।
এক বাক্যে। optional stopping theorem — martingale ও stopping time \(\tau\)-তে \(\mathbb E[X_\tau]=\mathbb E[X_0]\) যদি (ক) \(\tau\) bounded, (খ) \(X\) bounded, বা (গ) \(\mathbb E[\tau]<\infty\) ও bounded increments (প্রতিটিই \(n\to\infty\)-সীমা-বিনিময়কে DCT/MCT দিয়ে বৈধ করে); gambler's ruin-এ ruin-সম্ভাবনা \(1-k/N\) ও \(\mathbb E[\tau]=k(N-k)\) এর সরাসরি ফল, কিন্তু hypothesis ছাড়া (first-passage-এ \(\mathbb E[S_\tau]=1\ne0\), doubling-কৌশলে অসীম পুঁজি) তা ভেঙে পড়ে।
২.৯ Doob decomposition — ঝোঁক বনাম গোলমাল আলাদা করা¶
শেষ একটা কাঠামোগত ফল, যা submartingale-কে একটা পরিষ্কার অংশে ভাঙে — martingale (বিশুদ্ধ গোলমাল) আর একটা predictable প্রবণতা (drift)।
উপপাদ্য (Doob decomposition)। \((X_n)\) একটা submartingale হলে, তাকে অনন্যভাবে (a.s.) লেখা যায় $$ X_n\;=\;M_n\;+\;A_n, $$ যেখানে \((M_n)\) একটা martingale (\(M_0=X_0\)), এবং \((A_n)\) একটা predictable, অ-হ্রাসমান process (\(A_0=0\), \(A_n\le A_{n+1}\), \(A_n\) \(\mathcal F_{n-1}\)-measurable) — একে compensator (ক্ষতিপূরক) বলে। (supermartingale-এ \(A\) অ-বর্ধমান।)
নির্মাণ স্বচ্ছ: increment-কে দুই ভাগে ভাঙি — predictable প্রত্যাশিত-বৃদ্ধি ও বিশুদ্ধ-গোলমাল। \(A_n=\sum_{k=1}^n\big(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1}\big)\) (submartingale বলে প্রতিটি পদ \(\ge0\), তাই \(A\) অ-হ্রাসমান ও predictable), আর \(M_n=X_n-A_n\) (যাচাই: martingale)। স্বজ্ঞা: \(A_n\) ধরে রাখে "গড়ে কতটা এগোনোর কথা ছিল" (drift/প্রবণতা), আর \(M_n\) ধরে রাখে "তার চারপাশে এলোমেলো ওঠানামা" (martingale অংশ) — অর্থাৎ প্রবণতা ও গোলমাল আলাদা করা।
ধ্রুপদী উদাহরণ: \(S_n\) ন্যায্য simple random walk হলে \(S_n^2\) একটা submartingale (convex \(\varphi(t)=t^2\), ২.৩), এবং তার Doob decomposition $$ S_n^2\;=\;\underbrace{(S_n^2-n)}{\text{martingale } M_n}\;+\;\underbrace{n}, $$ অর্থাৎ } A_n=\langle S\rangle_n\(A_n=n\) ঠিক "জমে-ওঠা variance" (একে quadratic variation \(\langle S\rangle_n\) বলে), আর \(S_n^2-n\) একটা martingale — যা ঠিক gambler's-ruin-এর \(\mathbb E[\tau]\) বের করতে কাজে লাগে (২.৮)। এই decomposition-ই continuous সময়ে Doob–Meyer ও stochastic calculus-এর discrete বীজ (চিত্র 7-8-doob-decomposition)।
এক বাক্যে। Doob decomposition — যেকোনো submartingale \(X_n=M_n+A_n\) অনন্যভাবে (a.s.), যেখানে \(M\) martingale (বিশুদ্ধ গোলমাল) ও \(A\) predictable অ-হ্রাসমান compensator (\(A_n=\sum_k(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})\), drift) — অর্থাৎ ঝোঁক ও গোলমাল আলাদা; canonical উদাহরণ \(S_n^2=(S_n^2-n)+n\), যেখানে \(\langle S\rangle_n=n\) জমে-ওঠা variance।
৩ · পূর্ণাঙ্গ উদাহরণ¶
§১–২-এ martingale (মার্টিঙ্গেল)-তত্ত্বের গোটা স্থাপত্য গড়া হয়েছে — প্রথমে filtration (ফিল্ট্রেশন, তথ্যের ক্রমবর্ধমান প্রবাহ) \(\mathcal F_0\subseteq\mathcal F_1\subseteq\mathcal F_2\subseteq\cdots\), যেখানে \(\mathcal F_n\) হলো "সময় \(n\) পর্যন্ত যা জানা"; তারপর adapted (অভিযোজিত) প্রক্রিয়া (\(X_n\) হলো \(\mathcal F_n\)-পরিমাপযোগ্য) ও predictable (পূর্বানুমেয়) প্রক্রিয়া (\(H_n\) হলো \(\mathcal F_{n-1}\)-পরিমাপযোগ্য, অর্থাৎ এক-ধাপ-আগেই জানা); আর কেন্দ্রীয় সংজ্ঞা — \((X_n)\) একটা martingale যদি প্রতিটি ধাপে \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\), submartingale (সাব-মার্টিঙ্গেল) যদি \(\ge X_n\), আর supermartingale (সুপার-মার্টিঙ্গেল) যদি \(\le X_n\)। martingale মানে "ন্যায্য খেলা (fair game)": আজকের তথ্য হাতে নিয়েও কালকের সেরা অনুমান আজকের মানই। সঙ্গে এসেছে কয়েকটা হাতিয়ার — martingale transform (মার্টিঙ্গেল রূপান্তর) \((H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})\) (predictable বাজির ফল আবার martingale), stopping time (থামার সময়) \(\tau\) (যেখানে \(\{\tau\le n\}\in\mathcal F_n\) — "এখনই থামব কিনা তা শুধু এখন পর্যন্ত তথ্যেই ঠিক হয়"), optional stopping theorem (ঐচ্ছিক-থামার উপপাদ্য) \(\mathbb E[X_\tau]=\mathbb E[X_0]\) (শর্তসাপেক্ষে), আর Doob decomposition (ডুব পচন) — যেকোনো submartingale-কে একটা martingale ও একটা বর্ধমান predictable compensator (ক্ষতিপূরক)-এ ভাঙা। এই অংশের উদ্দেশ্য সেই বিমূর্ত কাঠামোকে হাতে-কলমে, কংক্রিট সংখ্যা ও কংক্রিট সিমুলেশন দিয়ে ছুঁয়ে দেখা — random walk কীভাবে martingale হয়ে ওঠে, যেকোনো integrable \(Y\)-এর "ধাপে-ধাপে উন্মোচন" কীভাবে আপনাআপনি martingale, কেন কোনো বাজি-কৌশল ন্যায্য খেলা হারাতে পারে না, optional stopping কীভাবে gambler's ruin-এর উত্তর এক লাইনে বার করে, কোথায় ও কেন সেই উপপাদ্য ভেঙে পড়ে, আর \(S_n^2-n\) কীভাবে "জমা-হওয়া তারতম্য"-কে ক্ষতিপূরক হিসেবে আলাদা করে। ছয়টি উদাহরণে প্রতিটি ধাপ ধৈর্য ধরে কষব — কোনো হিসাব লুকানো থাকবে না — তারপর প্রতিটির শেষে "কী শিখলাম" বলে মূল শিক্ষাটা গুটিয়ে আনব। কষ্টের স্তর শিরোনামে তারা দিয়ে চিহ্নিত: ★ = সরাসরি, সংজ্ঞা প্রয়োগ করলেই হয় · ★★ = কিছু কৌশল বা সতর্ক যুক্তি লাগে। প্রতিটি ইংরেজি পরিভাষা প্রথম ব্যবহারে বাংলায় খুলে দেওয়া হবে। সব সিমুলেশন একই বীজে (seed np.random.default_rng(20260619)) চালানো, যাতে সংখ্যাগুলো পুনরুৎপাদনযোগ্য থাকে।
উদাহরণ ১ — random walk একটি martingale (★)¶
সেটআপ। নিরপেক্ষ মুদ্রা-হাঁটা (symmetric random walk) গড়ি। ধরা যাক \(\xi_1,\xi_2,\dots\) স্বাধীন, প্রতিটি সমান সম্ভাবনায় \(\pm1\): $$ \mathbb P(\xi_i=+1)=\mathbb P(\xi_i=-1)=\tfrac12,\qquad \mathbb E[\xi_i]=(+1)\tfrac12+(-1)\tfrac12=0. $$ আংশিক-যোগফল \(S_n=\sum_{i=1}^n\xi_i\) (\(S_0=0\)) — প্রতি ধাপে এক কদম ডানে বা বাঁয়ে। filtration নিই \(\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)\) — "\(n\) ধাপ পর্যন্ত সব কদম জানা"। স্পষ্টতই \(S_n\) হলো \(\mathcal F_n\)-পরিমাপযোগ্য, তাই \((S_n)\) adapted। প্রশ্ন: \((S_n)\) কি martingale?
ধাপ ১ — তিন শর্ত যাচাই। martingale হতে তিনটি জিনিস লাগে: (ক) \((S_n)\) adapted ✓ (উপরে); (খ) প্রতিটি \(S_n\) integrable, অর্থাৎ \(\mathbb E\lvert S_n\rvert<\infty\) — এখানে \(\lvert S_n\rvert\le n\) পরিবদ্ধ, তাই ✓; (গ) মূল সমতা \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n\)। তৃতীয়টাই আসল কাজ।
ধাপ ২ — মূল সমতা কষা। লিখি \(S_{n+1}=S_n+\xi_{n+1}\), তারপর শর্তাধীন প্রত্যাশার linearity খাটাই: $$ \mathbb E[S_{n+1}\mid\mathcal F_n]=\mathbb E[S_n\mid\mathcal F_n]+\mathbb E[\xi_{n+1}\mid\mathcal F_n]. $$ প্রথম পদে \(S_n\) হলো \(\mathcal F_n\)-পরিমাপযোগ্য (ইতিমধ্যেই জানা), তাই pull-out-এ তা ধ্রুবকের মতো বেরিয়ে আসে: \(\mathbb E[S_n\mid\mathcal F_n]=S_n\)। দ্বিতীয় পদে \(\xi_{n+1}\) হলো \(\xi_1,\dots,\xi_n\)-এর (তথা \(\mathcal F_n\)-এর) স্বাধীন (independent), তাই independence rule বলে শর্ত মুছে যায়: \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0\)। মিলিয়ে: $$ \boxed{\ \mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+0=S_n.\ } $$ অর্থাৎ "আগামীকালের অবস্থানের সেরা অনুমান, আজকের সব তথ্য হাতে নিয়েও, আজকের অবস্থানই" — \((S_n)\) একটা martingale।
ধাপ ৩ — অপরিবর্তনীয় গড়। martingale-এর সরাসরি ফল: tower property দিয়ে গড় সময়ের সঙ্গে বদলায় না। \(\mathbb E[S_{n+1}]=\mathbb E\big[\mathbb E[S_{n+1}\mid\mathcal F_n]\big]=\mathbb E[S_n]\), আর \(\mathbb E[S_0]=0\), তাই আরোহণে $$ \mathbb E[S_n]=0\quad\text{সব } n\text{-তে}. $$ হাঁটা যতই দূর যাক, প্রত্যাশিত অবস্থান শূন্যেই থাকে (যদিও ছড়ানো বাড়ে — \(\operatorname{Var}(S_n)=n\), উদাহরণ ৬-এ ফিরবে)।
ধাপ ৪ — পক্ষপাত থাকলে আর martingale নয়। ধরা যাক মুদ্রা পক্ষপাতী, \(\mathbb P(\xi=+1)=p\ne\tfrac12\), তাই \(\mathbb E[\xi]=2p-1=:\mu\ne0\)। তখন ধাপ ২-এর শেষ পদ \(\mu\) হয়ে দাঁড়ায়: $$ \mathbb E[S_{n+1}\mid\mathcal F_n]=S_n+\mu. $$ \(\mu>0\) হলে \(\ge S_n\) — submartingale (গড়ে উপরে টানে, খেলোয়াড়ের পক্ষে অনুকূল); \(\mu<0\) হলে \(\le S_n\) — supermartingale (ক্যাসিনোর মতো প্রতিকূল)। ঠিক \(\mu=0\) — ন্যায্যতার সরু সীমা — তেই martingale। (চাইলে \(\tilde S_n=S_n-n\mu\) নিয়ে আবার martingale বানানো যায় — এটাই Doob পচনের প্রথম ঝলক, উদাহরণ ৬।)
একটি কোডে দেখা। \(\mathbb E[S_n]\approx0\) সিমুলেশনে যাচাই করি:
import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 200_000, 50
xi = rng.choice([-1, 1], size=(paths, steps)) # ±1 fair
S = xi.cumsum(axis=1) # S_1..S_50
print("E[S_10] ≈", round(S[:, 9].mean(), 4)) # ≈ 0
print("E[S_50] ≈", round(S[:, 49].mean(), 4)) # ≈ 0
print("Var(S_50) ≈", round(S[:, 49].var(), 3)) # ≈ 50
| পরিমাণ | তত্ত্ব | সিমুলেশন (MC) |
|---|---|---|
| \(\mathbb E[S_{10}]\) | \(0\) | \(\approx0\) |
| \(\mathbb E[S_{50}]\) | \(0\) | \(\approx0\) |
| \(\operatorname{Var}(S_{50})\) | \(n=50\) | \(\approx50\) |
সব \(\mathbb E[S_n]\) শূন্যের গায়ে, আর ভেদ ঠিক \(n=50\) — martingale-সমতার প্রত্যক্ষ ছাপ।
কী শিখলাম। নিরপেক্ষ random walk \(S_n=\sum\xi_i\) (\(\xi=\pm1\)) একটা martingale, কারণ \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0\) (স্বাধীনতা) আর \(S_n\) pull-out-এ অটুট, ফলে \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n\); তাই \(\mathbb E[S_n]=0\) সব \(n\)-তে। পক্ষপাত \(\mathbb E[\xi]=\mu\ne0\) থাকলে আর নয় — \(\mu>0\)-এ submartingale, \(\mu<0\)-এ supermartingale। স্বজ্ঞা: martingale = "ন্যায্য খেলা", যেখানে প্রতি ধাপের প্রত্যাশিত লাভ ঠিক শূন্য; এই একটা মাত্র ভারসাম্যই গোটা তত্ত্বের চালিকাশক্তি, আর পরের সব উদাহরণ এই হাঁটাটাকেই নানা কোণে ঘুরিয়ে দেখবে।
উদাহরণ ২ — Doob martingale \(\mathbb E[Y\mid\mathcal F_n]\) (★)¶
সেটআপ। আগের উদাহরণে একটা নির্দিষ্ট প্রক্রিয়া (\(S_n\)) martingale হলো। এবার একটা আশ্চর্য সাধারণ সত্য: যেকোনো filtration \((\mathcal F_n)\) আর যেকোনো একটিমাত্র integrable random variable \(Y\) (\(\mathbb E\lvert Y\rvert<\infty\)) দিলে, $$ X_n:=\mathbb E[Y\mid\mathcal F_n] $$ সবসময় একটা martingale — একে বলে Doob martingale (ডুব মার্টিঙ্গেল)। স্বজ্ঞাটা সুন্দর: একটা অজানা সংখ্যা \(Y\) আছে; সময়ের সঙ্গে তথ্য \(\mathcal F_n\) বাড়ছে; \(X_n\) হলো "এ-পর্যন্ত যা জানি, তাতে \(Y\)-এর সেরা অনুমান" — অর্থাৎ \(Y\)-কে ধাপে-ধাপে উন্মোচন করার প্রক্রিয়া।
ধাপ ১ — তিন শর্ত। (ক) adapted: সংজ্ঞা-অনুযায়ী \(\mathbb E[Y\mid\mathcal F_n]\) হলো \(\mathcal F_n\)-পরিমাপযোগ্য ✓। (খ) integrable: শর্তাধীন প্রত্যাশা \(L^1\)-সংকোচক, \(\mathbb E\lvert X_n\rvert=\mathbb E\big\lvert\mathbb E[Y\mid\mathcal F_n]\big\rvert\le\mathbb E\big[\mathbb E[\lvert Y\rvert\mid\mathcal F_n]\big]=\mathbb E\lvert Y\rvert<\infty\) ✓ (conditional Jensen + tower)। (গ) মূল সমতা — নিচে।
ধাপ ২ — tower property-ই পুরো প্রমাণ। \(\mathcal F_n\subseteq\mathcal F_{n+1}\) (filtration বর্ধমান)। তাই tower property-এর স্তর-রূপ (\(\mathcal H\subseteq\mathcal G\) হলে \(\mathbb E[\mathbb E[Y\mid\mathcal G]\mid\mathcal H]=\mathbb E[Y\mid\mathcal H]\), এখানে \(\mathcal H=\mathcal F_n\), \(\mathcal G=\mathcal F_{n+1}\)) সরাসরি বলে: $$ \mathbb E[X_{n+1}\mid\mathcal F_n]=\mathbb E\big[\mathbb E[Y\mid\mathcal F_{n+1}]\,\big\mid\,\mathcal F_n\big]=\mathbb E[Y\mid\mathcal F_n]=X_n. $$ $$ \boxed{\ \mathbb E[X_{n+1}\mid\mathcal F_n]=X_n.\ } $$ একটিমাত্র সূত্রে — "মোটাটাই জেতে" — Doob martingale-এর martingale-ত্ব প্রমাণিত। কোনো হিসাব নয়, নিছক tower।
ধাপ ৩ — দুই প্রান্ত। \(\mathcal F_0=\{\varnothing,\Omega\}\) (কিছুই জানা নেই) হলে \(X_0=\mathbb E[Y]\) — শুরুর সেরা অনুমান নিছক গড়। আর যদি \(Y\) হয় \(\mathcal F_N\)-পরিমাপযোগ্য (সময় \(N\)-এ সব জানা), তবে \(X_N=\mathbb E[Y\mid\mathcal F_N]=Y\) — উন্মোচন সম্পূর্ণ। মাঝের \(X_n\)-গুলো \(\mathbb E[Y]\) থেকে \(Y\)-এর দিকে ক্রমে "ফোকাস" করে।
ধাপ ৪ — একটা কংক্রিট কেস। নাও \(Y=S_N\) (উদাহরণ ১-এর হাঁটার শেষ অবস্থান), \(\mathcal F_n=\sigma(\xi_1,\dots,\xi_n)\), \(n\le N\)। তখন $$ X_n=\mathbb E[S_N\mid\mathcal F_n]=\mathbb E\Big[\underbrace{S_n}{\text{জানা}}+\underbrace{(\xi\,\Big\mid\,\mathcal F_n\Big]=S_n+0=S_n. $$ অর্থাৎ এই বিশেষ ক্ষেত্রে Doob martingale হুবহু random walk-ই ফিরিয়ে দেয় — উদাহরণ ১ আসলে উদাহরণ ২-এরই একটা দৃষ্টান্ত! (এই কাঠামোই পরে concentration inequality-তে — যেমন Azuma–Hoeffding — কাজে লাগে, যেখানে }+\cdots+\xi_N)}_{\text{স্বাধীন, গড় }0\(Y=f(\xi_1,\dots,\xi_N)\) আর \(X_n\) ধাপে-ধাপে উন্মোচন।)
একটি কোডে দেখা। martingale-সমতা \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) সংখ্যায় দেখি — \(Y=S_{10}\), \(\mathcal F_3\)-এর atom-এ (\(S_1,S_2,S_3\) স্থির রেখে) \(X_4\)-এর শর্তাধীন গড় \(X_3\)-এর সমান হওয়া উচিত:
import numpy as np
rng = np.random.default_rng(20260619)
N, paths = 10, 2_000_000
xi = rng.choice([-1, 1], size=(paths, N))
S = xi.cumsum(axis=1)
Y = S[:, N-1] # Y = S_10
# F_3 শর্ত: (S_1,S_2,S_3) = (1,2,1) atom-এ আটকে
mask = (S[:,0]==1) & (S[:,1]==2) & (S[:,2]==1)
X3 = S[mask, 2].mean() # = 1 (ধ্রুব, atom-এ)
X4 = Y[mask].mean() # E[Y | F_3] উপর F_4-গড় = E[Y|F_3]
print("X_3 =", round(X3,4), " E[X_4|F_3] =", round(X4,4)) # 1.0 ≈ 1.0
কী শিখলাম। যেকোনো integrable \(Y\)-এর জন্য \(X_n=\mathbb E[Y\mid\mathcal F_n]\) আপনাআপনি একটা martingale — প্রমাণ নিছক tower property, কারণ \(\mathcal F_n\subseteq\mathcal F_{n+1}\) থাকায় \(\mathbb E[\mathbb E[Y\mid\mathcal F_{n+1}]\mid\mathcal F_n]=\mathbb E[Y\mid\mathcal F_n]\)। স্বজ্ঞা: \(X_n\) হলো \(Y\)-এর "ধাপে-ধাপে উন্মোচন" — শুরুতে \(\mathbb E[Y]\), শেষে \(Y\), মাঝে ক্রমশ ধারালো অনুমান; martingale-ত্ব মানে নতুন তথ্য যোগ হলেও অনুমান গড়ে পক্ষপাতহীন (নিরপেক্ষ)। এটিই martingale-এর সবচেয়ে উর্বর উৎস — উদাহরণ ১-এর random walk-ও এর একটা বিশেষ রূপ — আর 7.9-এর convergence-তত্ত্ব ঠিক এই "অনুমান শেষমেশ স্থির হয়" ঘটনাটাকে কঠোর করে।
উদাহরণ ৩ — martingale transform: ন্যায্য খেলা হারানো যায় না (★★)¶
সেটআপ। একটা ন্যায্য খেলা — random walk \(S_n\) (উদাহরণ ১) — আর একজন খেলোয়াড় যে প্রতি দানে বাজি ধরে। ধরা যাক \(n\)-তম দানে সে \(H_n\) টাকা বাজি রাখে, আর সেই দানে ফল \(\xi_n=S_n-S_{n-1}=\pm1\), তাই তার ঐ-দানের লাভ \(H_n\,\xi_n\)। মোট জমা-লাভ $$ (H\cdot S)n=\sum^n H_k\,\xi_k. $$ একে বলে }^n H_k\,(S_k-S_{k-1})=\sum_{k=1martingale transform। গুরুত্বপূর্ণ শর্ত: বাজি \(H_n\) হতে হবে predictable — অর্থাৎ \(\mathcal F_{n-1}\)-পরিমাপযোগ্য, "দান খেলার আগেই" ঠিক করা (আগের সব ফল দেখে যা খুশি কৌশল নাও, কিন্তু এ-দানের ফল \(\xi_n\) আগে জানতে পারবে না — সেটাই হলে জুয়া নয়, জাদু)। দাবি: predictable বাজিতেও ন্যায্য খেলা হারানো যায় না — \((H\cdot S)_n\) আবার martingale।
ধাপ ১ — এক-ধাপের লাভ গড়ে শূন্য। \(\Delta_n:=(H\cdot S)_n-(H\cdot S)_{n-1}=H_n\xi_n\)। এর শর্তাধীন প্রত্যাশা নিই \(\mathcal F_{n-1}\)-এ। যেহেতু \(H_n\) হলো \(\mathcal F_{n-1}\)-পরিমাপযোগ্য (predictable!), pull-out-এ তা বেরিয়ে আসে: $$ \mathbb E[H_n\xi_n\mid\mathcal F_{n-1}]=H_n\,\mathbb E[\xi_n\mid\mathcal F_{n-1}]=H_n\cdot 0=0, $$ কারণ \(\xi_n\) হলো \(\mathcal F_{n-1}\)-এর স্বাধীন আর \(\mathbb E[\xi_n]=0\) (independence rule)। এটাই গোটা যুক্তির হৃদয়: predictability বলেই \(H_n\)-কে ধ্রুবকের মতো বার করা গেল; নইলে (যদি \(H_n\) আজকের ফল দেখে ঠিক হতো) \(\mathbb E[H_n\xi_n]\) ধনাত্মক বানানো যেত — কিন্তু সেটা নিয়মভঙ্গ।
ধাপ ২ — তাই martingale। \((H\cdot S)_{n-1}\) হলো \(\mathcal F_{n-1}\)-পরিমাপযোগ্য, তাই $$ \mathbb E[(H\cdot S)n\mid\mathcal F]=(H\cdot S){n-1}+\underbrace{\mathbb E[H_n\xi_n\mid\mathcal F}]{=\,0}=(H\cdot S). $$ $$ \boxed{\ \mathbb E[(H\cdot S)n\mid\mathcal F $$ }]=(H\cdot S)_{n-1},\qquad \mathbb E[(H\cdot S)_n]=0.\ martingale-এর predictable রূপান্তর আবার martingale (ধরে নিচ্ছি \(H_n\) পরিবদ্ধ, যাতে integrability ঠিক থাকে)। গড় থাকে শূন্য — অর্থাৎ গড়ে কোনো বাজি-কৌশল ন্যায্য খেলায় লাভ আনতে পারে না। এটিই "no system beats a fair game"-এর কঠোর বিবৃতি।
ধাপ ৩ — কংক্রিট কৌশল: "যা জিতি তার দ্বিগুণ বাজি"। একটা সক্রিয় কৌশল নিই: শুরুতে \(H_1=1\); এরপর আগের দানে জিতলে বাজি দ্বিগুণ (\(H_n=2H_{n-1}\)), হারলে \(1\)-এ রিসেট। লক্ষ করো \(H_n\) ঠিক করতে কেবল \(\xi_1,\dots,\xi_{n-1}\) লাগে — তাই predictable ✓। যত চটকদারই হোক, ধাপ ১–২ অনুযায়ী \(\mathbb E[(H\cdot S)_n]=0\) থাকতেই হবে। সিমুলেশন এটাই দেখাবে (নিচে)।
ধাপ ৪ — একটা সতর্কবাণী (martingale doubling)। "ন্যায্য খেলা হারানো যায় না" কথাটা নির্দিষ্ট সময় \(n\)-এ সত্য। কুখ্যাত doubling strategy (হারলে বাজি দ্বিগুণ করে যাও যতক্ষণ না একবার জিতি) থামার সময় \(\tau\)-তে \(+1\) নিশ্চিত করে — কিন্তু সেটা অসীম মূলধন ও অসীম অপেক্ষা চায়, আর ঠিক optional stopping-এর শর্ত ভাঙে বলেই \(\mathbb E[(H\cdot S)_\tau]\ne0\) সম্ভব হয়। এই ফাটলটাই উদাহরণ ৫-এর বিষয়; এখানে মনে রাখি — পরিবদ্ধ কৌশলে, স্থির সময়ে, ন্যায্য খেলা ন্যায্যই থাকে।
একটি কোডে দেখা। উপরের "জিতলে দ্বিগুণ" কৌশলে \(\mathbb E[(H\cdot S)_{30}]\approx0\) যাচাই করি:
import numpy as np
rng = np.random.default_rng(20260619)
paths, N = 300_000, 30
xi = rng.choice([-1, 1], size=(paths, N))
H = np.ones(paths) # H_1 = 1
wealth = np.zeros(paths)
prev = np.zeros(paths, dtype=int) # আগের দানের ফল (k=0 ধাপের আগে 0 ধরা)
for k in range(N):
if k > 0:
H = np.where(prev > 0, 2*H, 1.0) # জিতলে দ্বিগুণ, হারলে 1 (predictable)
wealth += H * xi[:, k] # H_k * ξ_k
prev = xi[:, k]
print("E[(H·S)_30] ≈", round(wealth.mean(), 4)) # ≈ 0
| পরিমাণ | তত্ত্ব | সিমুলেশন (MC) |
|---|---|---|
| \(\mathbb E[(H\cdot S)_{30}]\) ("জিতলে দ্বিগুণ") | \(0\) | \(\approx0\) |
কৌশল যত চালাকই হোক, স্থির সময়ে প্রত্যাশিত লাভ শূন্যেই ঠেকে।
কী শিখলাম। predictable বাজি-কৌশল \(H_n\) (\(\mathcal F_{n-1}\)-পরিমাপযোগ্য) ন্যায্য খেলায় লাগালে জমা-লাভ \((H\cdot S)_n=\sum H_k\xi_k\) আবার martingale, \(\mathbb E[(H\cdot S)_n]=0\) — কোনো কৌশল ন্যায্য খেলা হারাতে পারে না। মূল চাবি: predictability বলেই pull-out-এ \(\mathbb E[H_n\xi_n\mid\mathcal F_{n-1}]=H_n\mathbb E[\xi_n\mid\mathcal F_{n-1}]=0\)। স্বজ্ঞা: আজকের ফল আগে জানতে না পারলে বাজি যত খুশি বদলাও — গড়ে শূন্যই থাকবে; "doubling"-জাতীয় ব্যতিক্রম কাজ করে কেবল অসীম মূলধন/সময় ধার করে, যা পরের উদাহরণের optional-stopping-ভঙ্গের সঙ্গে এক সুতোয় বাঁধা। এই martingale transform-ই হলো নিরবচ্ছিন্ন (continuous-time) স্টোক্যাস্টিক ইন্টিগ্রেশনের বিচ্ছিন্ন পূর্বসূরি।
উদাহরণ ৪ — optional stopping ও gambler's ruin (★★)¶
সেটআপ। জুয়াড়ির সর্বনাশ (gambler's ruin) — চিরায়ত সমস্যা। নিরপেক্ষ হাঁটা \(S_n\) শুরু \(0\) থেকে, দুটো বাধা (barrier): নিচে \(-a\) আর উপরে \(+b\), এখানে \(a=8,\ b=4\)। stopping time $$ \tau=\inf{n\ge0:\ S_n=-a\ \text{বা}\ S_n=+b} $$ — যে মুহূর্তে হাঁটা কোনো এক বাধা ছোঁয়। (এটি বৈধ stopping time, কারণ \(\{\tau\le n\}\) নির্ধারণে কেবল \(S_0,\dots,S_n\) লাগে।) দুটো প্রশ্ন: উপরের বাধা \(+b\) আগে ছোঁয়ার সম্ভাবনা কত, আর গড়ে কত ধাপে খেলা শেষ হয়?
ধাপ ১ — optional stopping theorem-এর শর্ত যাচাই। OST বলে: যথাযথ শর্তে martingale-এর গড় থামার সময়েও অপরিবর্তিত, \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\)। শর্ত তিনটির যেকোনো একটা যথেষ্ট; এখানে সবচেয়ে পরিষ্কারটা ধরি — \(\mathbb E[\tau]<\infty\) এবং বৃদ্ধি পরিবদ্ধ (\(\lvert S_n-S_{n-1}\rvert=1\le1\))। দুই বাধার মাঝে আটকে থাকায় হাঁটা নিশ্চিতভাবে শেষ হয় আর গড় সময় সসীম (ধাপ ৩-এ \(\mathbb E[\tau]=32\) দেখব), তাই OST প্রয়োগযোগ্য ✓। (এই শর্ত-যাচাইটাই আসল — উদাহরণ ৫-এ দেখব শর্ত ভাঙলে কী হয়।)
ধাপ ২ — এক সমীকরণে সম্ভাবনা। থামার সময় \(S_\tau\) ঠিক দুটো মান নেয়: \(+b\) (সম্ভাবনা \(p:=\mathbb P(\text{hit }+b)\)) অথবা \(-a\) (সম্ভাবনা \(1-p\))। OST থেকে \(\mathbb E[S_\tau]=0\), তাই $$ 0=\mathbb E[S_\tau]=(+b)\,p+(-a)\,(1-p)=b\,p-a(1-p). $$ \(p\) বার করি: $$ b\,p-a+a\,p=0\ \Rightarrow\ p(a+b)=a\ \Rightarrow\ \boxed{\ p=\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac{8}{12}=\frac23\approx0.6667.\ } $$ লক্ষণীয় কাব্য: উপরের বাধা কাছে (\(b=4\) ছোট) বলেই তা ছোঁয়ার সম্ভাবনা বেশি (\(\tfrac23\)) — দূরত্ব \(a\) যত বড়, ও-দিকে যাওয়া তত কঠিন, তাই বিপরীত \(\tfrac{a}{a+b}\)। আর নিচের সর্বনাশের সম্ভাবনা \(1-p=\tfrac{b}{a+b}=\tfrac4{12}=\tfrac13\)।
ধাপ ৩ — গড় স্থিতিকাল (দ্বিতীয় martingale দিয়ে)। \(\mathbb E[\tau]\) পেতে \(S_n^2-n\) martingale খাটাই (উদাহরণ ৬-এ প্রমাণ; \(\mathbb E[S_n^2-n]=0\))। OST আবার লাগিয়ে \(\mathbb E[S_\tau^2-\tau]=0\), অর্থাৎ \(\mathbb E[\tau]=\mathbb E[S_\tau^2]\)। কিন্তু \(S_\tau\in\{+b,-a\}\), তাই $$ \mathbb E[S_\tau^2]=b^2\,p+a^2(1-p)=b^2\cdot\tfrac{a}{a+b}+a^2\cdot\tfrac{b}{a+b}=\frac{ab(b+a)}{a+b}=ab. $$ $$ \boxed{\ \mathbb E[\tau]=ab=8\times4=32.\ } $$ সুন্দর সমমিতি: গড় স্থিতিকাল ঠিক দুই দূরত্বের গুণফল \(ab\) — কাছের বাধা যত দূরে সরে, খেলা তত দীর্ঘ।
ধাপ ৪ — সিমুলেশনে যাচাই। \(-8/+4\) বাধায় বহু হাঁটা চালাই, তিন রাশি মাপি:
import numpy as np
rng = np.random.default_rng(20260619)
a, b, trials = 8, 4, 200_000
hitB = np.zeros(trials); Stau = np.zeros(trials); tau = np.zeros(trials)
for t in range(trials):
s, n = 0, 0
while -a < s < b:
s += rng.choice([-1, 1]); n += 1
hitB[t] = (s == b); Stau[t] = s; tau[t] = n
print("P(hit +b) ≈", round(hitB.mean(), 4)) # ≈ 0.667
print("E[S_tau] ≈", round(Stau.mean(), 4)) # ≈ 0
print("E[tau] ≈", round(tau.mean(), 2)) # ≈ 32
| পরিমাণ | তত্ত্ব | সিমুলেশন (MC) |
|---|---|---|
| \(\mathbb P(\text{hit }+b)\) | \(\tfrac{a}{a+b}=\tfrac23\approx0.6667\) | \(\approx0.67\) |
| \(\mathbb E[S_\tau]\) | \(0\) | \(\approx0\) |
| \(\mathbb E[\tau]\) | \(ab=32\) | \(\approx32\) |
তিনটেই তত্ত্বের গায়ে — \(+b\)-ছোঁয়া \(\approx0.67\), থামার-গড় \(\approx0\) (OST নিশ্চিত), স্থিতিকাল \(\approx32\)।
কী শিখলাম। OST-এর শর্ত মিটলে (\(\mathbb E[\tau]<\infty\), পরিবদ্ধ বৃদ্ধি) \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\), আর দুই-মান \(S_\tau\in\{+b,-a\}\) ভেঙে gambler's ruin এক লাইনে সমাধান হয়: \(\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac23\), আর \(S_n^2-n\) martingale দিয়ে \(\mathbb E[\tau]=ab=32\)। স্বজ্ঞা: ন্যায্য খেলায় থামার সময়েও গড় শূন্য, তাই কাছের বাধা বেশি-সম্ভাব্য কিন্তু খেলা শেষ হতে দুই দূরত্বের গুণফল-সময় লাগে। এটিই OST-এর সবচেয়ে নির্ভরযোগ্য প্রয়োগ — শর্ত যাচাই করে, তারপর "থামার সময়ে গড় টানা যায়" বলে এক সমীকরণে উত্তর; পরের উদাহরণ দেখাবে শর্ত যাচাই বাদ দিলে এই হাতিয়ার কীভাবে বিশ্বাসঘাতকতা করে।
উদাহরণ ৫ — কখন optional stopping ভাঙে (★★)¶
সেটআপ। এবার বিপদ। একই নিরপেক্ষ হাঁটা \(S_n\) (\(S_0=0\)), কিন্তু এবার একটিমাত্র বাধা — শুধু উপরে, \(+1\): $$ \tau=\inf{n\ge0:\ S_n=1}\qquad(\text{প্রথম-উত্তরণ }+1\text{-তে}). $$ পরিচিত সত্য (recurrence of symmetric walk, 7.6/7.9): এক-মাত্রিক নিরপেক্ষ হাঁটা পুনরাবৃত্ত (recurrent), তাই \(+1\)-তে নিশ্চিতভাবেই একদিন পৌঁছায় — \(\mathbb P(\tau<\infty)=1\)। প্রলোভন: "OST লাগাই, \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\)"। দেখি কী হয়।
ধাপ ১ — বিরোধ। \(\tau<\infty\) সর্বত্র (a.s.), আর থামার সংজ্ঞাতেই \(S_\tau=1\) সবসময় — যেহেতু থামিই কেবল \(+1\) ছুঁলে। তাই $$ \mathbb E[S_\tau]=\mathbb E[1]=1\ \neq\ 0=S_0. $$ $$ \boxed{\ \mathbb E[S_\tau]=1\neq\mathbb E[S_0]=0\ \Rightarrow\ \text{OST এখানে খাটে না।}\ } $$ "ন্যায্য খেলা" থেকে নিশ্চিত \(+1\) লাভ আদায় হলো — অথচ random walk তো martingale! অসংগতিটা কোথায়?
ধাপ ২ — কোন শর্ত ভাঙল। OST-এর কোনো অনুমানই এখানে ধরে না: - \(\mathbb E[\tau]<\infty\)? না — নিরপেক্ষ হাঁটার \(+1\)-উত্তরণ-সময়ের \(\mathbb E[\tau]=\infty\) (নিশ্চিত পৌঁছায় বটে, কিন্তু গড়ে অসীম দীর্ঘ — "ভারী লেজ", \(\mathbb P(\tau=n)\sim n^{-3/2}\), যার গড় অপসারী)। এই একটাই ভাঙন যথেষ্ট। - থামা পর্যন্ত পরিবদ্ধতা? না — \(+1\) ছোঁয়ার আগে হাঁটা যত খুশি নিচে নামতে পারে, \(\inf_n S_{n\wedge\tau}=-\infty\), তাই \((S_{n\wedge\tau})\) পরিবদ্ধ নয় এবং uniformly integrable-ও নয়। - পরিবদ্ধ-সময়ে থামা? না — \(\tau\)-এর কোনো ঊর্ধ্বসীমা নেই।
তিন দরজাই বন্ধ, তাই \(\mathbb E[S_\tau]=\mathbb E[S_0]\) নিশ্চিত করার কোনো ভিত্তি নেই — আর বাস্তবে তা মেলেও না।
ধাপ ৩ — কোথায় "ভর পালায়"। স্বজ্ঞা: থামা-পর্যন্ত হাঁটা \(S_{n\wedge\tau}\) যেকোনো স্থির \(n\)-তে গড়-শূন্য (martingale, \(\mathbb E[S_{n\wedge\tau}]=0\))। কিন্তু \(n\to\infty\)-তে এই ভারসাম্য একটা "\(+1\)-এ থেমে যাওয়া বড় ভর" আর "এখনো-অনেক-নিচে ঝুলে থাকা ছোট কিন্তু গভীর ভর"-এর মধ্যে টিকে থাকে। সীমায় নিচের লেজটা মুছে যায় না বরং অসীম-গভীরে সরে যায়, ফলে সীমা-আদানপ্রদান \(\lim\mathbb E[S_{n\wedge\tau}]\ne\mathbb E[\lim S_{n\wedge\tau}]=\mathbb E[S_\tau]\) অবৈধ — ঠিক DCT-এর dominating function না-থাকার ব্যর্থতা। OST আসলে এই সীমা-আদানপ্রদানেরই একটা মোড়ক, তাই শর্তগুলো (UI / পরিবদ্ধতা / \(\mathbb E[\tau]<\infty\)) সেখানেই পাহারা দেয়।
ধাপ ৪ — সিমুলেশনের সততা। কম্পিউটারে \(\mathbb E[\tau]=\infty\) ধরা যায় না, কিন্তু লক্ষণ দেখা যায়: সময়-সীমা \(T\) বাড়ালে থামার গড় \(S_{T\wedge\tau}\) ধীরে-ধীরে \(0\)-এর দিকে ঝোঁকে (যত পথ এখনো নিচে ঝুলে আছে, তাদের গভীর ঋণ গড়কে টেনে নামায়), অথচ যেগুলো ইতিমধ্যে থেমেছে তারা \(+1\)-এ। প্লট করলে \(T\)-এর সঙ্গে গড় ক্রমে নামে, \(1\)-এ থিতু হয় না — "\(\mathbb E[\tau]=\infty\)"-এর ছাপ:
import numpy as np
rng = np.random.default_rng(20260619)
paths = 100_000
for T in (100, 1_000, 10_000):
s = np.zeros(paths); stopped = np.zeros(paths, bool)
for _ in range(T):
live = ~stopped
s[live] += rng.choice([-1, 1], size=live.sum())
stopped |= (s >= 1)
frac = stopped.mean() # T-এর মধ্যে থামার ভগ্নাংশ
print(f"T={T:>6}: P(τ≤T)≈{frac:.3f}, E[S_(T∧τ)]≈{s.mean():+.3f}")
# T বাড়লে P(τ≤T) 1-এর দিকে ধীরে ওঠে, কিন্তু E[S_(T∧τ)] 0-এর কাছেই থাকে — 1-এ নয়
| সময়-সীমা \(T\) | \(\mathbb P(\tau\le T)\) | \(\mathbb E[S_{T\wedge\tau}]\) (martingale ⇒ \(\approx0\)) |
|---|---|---|
| \(100\) | \(<1\) | \(\approx0\) |
| \(1{,}000\) | \(\uparrow\) ১-এর দিকে | \(\approx0\) |
| \(10{,}000\) | আরও কাছে | \(\approx0\) |
স্থির \(T\)-তে \(\mathbb E[S_{T\wedge\tau}]\approx0\) (martingale অটুট); শুধু \(T\to\infty\)-এর সীমায় \(S_\tau\equiv1\) হয়ে \(\mathbb E\) লাফিয়ে \(1\) হয় — সেই অবৈধ সীমা-আদানপ্রদানই OST-ভঙ্গ।
কী শিখলাম। OST-এর শর্ত নিছক সাজসজ্জা নয় — শর্ত ভাঙলে উপপাদ্যও ভাঙে। \(+1\)-প্রথম-উত্তরণে \(\mathbb P(\tau<\infty)=1\) ও \(S_\tau\equiv1\), তাই \(\mathbb E[S_\tau]=1\neq0=S_0\) — কারণ \(\mathbb E[\tau]=\infty\) এবং থামা-পর্যন্ত হাঁটা পরিবদ্ধ/UI নয়, ফলে \(\lim\mathbb E[S_{n\wedge\tau}]\ne\mathbb E[S_\tau]\) (DCT-ব্যর্থতার মুখোশ)। স্বজ্ঞা: নিশ্চিত-পৌঁছানো \(\ne\) দ্রুত-পৌঁছানো; "ন্যায্য খেলা থেকে নিশ্চিত লাভ" কেবল অসীম ধৈর্য ও অসীম ঋণ-ক্ষমতা ধার করেই সম্ভব (উদাহরণ ৩-এর doubling-এর যমজ)। নৈতিকতা: martingale-যুক্তিতে \(\mathbb E[X_\tau]=\mathbb E[X_0]\) লেখার আগে সবসময় কোনো-একটা OST-শর্ত আগে যাচাই করতে হবে — নইলে উত্তর ভুল হতে বাধ্য।
উদাহরণ ৬ — Doob decomposition \(S_n^2-n\) (★★)¶
সেটআপ। martingale \(S_n\) নিজে গড়-শূন্য, কিন্তু তার ছড়ানো বাড়ে — আর সেই বৃদ্ধিটাকে ধরা যায় \(S_n^2\) দেখে। প্রশ্ন: \(S_n^2\) কি martingale? উত্তর — না, submartingale; আর তার থেকে ঠিক কতটা "প্রবণতা" বাদ দিলে আবার martingale মেলে? সেটিই Doob decomposition-এর প্রশ্ন, আর উত্তরটা চমৎকার সরল: \(A_n=n\)।
ধাপ ১ — \(S_n^2\) একটা submartingale। \(S_{n+1}=S_n+\xi_{n+1}\), তাই \(S_{n+1}^2=S_n^2+2S_n\xi_{n+1}+\xi_{n+1}^2\)। শর্তাধীন প্রত্যাশা নিই \(\mathcal F_n\)-এ, প্রতি পদ আলাদা করে: $$ \mathbb E[S_{n+1}^2\mid\mathcal F_n]=\underbrace{S_n^2}{\text{pull-out}}+2S_n\underbrace{\mathbb E[\xi}\mid\mathcal F_n]{=\,0}+\underbrace{\mathbb E[\xi}^2\mid\mathcal F_n]{=\,1}. $$ এখানে \(S_n^2\) ও \(2S_n\) হলো \(\mathcal F_n\)-পরিমাপযোগ্য (pull-out), \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0\) (স্বাধীনতা), আর \(\xi_{n+1}^2=1\) সবসময় (কারণ \((\pm1)^2=1\)) বলে তার শর্তাধীন প্রত্যাশাও \(1\)। মিলিয়ে: $$ \boxed{\ \mathbb E[S $$ }^2\mid\mathcal F_n]=S_n^2+1\ \ge\ S_n^2.\ \(\ge\) চিহ্নই বলে \(S_n^2\) submartingale — প্রতি ধাপে গড়ে ঠিক \(+1\) করে উপরে টানে। (স্বজ্ঞা: হাঁটা যেদিকেই যাক, \(S^2\) গড়ে বাড়ে, কারণ ছড়ানো জমতে থাকে।)
ধাপ ২ — ক্ষতিপূরক আলাদা করা। যেহেতু বৃদ্ধি ধাপ-প্রতি ঠিক \(+1\), "অতিরিক্ত প্রবণতা" সরাতে \(n\) বিয়োগ করি। ধরা যাক $$ M_n:=S_n^2-n. $$ শর্তাধীন প্রত্যাশা: $$ \mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[S_{n+1}^2\mid\mathcal F_n]-(n+1)=(S_n^2+1)-(n+1)=S_n^2-n=M_n. $$ $$ \boxed{\ \mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\ \Rightarrow\ M_n=S_n^2-n\ \text{একটা martingale}.\ } $$ আর \(\mathbb E[M_n]=\mathbb E[M_0]=0\), অর্থাৎ \(\mathbb E[S_n^2]=n\) — যা ঠিক \(\operatorname{Var}(S_n)=n\) (যেহেতু \(\mathbb E[S_n]=0\))। এটাই Doob decomposition: submartingale \(S_n^2 = \underbrace{M_n}_{\text{martingale}} + \underbrace{A_n}_{\text{compensator}}\), যেখানে \(A_n=n\) — একটা predictable, বর্ধমান প্রক্রিয়া (\(A_0=0\), \(A_n-A_{n-1}=1\ge0\), আর \(A_n\) ধ্রুব বলে তুচ্ছভাবে \(\mathcal F_{n-1}\)-পরিমাপযোগ্য)।
ধাপ ৩ — \(A_n=n\)-এর অর্থ: quadratic variation। ক্ষতিপূরক \(A_n\) মাপে "এ-পর্যন্ত কতটা তারতম্য জমেছে"। এখানে প্রতি ধাপের শর্তাধীন ভেদ \(\mathbb E[\xi_{n+1}^2\mid\mathcal F_n]=1\), তাই \(n\) ধাপে মোট \(n\) — একে বলে quadratic variation / predictable variation (বর্গ-প্রকরণ), প্রতীকে \(\langle S\rangle_n=n\)। সাধারণ ছবি: যেকোনো \(L^2\)-martingale \(X_n\)-এর জন্য \(X_n^2-\langle X\rangle_n\) martingale, যেখানে \(\langle X\rangle_n=\sum_{k\le n}\mathbb E[(X_k-X_{k-1})^2\mid\mathcal F_{k-1}]\) — জমা-হওয়া শর্তাধীন ভেদ। random walk-এ প্রতি ধাপের ভেদ \(1\) বলে তা নিছক \(n\)। এই \(\langle S\rangle_n\)-ই 7.9-এর \(L^2\)-পরিবদ্ধ martingale convergence-এর চাবি (\(\sup_n\mathbb E[X_n^2]<\infty\iff\mathbb E[\langle X\rangle_\infty]<\infty\)) এবং continuous-time-এ Itô-ক্যালকুলাসের কেন্দ্রীয় বস্তু।
একটি কোডে দেখা। \(\mathbb E[S_n^2-n]\approx0\) (অর্থাৎ \(\mathbb E[S_n^2]\approx n\)) সব \(n\)-তে যাচাই করি:
import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 400_000, 40
xi = rng.choice([-1, 1], size=(paths, steps))
S = xi.cumsum(axis=1)
n = np.arange(1, steps+1)
ES2 = (S**2).mean(axis=0) # E[S_n^2] প্রতি n-এ
print("E[S_5^2] =", round(ES2[4], 3), " (তত্ত্ব 5 )") # ≈ 5
print("E[S_40^2] =", round(ES2[39], 3), " (তত্ত্ব 40)") # ≈ 40
print("max |E[S_n^2 - n]| =", round(np.abs(ES2 - n).max(), 3)) # ≈ 0
| পরিমাণ | তত্ত্ব | সিমুলেশন (MC) |
|---|---|---|
| \(\mathbb E[S_5^2]\) | \(5\) | \(\approx5\) |
| \(\mathbb E[S_{40}^2]\) | \(40\) | \(\approx40\) |
| \(\mathbb E[M_n]=\mathbb E[S_n^2-n]\) | \(0\) (সব \(n\)) | \(\approx0\) |
প্রতি \(n\)-তে \(\mathbb E[S_n^2]\approx n\), তাই \(\mathbb E[S_n^2-n]\approx0\) — \(M_n=S_n^2-n\) সত্যিই গড়-শূন্য martingale।
কী শিখলাম। \(S_n^2\) একটা submartingale (\(\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2\), কারণ \(\xi^2=1\) সবসময়), আর \(M_n=S_n^2-n\) একটা martingale — এটিই Doob decomposition: \(S_n^2=M_n+A_n\) যেখানে predictable বর্ধমান ক্ষতিপূরক \(A_n=n\)। ফলে \(\mathbb E[S_n^2]=n=\operatorname{Var}(S_n)\)। স্বজ্ঞা: ক্ষতিপূরক \(A_n=\langle S\rangle_n\) হলো "এ-পর্যন্ত জমা-হওয়া তারতম্য" (quadratic variation) — হাঁটার গড় শূন্য থাকলেও তার ছড়ানো ঠিক রৈখিক হারে জমে, আর সেই জমা-হওয়া অংশটাই বাদ দিলে আবার ন্যায্য martingale ফেরে। উদাহরণ ৪-এ এই \(M_n\)-ই \(\mathbb E[\tau]=ab\) বার করতে কাজে লাগল, আর 7.9-এ \(\langle S\rangle_n\) হবে \(L^2\)-martingale convergence ও স্টোক্যাস্টিক ইন্টিগ্রেশনের ভিত্তিপ্রস্তর।
৪ · প্রমাণ ও উৎপাদন¶
এই অংশে §১–২-এ বিবৃত martingale (মার্টিঙ্গেল — "ন্যায্য খেলা"র random process) তত্ত্বের কেন্দ্রীয় ফলগুলো ধাপে ধাপে উৎপাদন (derive) করা হয় — সবগুলোই 7.7-এর শর্তাধীন প্রত্যাশা (conditional expectation) \(\mathbb E[\cdot\mid\mathcal F_n]\)-এর তিনটি কর্মঘোড়ার উপর দাঁড়ায়: tower (পুনরাবৃত্ত প্রত্যাশা, \(\mathcal H\subseteq\mathcal G\Rightarrow\mathbb E[\mathbb E[X\mid\mathcal G]\mid\mathcal H]=\mathbb E[X\mid\mathcal H]\)), pull-out (জানা-জিনিস বাইরে আনা, \(Y\) \(\mathcal G\)-measurable হলে \(\mathbb E[YX\mid\mathcal G]=Y\,\mathbb E[X\mid\mathcal G]\)), এবং linearity (রৈখিকতা) — তিনটিই 7.7-§৪-এ প্রমাণিত, এখানে নাম ধরে অবাধে ব্যবহৃত। যুক্তি-শৃঙ্খল একমুখী: প্রমাণ ৬ (constant mean + centered-sum) ভিত্তি; প্রমাণ ১ (martingale transform) থেকে প্রমাণ ২ (stopped process) সরাসরি বেরোয়; প্রমাণ ২ থেকে প্রমাণ ৩ (optional stopping theorem) তিনটি অনুমান-গুচ্ছে; প্রমাণ ৩-কে কাজে লাগিয়ে প্রমাণ ৪ (gambler's ruin); আর প্রমাণ ৫ (Doob decomposition) submartingale-কে martingale + predictable অংশে ভাঙে, যা \(S_n^2-n\)-কে martingale প্রমাণ করে প্রমাণ ৪-এর শেষ ধাপ পূরণ করে। প্রতিটি প্রমাণের শিরোনামে কঠিনতা-চিহ্ন (difficulty tag):
- ★ — মৌলিক, প্রথম পাঠেই বোঝা উচিত।
- ★★ — মাঝারি, একটু কৌশল লাগে।
- ★★★ — গভীর, প্রথম পাঠে কিছু অংশ এড়িয়ে যাওয়া যায় (যথাস্থানে চিহ্নিত)।
স্মরণ — সংজ্ঞা ও সংকেত (§১–২ থেকে)। গোটা অংশে \((\Omega,\mathcal F,\mathbb P)\) একটি probability space, আর \((\mathcal F_n)_{n\ge 0}\) একটি filtration (পরিস্রাবণ) — অর্থাৎ ক্রমবর্ধমান sub-σ-algebra-শৃঙ্খল \(\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\subseteq\mathcal F\), যেখানে \(\mathcal F_n\) মানে "\(n\) সময় পর্যন্ত জানা তথ্য"। একটি process \((X_n)_{n\ge 0}\) adapted (অভিযোজিত) যদি প্রতিটি \(X_n\) হয় \(\mathcal F_n\)-measurable, আর সব \(X_n\in L^1\) (অর্থাৎ \(\mathbb E\lvert X_n\rvert<\infty\))। এমন adapted, integrable \((X_n)\) একটি martingale যদি
submartingale (অধো-মার্টিঙ্গেল) যদি \(\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n\) a.s., এবং supermartingale (ঊর্ধ্ব-মার্টিঙ্গেল) যদি \(\le\)। (এখানে \(\mid\) সবসময় conditioning — শর্তাধীনতা — কখনোই \(\lvert\cdot\rvert\) নয়।) একটি random variable \(\tau:\Omega\to\{0,1,2,\dots\}\cup\{\infty\}\) একটি stopping time (থামার সময়) যদি প্রতিটি \(n\)-এর জন্য \(\{\tau\le n\}\in\mathcal F_n\) — অর্থাৎ "\(n\) সময়ের মধ্যে থেমেছি কি না" তা \(n\) পর্যন্ত-জানা তথ্যেই নির্ধারিত (ভবিষ্যৎ দেখে থামা যায় না)। \(n\wedge\tau:=\min(n,\tau)\), আর predictable (পূর্বানুমেয়) process \((H_n)_{n\ge 1}\) মানে প্রতিটি \(H_n\) হয় \(\mathcal F_{n-1}\)-measurable — অর্থাৎ "\(n\)-তম বাজি \(H_n\) আগের ধাপের তথ্যেই ঠিক করা" (ভবিষ্যৎ না দেখে)।
আগে একবার — দুটি ছোট অথচ বারবার-লাগা মৌলিক fact:
- (increment-form / বৃদ্ধি-রূপ) \((X_n)\) martingale হওয়া ⟺ প্রতিটি \(n\)-এ \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) a.s. (martingale increment বা martingale difference \(D_{n+1}:=X_{n+1}-X_n\)-এর শর্তাধীন গড় শূন্য) — কারণ \(X_n\) নিজে \(\mathcal F_n\)-measurable, তাই linearity-তে \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=\mathbb E[X_{n+1}\mid\mathcal F_n]-X_n\) (pull-out/ধ্রুবক-নিয়মে \(\mathbb E[X_n\mid\mathcal F_n]=X_n\), যেহেতু \(X_n\) ইতিমধ্যে \(\mathcal F_n\)-জানা)। এই \(=0\)-রূপই নিচে প্রায় সর্বত্র লাগবে।
- (stopping time-এর সমতুল্য রূপ) \(\{\tau\le n\}\in\mathcal F_n\) সব \(n\)-তে ⟺ \(\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}\) সব \(n\ge 1\)-তে — কারণ \(\{\tau\le n-1\}\in\mathcal F_{n-1}\) (সংজ্ঞা) এবং σ-algebra পরিপূরকে বদ্ধ। তাই indicator \(\mathbf 1_{\{\tau\ge n\}}\) হলো \(\mathcal F_{n-1}\)-measurable — এই একটিমাত্র পর্যবেক্ষণই প্রমাণ ২-কে প্রমাণ ১-এর বিশেষ রূপ বানায়।
প্রমাণ ৬ — martingale property ⇒ ধ্রুব গড়, এবং একটি centered-sum martingale (★)¶
প্রথমে সবচেয়ে মৌলিক দুটি ফল রাখি — একটি গোটা অংশের sanity-check, অন্যটি martingale-এর প্রধান উদাহরণ-কারখানা।
দাবি (ক) — ধ্রুব গড় (constant mean)। যেকোনো martingale \((X_n)\)-এর জন্য \(\mathbb E[X_n]=\mathbb E[X_0]\) সব \(n\ge 0\)-তে।
ধাপ ১ — tower নামিয়ে শর্ত মুছে ফেলা। martingale-সংজ্ঞা \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s.। দুই পাশে নিঃশর্ত প্রত্যাশা নিই; বাঁ পাশে tower-এর বিশেষ রূপ (7.7-প্রমাণ ২, \(\mathcal H=\{\varnothing,\Omega\}\) তুচ্ছ) — \(\mathbb E\bigl[\mathbb E[X_{n+1}\mid\mathcal F_n]\bigr]=\mathbb E[X_{n+1}]\) (law of total expectation), আর ডান পাশে \(\mathbb E[X_n]\):
ধাপ ২ — আরোহ (induction)। তাই \(\mathbb E[X_{n+1}]=\mathbb E[X_n]\) সব \(n\)-তে; \(n=0,1,2,\dots\)-এ পরপর প্রয়োগে \(\mathbb E[X_n]=\mathbb E[X_{n-1}]=\cdots=\mathbb E[X_0]\)। \(\blacksquare\) (দাবি ক)
(একইভাবে submartingale-এ "\(\ge\)" দিয়ে \(\mathbb E[X_n]\) অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান — কারণ tower শুধু সমতা নয়, অসমতাও সংরক্ষণ করে।)
দাবি (খ) — independent mean-0 যোগফল একটি martingale। ধরা যাক \(\xi_1,\xi_2,\dots\) পরস্পর-স্বাধীন (independent), integrable, ও \(\mathbb E[\xi_i]=0\) সব \(i\)-তে। সংজ্ঞা দিই partial sum \(S_0:=0\), \(S_n:=\sum_{i=1}^n\xi_i\), এবং filtration \(\mathcal F_n:=\sigma(\xi_1,\dots,\xi_n)\) (সঙ্গে \(\mathcal F_0:=\{\varnothing,\Omega\}\))। তবে \((S_n)\) হলো \((\mathcal F_n)\)-martingale।
ধাপ ১ — adapted ও integrable। প্রতিটি \(S_n=\xi_1+\cdots+\xi_n\) হলো \(\xi_1,\dots,\xi_n\)-এর measurable function, তাই \(\mathcal F_n\)-measurable — অর্থাৎ adapted। আর \(\mathbb E\lvert S_n\rvert\le\sum_{i=1}^n\mathbb E\lvert\xi_i\rvert<\infty\) (triangle inequality, প্রতিটি \(\xi_i\in L^1\)), তাই \(S_n\in L^1\)। ✓
ধাপ ২ — martingale-শর্ত। increment-রূপ যাচাই করি: \(S_{n+1}-S_n=\xi_{n+1}\), তাই
এখন \(\xi_{n+1}\) হলো \(\sigma(\xi_1,\dots,\xi_n)=\mathcal F_n\) থেকে স্বাধীন (কারণ \(\xi\)-গুলো পরস্পর-স্বাধীন, তাই \(\xi_{n+1}\perp\!\!\!\perp(\xi_1,\dots,\xi_n)\))। 7.7-এর independence rule (\(X\perp\!\!\!\perp\mathcal G\Rightarrow\mathbb E[X\mid\mathcal G]=\mathbb E[X]\)) দেয় \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]=0\)। সুতরাং \(\mathbb E[S_{n+1}-S_n\mid\mathcal F_n]=0\) a.s., অর্থাৎ \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n\) — martingale। \(\blacksquare\) (দাবি খ)
এটিই martingale-এর আদিতম উদাহরণ: mean-0 ধাপের যোগফল (যেমন symmetric random walk, যেখানে \(\xi_i=\pm1\) সমসম্ভাব্য)। নিচের প্রমাণ ২–৪ এই \(S_n\)-কেই বারবার কাজে লাগাবে।
এক বাক্যে: tower দুই পাশে নিঃশর্ত প্রত্যাশা দিয়ে \(\mathbb E[X_{n+1}]=\mathbb E[X_n]\) আনে, আরোহে \(\mathbb E[X_n]=\mathbb E[X_0]\); আর independent mean-0 \(\xi_i\)-এর যোগফল \(S_n\)-এ increment \(\xi_{n+1}\perp\!\!\!\perp\mathcal F_n\) বলে independence rule \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0\) দেয় — তাই \((S_n)\) martingale।
প্রমাণ ১ — martingale transform একটি martingale (★★)¶
এটিই অংশটির কারিগরি হৃৎপিণ্ড: "ন্যায্য খেলায় কোনো বাজি-কৌশল গড়ে লাভ আনতে পারে না"-র গাণিতিক রূপ।
দাবি (martingale transform / "discrete stochastic integral")। ধরা যাক \((X_n)_{n\ge 0}\) একটি \((\mathcal F_n)\)-martingale, এবং \((H_n)_{n\ge 1}\) একটি predictable (প্রতিটি \(H_n\) \(\mathcal F_{n-1}\)-measurable) ও bounded process (অর্থাৎ কোনো ধ্রুবক \(K\)-তে \(\lvert H_n\rvert\le K\) সর্বত্র)। সংজ্ঞা দিই martingale transform
তবে \((H\cdot X)_n\) একটি \((\mathcal F_n)\)-martingale, এবং \(\mathbb E[(H\cdot X)_n]=0\) সব \(n\)-তে।
ব্যাখ্যা — কেন এটাই "বাজি-কৌশল"। \(X_k-X_{k-1}\) হলো \(k\)-তম খেলায় প্রতি-একক-বাজিতে নিট লাভ (martingale বলে ন্যায্য, শর্তাধীন গড় শূন্য); \(H_k\) হলো খেলোয়াড়ের \(k\)-তম বাজির পরিমাণ, যা সে অবশ্যই খেলার আগে (\(\mathcal F_{k-1}\)-তথ্যে) ঠিক করে — তাই predictable। \((H\cdot X)_n\) হলো \(n\) খেলার পর মোট লাভ। দাবিটা বলছে: যত চতুর কৌশলই হোক, মোট লাভও একটি martingale — গড়ে শূন্য।
ধাপ ১ — adapted ও integrable। প্রতিটি পদ \(H_k(X_k-X_{k-1})\)-এ \(H_k\) হলো \(\mathcal F_{k-1}\subseteq\mathcal F_k\)-measurable আর \(X_k,X_{k-1}\) হলো \(\mathcal F_k\)-measurable (adapted, \(X_{k-1}\) হলো \(\mathcal F_{k-1}\subseteq\mathcal F_k\)-তেও), তাই গুণফল \(\mathcal F_k\)-measurable; \(k\le n\)-এর যোগফল \((H\cdot X)_n\) হলো \(\mathcal F_n\)-measurable — অর্থাৎ adapted। integrability: \(\lvert H_k\rvert\le K\) ও \(X_k,X_{k-1}\in L^1\) দিয়ে
তাই \((H\cdot X)_n\in L^1\)। ✓
ধাপ ২ — increment আলাদা করা। ধাপে-ধাপে বৃদ্ধি ঠিক একটি পদ:
ধাপ ৩ — শর্তাধীন গড় ও pull-out। \(\mathcal F_n\)-শর্তে এই increment-এর প্রত্যাশা নিই। লক্ষণীয় — \(H_{n+1}\) হলো \(\mathcal F_n\)-measurable (predictable-সংজ্ঞা: \(H_{n+1}\) \(\mathcal F_{(n+1)-1}=\mathcal F_n\)-measurable), তাই 7.7-এর pull-out (\(\mathcal F_n\)-measurable factor বাইরে আনা যায়; এখানে \(H_{n+1}\) bounded ও \(X_{n+1}-X_n\in L^1\), তাই pull-out-এর integrability-শর্ত মেটে):
এখন \((X_n)\) martingale বলে increment-রূপে (উপরের মৌলিক fact) \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) a.s.। সুতরাং
increment-রূপে এ-ই বলে \((H\cdot X)_n\) একটি martingale। ✓
ধাপ ৪ — ধ্রুব গড়। martingale বলে প্রমাণ ৬(ক)-তে \(\mathbb E[(H\cdot X)_n]=\mathbb E[(H\cdot X)_0]=\mathbb E[0]=0\) সব \(n\)-তে। অর্থাৎ কোনো (predictable, bounded) বাজি-কৌশল ন্যায্য খেলায় ধনাত্মক প্রত্যাশিত লাভ আনতে পারে না — "no system beats a fair game" (পদ্ধতি দিয়ে ন্যায্য খেলা জেতা যায় না)। \(\blacksquare\)
(টীকা: \((X_n)\) যদি submartingale হয় আর \(H_n\ge 0\) (predictable, bounded), তবে একই হিসাবে \(\mathbb E[\cdots\mid\mathcal F_n]=H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\ge 0\) — তাই অঋণাত্মক বাজিতে transform-ও submartingale; প্রমাণ ৫-এর Doob decomposition-এ এই দিকটা কাজে লাগবে।)
এক বাক্যে: increment \((H\cdot X)_{n+1}-(H\cdot X)_n=H_{n+1}(X_{n+1}-X_n)\)-এর \(\mathcal F_n\)-শর্তাধীন গড়ে predictable \(H_{n+1}\)-কে pull-out করলে অবশিষ্ট \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) (martingale) বলে পুরোটা শূন্য হয়, তাই martingale transform martingale এবং \(\mathbb E[(H\cdot X)_n]=0\) — কোনো বাজি-কৌশল ন্যায্য খেলাকে হারাতে পারে না।
প্রমাণ ২ — stopped process \(X_{n\wedge\tau}\) একটি martingale (★★)¶
দাবি (optional stopping-এর preliminary)। ধরা যাক \((X_n)\) একটি martingale এবং \(\tau\) একটি stopping time। সংজ্ঞা দিই stopped process (থামানো প্রক্রিয়া) \(X^{\tau}_n:=X_{n\wedge\tau}\) — অর্থাৎ "\(\tau\) আসার পর হিমায়িত": \(\tau\)-তে পৌঁছানোর পর প্রক্রিয়া আর নড়ে না। তবে \((X_{n\wedge\tau})_{n\ge 0}\) আবার একটি \((\mathcal F_n)\)-martingale, এবং বিশেষত \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে।
ধাপ ১ — stopped process-কে একটি transform হিসেবে লেখা। মূল কৌশল: \(X_{n\wedge\tau}\)-কে \(X_0\) + একটি martingale transform রূপে প্রকাশ করা। দাবি:
যাচাই (telescoping): ডান পাশের যোগফলে কেবল সেই \(k\)-গুলো টেকে যেখানে \(\tau\ge k\), অর্থাৎ \(k\le\tau\) — তাই \(k\) চলে \(1\) থেকে \(\min(n,\tau)=n\wedge\tau\) পর্যন্ত (যদি \(\tau\ge 1\)); সুতরাং যোগফল \(=\sum_{k=1}^{n\wedge\tau}(X_k-X_{k-1})=X_{n\wedge\tau}-X_0\) (টেলিস্কোপ, মাঝের সব পদ কাটাকাটি)। দুই দিকে \(X_0\) যোগ করলে অভেদ। (যদি \(\tau=0\) হয়, যোগফল খালি \(=0\) এবং \(X_{0\wedge\tau}=X_0\) — তবু মেলে।)
ধাপ ২ — gain-process \(H_k:=\mathbf 1_{\{\tau\ge k\}}\) predictable ও bounded। উপরের মৌলিক fact-এ দেখা গেছে \(\{\tau\ge k\}=\{\tau\le k-1\}^c\in\mathcal F_{k-1}\), তাই indicator \(H_k=\mathbf 1_{\{\tau\ge k\}}\) হলো \(\mathcal F_{k-1}\)-measurable — অর্থাৎ predictable। আর \(0\le H_k\le 1\) — অর্থাৎ bounded (\(K=1\))। (স্বজ্ঞা: "এখনও থামিনি কি না" — \(\{\tau\ge k\}\) — তা \(k-1\) পর্যন্ত-জানা তথ্যেই নির্ধারিত, কারণ থামা ভবিষ্যৎ দেখে হয় না; তাই \(k\)-তম ধাপে "বাজি ধরব কি ধরব না" আগেই ঠিক — ঠিক predictable বাজি-কৌশল।)
ধাপ ৩ — প্রমাণ ১ প্রয়োগ। ধাপ ১–২ মিলিয়ে \(X_{n\wedge\tau}-X_0=(H\cdot X)_n\) যেখানে \(H_k=\mathbf 1_{\{\tau\ge k\}}\) predictable ও bounded, আর \((X_n)\) martingale। তাই প্রমাণ ১ অনুযায়ী \((H\cdot X)_n\) একটি martingale। যেহেতু \(X_0\) হলো \(\mathcal F_0\)-measurable ধ্রুব-সংযোজন (constant shift — একটি adapted, integrable পদ যার increment শূন্য), \(X_{n\wedge\tau}=X_0+(H\cdot X)_n\)-ও martingale: increment-রূপে \(\mathbb E[X_{(n+1)\wedge\tau}-X_{n\wedge\tau}\mid\mathcal F_n]=\mathbb E[(H\cdot X)_{n+1}-(H\cdot X)_n\mid\mathcal F_n]=0\) a.s. (কারণ \(X_0\)-এর অবদান বিয়োগে কেটে যায়)। ✓
ধাপ ৪ — ধ্রুব গড়। martingale বলে প্রমাণ ৬(ক): \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_{0\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে। এটিই optional stopping-এর বীজ — থামানো প্রক্রিয়ার গড় সবসময় শুরুর গড়; বাকি কাজ হলো \(n\to\infty\) নিয়ে \(X_{n\wedge\tau}\to X_\tau\)-এ গড় টেনে নেওয়া (প্রমাণ ৩)। \(\blacksquare\)
(একই telescoping submartingale-এও খাটে: \(H_k=\mathbf 1_{\{\tau\ge k\}}\ge 0\) predictable, তাই প্রমাণ ১-এর টীকা-অনুযায়ী stopped submartingale আবার submartingale — \(\mathbb E[X_{n\wedge\tau}]\ge\mathbb E[X_0]\)।)
এক বাক্যে: \(X_{n\wedge\tau}=X_0+\sum_{k=1}^n\mathbf 1_{\{\tau\ge k\}}(X_k-X_{k-1})\) লিখে দেখা যায় gain \(H_k=\mathbf 1_{\{\tau\ge k\}}=1-\mathbf 1_{\{\tau\le k-1\}}\) হলো \(\mathcal F_{k-1}\)-measurable (predictable) ও bounded, তাই stopped process একটি martingale transform — প্রমাণ ১-এ martingale, এবং \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে।
প্রমাণ ৩ — Optional Stopping Theorem (★★★)¶
দাবি (Optional Stopping / Optional Sampling Theorem — ঐচ্ছিক-থামার উপপাদ্য)। ধরা যাক \((X_n)\) একটি martingale ও \(\tau\) একটি stopping time। প্রমাণ ২ থেকে আমরা জানি \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে। নিচের প্রতিটি অনুমান-গুচ্ছের অধীনে এই সমতা সীমায় টিকে থাকে:
(ক) \(\tau\le N\) bounded (কোনো ধ্রুবক \(N\)-এ); অথবা (খ) \(\tau<\infty\) a.s. এবং \((X_n)\) uniformly bounded (\(\lvert X_n\rvert\le C\) সব \(n,\omega\)-তে); অথবা (গ) \(\mathbb E[\tau]<\infty\) এবং \((X_n)\)-এর bounded increments (\(\lvert X_k-X_{k-1}\rvert\le C\) সব \(k\)-তে)।
স্বীকৃতি — কেন তিনটি অনুমান লাগে (গভীর, প্রথম পাঠে মূল ধারণাটুকুই যথেষ্ট)। \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সবসময় সত্য (প্রমাণ ২), কিন্তু \(n\to\infty\)-এ বাঁ পাশকে \(\mathbb E[X_\tau]\)-এ নিতে হলে প্রত্যাশা ও সীমা বদলানো (\(\lim_n\mathbb E[X_{n\wedge\tau}]=\mathbb E[\lim_n X_{n\wedge\tau}]\)) বৈধ হতে হবে — যা সাধারণভাবে মিথ্যা (চিরায়ত প্রতিউদাহরণ: symmetric random walk-এ \(\tau=\) "\(+1\)-এ প্রথম পৌঁছানো", যেখানে \(\tau<\infty\) a.s. অথচ \(\mathbb E[X_\tau]=1\ne 0=\mathbb E[X_0]\) — কারণ এখানে কোনোটিই (ক)-(গ) মানে না)। তাই তিনটি অনুমান-গুচ্ছের প্রতিটিই আসলে dominated convergence theorem (DCT, প্রাবল্য-অভিসারণ) বা তার সমতুল্য চালু করার আলাদা-আলাদা শর্ত। সবচেয়ে সহজ (ক), সবচেয়ে ব্যবহারিক (গ)।
ধাপ ০ — সাধারণ সীমা: \(X_{n\wedge\tau}\to X_\tau\) a.s. তিন ক্ষেত্রেই \(\tau<\infty\) a.s. (ক, খ-এ স্পষ্ট; গ-তে \(\mathbb E[\tau]<\infty\Rightarrow\tau<\infty\) a.s.)। যে \(\omega\)-তে \(\tau(\omega)<\infty\), সেখানে \(n\ge\tau(\omega)\) হলেই \(n\wedge\tau(\omega)=\tau(\omega)\), তাই \(X_{n\wedge\tau}(\omega)=X_{\tau}(\omega)\) — অর্থাৎ অনুক্রমটি শেষ পর্যন্ত স্থির এবং সীমা \(X_\tau(\omega)\)। সুতরাং
বাকি কাজ কেবল \(\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]\) — প্রতিটি ক্ষেত্রে domination দেখিয়ে।
ধাপ ১ — ক্ষেত্র (ক): \(\tau\le N\) bounded (সবচেয়ে সহজ)। এখানে সীমা নেওয়ার দরকারই নেই — \(n=N\) বসাই। যেহেতু \(\tau\le N\), প্রতিটি \(\omega\)-তে \(N\wedge\tau=\tau\), তাই \(X_{N\wedge\tau}=X_\tau\) সরাসরি। প্রমাণ ২-এর \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\)-তে \(n=N\):
(কোনো convergence-যুক্তি লাগে না — bounded stopping time-এ optional stopping নিছক প্রমাণ ২-এর এক-মান-বসানো।)
ধাপ ২ — ক্ষেত্র (খ): \(\tau<\infty\) a.s. ও \(\lvert X_n\rvert\le C\) (DCT, uniform bound)। প্রতিটি \(n\)-এ \(\lvert X_{n\wedge\tau}\rvert\le C\) — কারণ \(X_{n\wedge\tau}\) হলো কোনো-এক সূচকে \(X\)-এর মান, আর সব \(X_m\)-ই \(C\)-আবদ্ধ। তাই ধ্রুব-আবদ্ধক \(g\equiv C\in L^1\) (probability space-এ \(\mathbb E[C]=C<\infty\)) গোটা অনুক্রমকে dominate করে, আর ধাপ ০-তে \(X_{n\wedge\tau}\to X_\tau\) a.s.। DCT (7.4) দেয়
বাঁ পাশ প্রতিটি \(n\)-এ \(\mathbb E[X_0]\) (প্রমাণ ২), তাই তার সীমাও \(\mathbb E[X_0]\)। সুতরাং \(\mathbb E[X_\tau]=\mathbb E[X_0]\). ✓ (এখানে \(X_\tau\in L^1\)-ও DCT থেকেই আসে: \(\lvert X_\tau\rvert\le C\)।)
ধাপ ৩ — ক্ষেত্র (গ): \(\mathbb E[\tau]<\infty\) ও \(\lvert X_k-X_{k-1}\rvert\le C\) (DCT, \(C\tau\)-আবদ্ধক)। এখানে \(X_n\) নিজে আবদ্ধ না-ও হতে পারে (যেমন random walk), তাই (খ)-এর ধ্রুব-আবদ্ধক খাটে না — পরিবর্তে একটি integrable random আবদ্ধক বানাই। telescoping ও triangle inequality:
তাই \(\lvert X_{n\wedge\tau}\rvert\le\lvert X_0\rvert+C\tau=:Y\) সব \(n\)-তে, এবং এই আবদ্ধক \(Y\) integrable: \(\mathbb E[Y]=\mathbb E\lvert X_0\rvert+C\,\mathbb E[\tau]<\infty\) (যেহেতু \(X_0\in L^1\) ও অনুমান \(\mathbb E[\tau]<\infty\))। ধাপ ০-তে \(X_{n\wedge\tau}\to X_\tau\) a.s., আর \(Y\in L^1\) অনুক্রমকে dominate করে — DCT দেয়
(সঙ্গে \(\lvert X_\tau\rvert\le\lvert X_0\rvert+C\tau\in L^1\), তাই \(X_\tau\in L^1\) — সীমা অর্থবহ।) \(\blacksquare\)
উপসিদ্ধান্ত — submartingale/supermartingale রূপ। প্রমাণ ২-এর টীকায় submartingale-এ \(\mathbb E[X_{n\wedge\tau}]\ge\mathbb E[X_0]\); একই DCT-গুলো দিয়ে (ক)–(গ)-এর যেকোনোটির অধীনে submartingale-এ \(\mathbb E[X_\tau]\ge\mathbb E[X_0]\) এবং supermartingale-এ \(\mathbb E[X_\tau]\le\mathbb E[X_0]\) — অসমতাগুলোও সীমায় টিকে থাকে।
এক বাক্যে: \(\tau<\infty\) a.s. বলে \(X_{n\wedge\tau}\to X_\tau\) a.s. (অনুক্রম শেষে স্থির), আর প্রমাণ ২-এর \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\)-তে সীমা টানতে domination লাগে — (ক) bounded \(\tau\)-তে \(n=N\) বসালেই \(X_{N\wedge\tau}=X_\tau\), (খ) \(\lvert X_n\rvert\le C\)-তে ধ্রুব-আবদ্ধক \(C\) দিয়ে DCT, (গ) bounded increments-এ \(\lvert X_{n\wedge\tau}\rvert\le\lvert X_0\rvert+C\tau\in L^1\) দিয়ে DCT — তিন ক্ষেত্রেই \(\mathbb E[X_\tau]=\mathbb E[X_0]\)।
প্রমাণ ৪ — gambler's ruin via optional stopping (★★)¶
সেটআপ (জুয়াড়ির সর্বনাশ — gambler's ruin)। ধরা যাক \(\xi_1,\xi_2,\dots\) i.i.d. (স্বাধীন ও অভিন্ন-বণ্টিত), \(\mathbb P(\xi_i=+1)=\mathbb P(\xi_i=-1)=\tfrac12\) — symmetric simple random walk (প্রতিসম সরল দৈবচলন)। \(S_0:=0\), \(S_n:=\sum_{i=1}^n\xi_i\); প্রমাণ ৬(খ)-তে \((S_n)\) একটি martingale (\(\mathbb E[\xi_i]=0\))। দুই ধ্রুব পূর্ণসংখ্যা \(a,b>0\) নিয়ে ধরি প্রথম-আঘাত-সময় (first hitting time)
অর্থাৎ চলন যখন প্রথমবার \(-a\) (সর্বনাশ) বা \(+b\) (জয়) ছুঁয়ে ফেলে তখন থামা। লক্ষ্য: জয়ের সম্ভাবনা \(p:=\mathbb P(S_\tau=+b)\) ও গড় খেলা-দৈর্ঘ্য \(\mathbb E[\tau]\) বের করা।
ধাপ ১ — \(\tau\) একটি stopping time এবং \(\mathbb E[\tau]<\infty\)। \(\{\tau\le n\}=\bigcup_{m\le n}\{S_m\in\{-a,+b\}\}\in\mathcal F_n\) (প্রতিটি \(\{S_m=\cdot\}\in\mathcal F_m\subseteq\mathcal F_n\)), তাই stopping time। \(\mathbb E[\tau]<\infty\) দেখাই একটি মানক যুক্তিতে: চলন \(-a\) ও \(+b\)-এর মাঝে \(a+b\) ধাপ চওড়া একটি ফালিতে আটকে। যেকোনো অবস্থান থেকে পরপর \(a+b\) বার \(+1\) পেলে নিশ্চয় \(+b\) পেরিয়ে যাবে (তাই থেমে যাবে); এই ঘটনার সম্ভাবনা প্রতিটি \((a+b)\)-block-এ অন্তত \(q:=2^{-(a+b)}>0\)। তাই \(\tau\) যেকোনো \((a+b)\)-দৈর্ঘ্য খণ্ডে সম্ভাবনা \(\ge q\)-তে শেষ হয়, ফলে \(\mathbb P(\tau> k(a+b))\le(1-q)^k\) — অর্থাৎ \(\tau\)-এর লেজ জ্যামিতিকভাবে ক্ষয়িষ্ণু (geometric tail)। জ্যামিতিক লেজ মানে সব moment সসীম, বিশেষত
আর increments \(\lvert S_k-S_{k-1}\rvert=\lvert\xi_k\rvert=1\le C\) (\(C=1\))। তাই প্রমাণ ৩-এর অনুমান (গ) পুরোপুরি মেটে। ✓
ধাপ ২ — প্রথম optional stopping: \(\mathbb E[S_\tau]=0\) ⇒ \(p=\frac{a}{a+b}\)। \((S_n)\) martingale, \(S_0=0\), আর (গ) সিদ্ধ — তাই প্রমাণ ৩:
কিন্তু থামার মুহূর্তে \(S_\tau\) কেবল দুটি মান নেয়: \(+b\) (সম্ভাবনা \(p\)) বা \(-a\) (সম্ভাবনা \(1-p\))। তাই \(\mathbb E[S_\tau]=b\,p+(-a)(1-p)=bp-a(1-p)\)। সমান শূন্য বসিয়ে:
স্বজ্ঞা: ন্যায্য খেলায় জয়ের সম্ভাবনা শুরুর বিন্দুর দূরত্ব-অনুপাতে — \(+b\)-এর চেয়ে \(-a\) যত কাছে, ততই বেশি সম্ভাবনা সেদিকে শেষ (এখানে \(-a\) থেকে দূরত্ব \(a\), মোট প্রস্থ \(a+b\))।
ধাপ ৩ — দ্বিতীয় martingale \(M_n:=S_n^2-n\)। এবার গড় খেলা-দৈর্ঘ্য বের করতে আরেকটি martingale লাগে। দাবি: \(M_n:=S_n^2-n\) একটি martingale। যাচাই: \(S_n\in L^1\) ও bounded-by-\(n\)... আসলে \(\lvert S_n\rvert\le n\) তাই \(S_n^2\le n^2\), integrable; এবং increment-রূপ — যেহেতু \(S_{n+1}=S_n+\xi_{n+1}\) আর \(\xi_{n+1}\perp\!\!\!\perp\mathcal F_n\) সঙ্গে \(\mathbb E[\xi_{n+1}]=0,\ \mathbb E[\xi_{n+1}^2]=1\):
যেখানে \(S_n\) হলো \(\mathcal F_n\)-measurable বলে pull-out, আর \(\xi_{n+1}\perp\!\!\!\perp\mathcal F_n\) বলে independence rule (7.7) প্রয়োগ। সুতরাং \(\mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[S_{n+1}^2\mid\mathcal F_n]-(n+1)=(S_n^2+1)-(n+1)=S_n^2-n=M_n\) — martingale, \(M_0=0\)। (এই \(S_n^2-n\)-ই প্রমাণ ৫-এর Doob decomposition-এ স্বাভাবিকভাবে বেরোবে: \(S_n^2\)-এর predictable অংশ ঠিক \(A_n=n\)।)
ধাপ ৪ — দ্বিতীয় optional stopping: \(\mathbb E[\tau]=\mathbb E[S_\tau^2]=ab\)। \(M_n=S_n^2-n\)-এ optional stopping প্রয়োগ করতে চাই। সরাসরি (গ) এখানে \(M\)-এর জন্য খাটে না (increments আবদ্ধ নয়), তাই প্রমাণ ২-এর সমতা \(\mathbb E[M_{n\wedge\tau}]=\mathbb E[M_0]=0\) থেকে শুরু করি (যা সবসময় সত্য):
এখন \(n\to\infty\) নিই। ডান পাশে \(n\wedge\tau\uparrow\tau\) a.s. (monotone), তাই monotone convergence theorem (MCT) দেয় \(\mathbb E[n\wedge\tau]\to\mathbb E[\tau]\)। বাঁ পাশে \(\lvert S_{n\wedge\tau}\rvert\le\max(a,b)=:R\) (থামার আগে চলন \((-a,b)\)-এর ভেতরে, তাই সর্বদা \(\lvert S_{n\wedge\tau}\rvert\le R\)), অর্থাৎ \(S_{n\wedge\tau}^2\le R^2\) — ধ্রুব-আবদ্ধক; আর \(S_{n\wedge\tau}^2\to S_\tau^2\) a.s. (ধাপ ০, \(\tau<\infty\))। DCT দেয় \(\mathbb E[S_{n\wedge\tau}^2]\to\mathbb E[S_\tau^2]\)। দুই সীমা মিলিয়ে
বাঁ পাশ গণনা করি: \(S_\tau\in\{+b,-a\}\), তাই \(S_\tau^2\in\{b^2,a^2\}\) এবং (ধাপ ২-এর \(p=\frac{a}{a+b}\))
সুতরাং
সংখ্যাগত যাচাই — \(a=8,\ b=4\)। তখন জয়ের সম্ভাবনা \(p=\dfrac{a}{a+b}=\dfrac{8}{8+4}=\dfrac{8}{12}=\dfrac{2}{3}\), আর গড় খেলা-দৈর্ঘ্য \(\mathbb E[\tau]=ab=8\cdot 4=32\)। (স্বজ্ঞা: শুরু থেকে \(-8\) অনেক দূর, \(+4\) কাছে — তাই \(+4\)-এ শেষ হওয়ার সম্ভাবনা বেশি, \(\tfrac23\); আর গড়ে \(32\) ধাপ লাগে কোনো-এক প্রান্তে পৌঁছাতে।) \(\blacksquare\)
এক বাক্যে: \(\mathbb E[\tau]<\infty\) (geometric tail) ও \(\lvert\xi_k\rvert=1\) বলে অনুমান (গ) মেটে, তাই \((S_n)\)-এ optional stopping দেয় \(0=\mathbb E[S_\tau]=bp-a(1-p)\Rightarrow p=\frac{a}{a+b}\); আর \(M_n=S_n^2-n\)-এ \(\mathbb E[M_{n\wedge\tau}]=0\) থেকে (MCT ডানে, DCT বামে) \(\mathbb E[\tau]=\mathbb E[S_\tau^2]=ab\) — \(a=8,b=4\)-এ \(p=\tfrac23,\ \mathbb E[\tau]=32\)।
প্রমাণ ৫ — Doob decomposition (★★)¶
দাবি (Doob decomposition — ডুব-বিভাজন)। ধরা যাক \((X_n)_{n\ge 0}\) একটি submartingale (\(\mathbb E[X_{n+1}\mid\mathcal F_n]\ge X_n\), সব \(X_n\in L^1\), adapted)। তবে \(X_n\) একমাত্রভাবে (uniquely) লেখা যায়
যেখানে \((M_n)\) একটি martingale, আর \((A_n)\) একটি predictable (\(A_n\) \(\mathcal F_{n-1}\)-measurable \(n\ge 1\)-তে), increasing (অ-হ্রাসমান, \(A_{n}\le A_{n+1}\) a.s.) process সঙ্গে \(A_0=0\)। এই \((A_n)\)-কে বলা হয় compensator (ক্ষতিপূরক) বা predictable increasing part।
ধাপ ১ — \(A_n\)-এর সংজ্ঞা ও তিন বৈশিষ্ট্য। "অনুমান-করে-যাচাই" পদ্ধতিতে \(A\)-কে আগে নির্মাণ করি। সংজ্ঞা দিই \(A_0:=0\) এবং
অর্থাৎ প্রতিটি ধাপে submartingale-এর শর্তাধীন বৃদ্ধি (drift) জমা। এর তিন বৈশিষ্ট্য:
- predictable: \(A_n\)-এর \(k\)-তম পদ \(\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\) হলো \(\mathcal F_{k-1}\)-measurable (conditional expectation সবসময় শর্ত-σ-algebra-measurable, 7.7-CE-1); সর্বোচ্চ-সূচক \(k=n\) পদ \(\mathcal F_{n-1}\)-measurable, আর বাকি সব পদ \(\mathcal F_{k-1}\subseteq\mathcal F_{n-1}\)-তেও — তাই পুরো যোগফল \(A_n\) হলো \(\mathcal F_{n-1}\)-measurable। ✓
- increasing: \(A_n-A_{n-1}=\mathbb E[X_n-X_{n-1}\mid\mathcal F_{n-1}]\ge 0\) a.s. — ঠিক submartingale-শর্ত (\(\mathbb E[X_n\mid\mathcal F_{n-1}]\ge X_{n-1}\))। তাই \(A_n\) অ-হ্রাসমান। ✓ (এখানেই "submartingale" অনুমানটা একমাত্রবার লাগে; martingale হলে \(A_n\equiv 0\), supermartingale হলে \(A_n\) অ-বর্ধমান।)
- \(A_0=0\): সংজ্ঞা-অনুযায়ী। ✓
ধাপ ২ — \(M_n:=X_n-A_n\) একটি martingale। \(M_n\) হলো \(\mathcal F_n\)-measurable (\(X_n\) adapted, \(A_n\) হলো \(\mathcal F_{n-1}\subseteq\mathcal F_n\)-measurable) ও integrable (\(X_n\in L^1\); \(A_n\)-এর প্রতিটি পদ \(\mathbb E\bigl\lvert\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\bigr\rvert\le\mathbb E\lvert X_k-X_{k-1}\rvert<\infty\), conditional Jensen/contraction)। increment-রূপ যাচাই করি। লক্ষণীয় — \(A_n\) হলো \(\mathcal F_n\)-measurable, আর গুরুত্বপূর্ণভাবে increment \(A_{n+1}-A_n=\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\) হলো \(\mathcal F_n\)-measurable (predictable):
যেখানে \(A_{n+1}-A_n\) হলো \(\mathcal F_n\)-measurable বলে pull-out/ধ্রুবক-নিয়মে \(\mathbb E[A_{n+1}-A_n\mid\mathcal F_n]=A_{n+1}-A_n\) (linearity দিয়ে বিয়োগ)। কিন্তু সংজ্ঞা-অনুযায়ী \(A_{n+1}-A_n=\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\) — অর্থাৎ দুই পদ ঠিক পরস্পর কাটাকাটি:
তাই \((M_n)\) martingale। আর \(X_n=M_n+A_n\) অভেদ-সংজ্ঞা থেকে স্পষ্ট। অস্তিত্ব প্রমাণিত। ✓
ধাপ ৩ — অনন্যতা (uniqueness)। ধরা যাক দুটি বিভাজন \(X_n=M_n+A_n=M_n'+A_n'\), যেখানে \(M,M'\) martingale ও \(A,A'\) predictable-increasing সঙ্গে \(A_0=A_0'=0\)। সংজ্ঞা দিই \(D_n:=A_n-A_n'=M_n'-M_n\)। তবে \(D_n\) একদিকে predictable (দুই predictable-এর পার্থক্য, \(\mathcal F_{n-1}\)-measurable), অন্যদিকে martingale (দুই martingale-এর পার্থক্য)। martingale বলে increment-রূপে \(\mathbb E[D_{n+1}-D_n\mid\mathcal F_n]=0\); কিন্তু \(D_{n+1}\) হলো \(\mathcal F_n\)-measurable (predictable), তাই \(\mathbb E[D_{n+1}\mid\mathcal F_n]=D_{n+1}\) আর \(\mathbb E[D_n\mid\mathcal F_n]=D_n\) — সুতরাং \(D_{n+1}-D_n=0\) a.s., অর্থাৎ \(D_n\) a.s. ধ্রুব in \(n\)। যেহেতু \(D_0=A_0-A_0'=0\), পাই \(D_n=0\) a.s. সব \(n\)-তে — অর্থাৎ \(A_n=A_n'\) এবং \(M_n=M_n'\) a.s.। বিভাজন একমাত্র। \(\blacksquare\)
ধাপ ৪ — প্রয়োগ: \(S_n^2\) ও \(A_n=n\)। symmetric random walk-এ \(X_n:=S_n^2\) একটি submartingale (কারণ conditional Jensen-এ \(\mathbb E[S_{n+1}^2\mid\mathcal F_n]\ge(\mathbb E[S_{n+1}\mid\mathcal F_n])^2=S_n^2\); অথবা সরাসরি প্রমাণ ৪-ধাপ ৩-এর হিসাব \(\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2\))। তার compensator:
(প্রতিটি পদে প্রমাণ ৪-ধাপ ৩-এর \(\mathbb E[S_k^2\mid\mathcal F_{k-1}]=S_{k-1}^2+1\) বসিয়ে)। তাই Doob decomposition \(S_n^2=M_n+n\) দেয় \(M_n=S_n^2-n\) — অর্থাৎ \(S_n^2-n\) একটি martingale, যা প্রমাণ ৪-ধাপ ৩-এ হাতে যাচাই করা হয়েছিল, এখানে decomposition-এর স্বাভাবিক ফল হিসেবে পুনঃপ্রতিষ্ঠিত। (\(A_n=n\)-কে বলা হয় random walk-এর predictable quadratic variation \(\langle S\rangle_n\) — যা 7.9-এ martingale convergence ও CLT-তে কেন্দ্রীয়।) \(\blacksquare\)
এক বাক্যে: \(A_n:=\sum_{k=1}^n\mathbb E[X_k-X_{k-1}\mid\mathcal F_{k-1}]\) হলো predictable (conditional expectation শর্ত-measurable) ও increasing (submartingale-শর্তে প্রতিটি পদ \(\ge 0\)), আর \(M_n:=X_n-A_n\)-এর increment-এ \(A\)-এর drift ঠিক \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]\)-কে কাটে বলে \(M\) martingale; অনন্যতা আসে "predictable martingale ⇒ ধ্রুব" থেকে, আর \(S_n^2\)-এ \(A_n=n\), তাই \(S_n^2-n\) martingale।
এ-অংশের ছয়টি প্রমাণ মিলে martingale-যন্ত্রের পূর্ণ কঙ্কাল দাঁড় করায়: প্রমাণ ৬ ভিত্তি (ধ্রুব গড় + উদাহরণ-কারখানা); প্রমাণ ১ "no system beats a fair game"; প্রমাণ ২ stopped process হিমায়িত-martingale; প্রমাণ ৩ optional stopping (তিন domination-শর্ত); প্রমাণ ৪ তার চমকপ্রদ ফসল gambler's ruin (\(p=\frac{a}{a+b},\ \mathbb E[\tau]=ab\)); আর প্রমাণ ৫ Doob decomposition, যা submartingale-কে martingale + predictable-increasing অংশে ভেঙে \(S_n^2-n\)-কে martingale দেখায়। প্রতিটি পদক্ষেপ 7.7-এর tower, pull-out, linearity, independence rule, ও 7.4-এর MCT/DCT-র উপর দাঁড়িয়ে — এই একই যন্ত্র 7.9-এ martingale convergence theorem ও SLLN-এর দ্বিতীয় প্রমাণে, এবং 7.10-এ rigorous CLT-তে ফিরবে।
৫ · কোড ল্যাব (Python)¶
এই অধ্যায়ের কেন্দ্রীয় বস্তু martingale (মার্টিঙ্গেল — "ন্যায্য খেলা"র random process) পুরোপুরি বিমূর্ত একটা শর্তাধীন-প্রত্যাশা সমীকরণ \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) দিয়ে সংজ্ঞায়িত — "আজ পর্যন্ত সব তথ্য দিয়ে আগামীকালের সেরা অনুমান = আজকের মান"। কিন্তু সংজ্ঞাটি যত বিমূর্তই হোক, তার প্রতিটি ফল simulation-এ সংখ্যায় চোখে দেখা যায়: একটা symmetric random walk-এর গড় সব সময়ে শূন্যে থিতু থাকে, যদিও পৃথক পথ বুনোভাবে দোলে; gambler's ruin-এ optional stopping theorem-এর হিসাব (\(\mathbb P(+b)\), \(\mathbb E[S_\tau]\), \(\mathbb E[\tau]\)) empirically মিলে যায়; কিন্তু hypothesis ভাঙলে — first-passage-এ — সেই উপপাদ্যই ভেঙে পড়ে; আর একটা product martingale-এর গড় গুণফল-ক্ষেত্রেও \(1\)-এ আটকে থাকে। এই ল্যাবে একটিমাত্র runnable স্ক্রিপ্ট (শুধু numpy-নির্ভর, বাড়তি কোনো library নয়) চারটি অংশে এই চারটি মুখ একে একে যাচাই করে।
স্ক্রিপ্টের কাঠামো ও পুনরুৎপাদনযোগ্যতা (reproducibility)¶
পুরো ল্যাবটা একটাই runnable স্ক্রিপ্ট — _code/lab_7-8.py — চারটে ব্যাখ্যাযুক্ত অংশে ভাগ করা, নির্ভরতা শুধু numpy। চারটি অংশই একটিমাত্র generator থেকে টানে — np.random.default_rng(20260619) — এবং default_rng-এর ফলাফল স্রোত (stream) থেকে টানার ক্রমের উপর নির্ভরশীল: একই seed হলেও আগে-পরে টানলে আলাদা সংখ্যা আসে। তাই ফল পুনরুৎপাদনযোগ্য রাখতে নিচের ঠিক এই ক্রমেই স্রোত টানা হয় —
- Part 1 — plain symmetric-walk increment array (shape \(200000\times50\), প্রতিটি \(\pm1\)), সবার আগে;
- Part 2 — gambler's-ruin loop (barrier \(-8,+4\)), প্রতিটি পদক্ষেপ একই generator থেকে;
- Part 3 — first-passage-to-\(+1\) loop (cap \(N=10^5\)), একই generator থেকে;
- Part 4 — product-martingale increment array (\(\pm1\) fair coins, shape \(200000\times40\)), সবার শেষে।
প্রতিটি \(\pm1\) ন্যায্য মুদ্রা স্বাধীন ও past থেকে স্বাধীন — এটিই martingale-ধর্মের কাঁচামাল: increment-এর শর্তাধীন গড় শূন্য (যোগফলে), শর্তাধীন গড় এক (গুণফলে)। নিচের set-up লাইনটি গোটা স্ক্রিপ্টে একবারই চলে—
import numpy as np
np.set_printoptions(precision=4, suppress=True)
# ---- one generator, seeded once; every draw below pulls from it in order ----
rng = np.random.default_rng(20260619)
প্রতিটি অংশ এই একই rng-এ ক্রমানুসারে টানে, তাই draw-ক্রম স্থির এবং নিচের সব সংখ্যা হুবহু পুনরুৎপাদনযোগ্য।
৫.১ · Random walk একটি martingale — গড় সব সময়ে শূন্য¶
সবচেয়ে চেনা martingale: ন্যায্য মুদ্রার symmetric random walk, \(\xi_k=\pm1\), \(S_n=\sum_{k\le n}\xi_k\), \(S_0=0\)। যেহেতু \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0\), তাই \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n\) — martingale। এর সরাসরি ফল ধ্রুব গড়: \(\mathbb E[S_n]=\mathbb E[S_0]=0\) প্রতিটি \(n\)-এ — যদিও পৃথক পথ \(\sqrt n\)-মাপে ছড়িয়ে দূরে চলে যায়। এখানে \(200000\) পথে \(\mathbb E[S_{50}]\approx0\) যাচাই, এবং কয়েকটা পথের running mean \(S_n/n\) যে শূন্যের দিকে নামে তা দেখা — মনে রাখতে হবে, martingale মানে বায়াসহীন, নিশ্চল নয়।
# =====================================================================
# PART 1 -- A symmetric random walk is a martingale.
# xi_k = +-1 fair coin, S_n = sum_{k<=n} xi_k, S_0 = 0.
# E[xi_{n+1} | F_n] = 0 => E[S_{n+1} | F_n] = S_n (martingale).
# Consequence: E[S_n] = E[S_0] = 0 for EVERY n (constant mean),
# even though individual paths wander far. We check E[S_50] ~ 0
# across many paths, and watch a few paths' running mean -> 0.
# =====================================================================
n_paths = 200_000
n_steps = 50
# (1) draw the plain-walk increments FIRST: shape (n_paths, n_steps), +-1
inc = rng.choice(np.array([-1, 1]), size=(n_paths, n_steps))
walks = np.cumsum(inc, axis=1) # S_1 .. S_50 per path
S50 = walks[:, -1] # S_50 per path
mean_S50 = S50.mean()
std_S50 = S50.std()
# E[S_n] along the time axis, averaged over all paths: should hug 0
mean_path = walks.mean(axis=0) # E[S_1]..E[S_50]
print("PART 1 -- symmetric random walk S_n is a martingale (E[S_n] = 0)")
print(f" paths = {n_paths}, steps = {n_steps}")
print(f" E[S_50] = {mean_S50:+.4f} (theory 0)")
print(f" sd(S_50) = {std_S50:.4f} (theory sqrt(50) = "
f"{np.sqrt(50):.4f})")
print(f" max |E[S_n]| over n=1..50 = {np.abs(mean_path).max():.4f} "
f"(theory 0 at every n)")
print(" a few sample paths' RUNNING MEAN S_n / n (-> 0 as n grows):")
print(f" {'path':>5} | {'S_10/10':>9} | {'S_30/30':>9} | {'S_50/50':>9}")
print(" " + "-" * 40)
for i in range(5):
r10 = walks[i, 9] / 10.0
r30 = walks[i, 29] / 30.0
r50 = walks[i, 49] / 50.0
print(f" {i:>5} | {r10:>9.4f} | {r30:>9.4f} | {r50:>9.4f}")
PART 1 -- symmetric random walk S_n is a martingale (E[S_n] = 0)
paths = 200000, steps = 50
E[S_50] = -0.0034 (theory 0)
sd(S_50) = 7.0782 (theory sqrt(50) = 7.0711)
max |E[S_n]| over n=1..50 = 0.0245 (theory 0 at every n)
a few sample paths' RUNNING MEAN S_n / n (-> 0 as n grows):
path | S_10/10 | S_30/30 | S_50/50
----------------------------------------
0 | 0.4000 | 0.3333 | 0.2400
1 | -0.2000 | -0.2000 | -0.1200
2 | 0.0000 | 0.0667 | 0.0800
3 | 0.2000 | 0.2667 | 0.2000
4 | -0.4000 | -0.0667 | 0.0400
পাঠোদ্ধার (read-off)।
- গড় সব সময়ে শূন্য, পৃথক পথ নয়। \(200000\) পথে \(\mathbb E[S_{50}]=\mathbf{-0.0034}\) (\(\approx0\)), আর গোটা \(n=1,\dots,50\) জুড়ে \(\max_n\lvert\mathbb E[S_n]\rvert=\mathbf{0.0245}\) — অর্থাৎ প্রতিটি সময়ে গড় শূন্যেই আটকে, ঠিক যেমন martingale-এর ধ্রুব-গড় দাবি করে। এটিই "ন্যায্য": কোনো drift নেই, কোনো গোপন প্রবণতা নেই।
- শূন্য গড় ≠ নিশ্চলতা। \(S_{50}\)-এর standard deviation \(\mathbf{7.0782}\approx\sqrt{50}=7.0711\) — অর্থাৎ পৃথক পথ গড়ে \(\pm7\) মাপে দূরে ছিটকে যায়, যদিও তাদের গড় শূন্য। martingale তাই বায়াসহীন, নিশ্চল নয় — গড় সমতল, কিন্তু পথ বুনোভাবে দোলে।
- running mean শূন্যের দিকে নামে। কয়েকটা পথের \(S_n/n\) দেখায় \(n\) বড় হলে ওঠানামা কমে শূন্যের দিকে গুটিয়ে আসে (যেমন path \(4\): \(-0.40\to-0.07\to0.04\)) — এ-ই strong law-এর (\(S_n/n\to0\)) আগাম ঝলক, আর martingale convergence (7.9)-এর সেতু।
৫.২ · Gambler's ruin — optional stopping theorem (যখন উপপাদ্য খাটে)¶
এবার stopping time (থামার সময়) যোগ হয়। symmetric \(\pm1\) walk শূন্য থেকে শুরু, শোষক বাধা (absorbing barrier) \(-a=-8\) ও \(+b=+4\); \(\tau\) = প্রথম যখন walk কোনো বাধা ছোঁয়। এখানে \(\tau\) a.s. সসীম এবং \(\mathbb E[\tau]<\infty\) ও increment bounded — তাই optional stopping theorem খাটে: \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\)। এটিই ruin-সম্ভাবনা পিন করে — \(\mathbb P(+b)=\frac{a}{a+b}=\frac{8}{12}=0.6667\) — আর যেহেতু \(S_n^2-n\)-ও martingale (Doob decomposition, §৪), গড় থামার সময় \(\mathbb E[\tau]=ab=8\times4=32\)।
# =====================================================================
# PART 2 -- Gambler's ruin / optional stopping (the theorem HOLDS).
# Symmetric +-1 walk from 0, absorbing barriers at -a = -8
# and +b = +4. tau = first time the walk hits -a or +b.
# tau is finite a.s. AND E[tau] < infinity with bounded
# increments -> optional stopping applies to the martingale S:
# E[S_tau] = E[S_0] = 0.
# This pins the ruin probabilities:
# P(hit +b) = a/(a+b) = 8/12 = 0.6667,
# P(hit -a) = b/(a+b) = 4/12 = 0.3333,
# and (since S^2 - n is also a martingale) E[tau] = a*b = 32.
# =====================================================================
a, b = 8, 4 # barriers at -8 and +4
n_games = 200_000
hit_top = np.empty(n_games, dtype=bool) # did this game hit +b ?
S_tau = np.empty(n_games) # value of S at stopping
tau = np.empty(n_games) # stopping time
for g in range(n_games):
pos = 0
t = 0
# (2) gambler's-ruin loop pulls +-1 steps from the SAME generator
while -a < pos < b:
pos += 1 if rng.random() < 0.5 else -1
t += 1
hit_top[g] = (pos == b)
S_tau[g] = pos
tau[g] = t
p_top = hit_top.mean()
mean_Stau = S_tau.mean()
mean_tau = tau.mean()
print("\nPART 2 -- gambler's ruin, barriers -8 and +4 : optional stopping HOLDS")
print(f" games = {n_games}")
print(f" P(hit +b=+4) = {p_top:.4f} (theory a/(a+b) = 8/12 = "
f"{a/(a+b):.4f})")
print(f" P(hit -a=-8) = {1 - p_top:.4f} (theory b/(a+b) = 4/12 = "
f"{b/(a+b):.4f})")
print(f" E[S_tau] = {mean_Stau:+.4f} (theory E[S_0] = 0)")
print(f" E[tau] = {mean_tau:.4f} (theory a*b = 8*4 = {a*b})")
print(f" check: a*P(top) - b*(1-P(top)) = "
f"{a*p_top - b*(1 - p_top):+.4f} (= E[S_tau] ~ 0)")
PART 2 -- gambler's ruin, barriers -8 and +4 : optional stopping HOLDS
games = 200000
P(hit +b=+4) = 0.6654 (theory a/(a+b) = 8/12 = 0.6667)
P(hit -a=-8) = 0.3346 (theory b/(a+b) = 4/12 = 0.3333)
E[S_tau] = -0.0152 (theory E[S_0] = 0)
E[tau] = 31.9944 (theory a*b = 8*4 = 32)
check: a*P(top) - b*(1-P(top)) = +3.9848 (= E[S_tau] ~ 0)
পাঠোদ্ধার।
- ruin-সম্ভাবনা তত্ত্ব ছুঁয়ে ফেলে। \(\mathbb P(\text{hit }+4)=\mathbf{0.6654}\approx\frac{8}{12}=0.6667\), এবং \(\mathbb P(\text{hit }-8)=\mathbf{0.3346}\approx\frac{4}{12}=0.3333\)। লক্ষণীয়, কাছের বাধা (\(+4\)) ছোঁয়ার সম্ভাবনা বেশি, দূরের (\(-8\)) কম — অনুপাত ঠিক উল্টো দূরত্বে \(a:b=8:4\), যা optional stopping থেকে সরাসরি বেরোয়।
- \(\mathbb E[S_\tau]=0\) — ন্যায্যতা থামার পরেও টিকে থাকে। \(\mathbb E[S_\tau]=\mathbf{-0.0152}\approx0=\mathbb E[S_0]\); আর হিসাব \(a\,\mathbb P(+b)-b\,\mathbb P(-a)=8(0.6654)-4(0.3346)=\mathbf{+3.9848}\) — অর্থাৎ \(b\cdot\frac{a}{a+b}-a\cdot\frac{b}{a+b}\)-কে সংখ্যায় ভেরিফাই করে দেখায় শোষক বাধায় থেমেও martingale-এর গড় শূন্যই থাকে। ন্যায্য খেলা যেকোনো (বৈধ) থামার নিয়মেও ন্যায্য।
- \(\mathbb E[\tau]=ab=32\)। গড় থামার সময় \(\mathbf{31.9944}\approx32\) — এটি দ্বিতীয় martingale \(S_n^2-n\)-এর optional stopping থেকে আসে (\(\mathbb E[S_\tau^2]=\mathbb E[\tau]\), §৪-এর Doob decomposition)। তাই একই simulation দুটো martingale-পরিচয় একসাথে যাচাই করে — drift-হীন \(S_n\) এবং compensator-অপসারিত \(S_n^2-n\)।
৫.৩ · Optional stopping ভেঙে পড়ে — যখন hypothesis মেটে না¶
optional stopping theorem শর্তসাপেক্ষ — তিন hypothesis-গুচ্ছের অন্তত একটি লাগে (§৪)। একটিও না মিটলে উপপাদ্য ভাঙে। ধ্রুপদী পাল্টা-উদাহরণ: একই ন্যায্য \(\pm1\) walk, কিন্তু \(\tau=\) প্রথম \(+1\)-এ পৌঁছানোর সময় (first passage to \(+1\))। walk recurrent, তাই \(\tau<\infty\) a.s. এবং প্রতিটি থামা-পথে \(S_\tau=+1\) — অর্থাৎ \(\mathbb E[S_\tau]=1\ne0=\mathbb E[S_0]\)। বিরোধ নয়: এখানে \(\mathbb E[\tau]=\infty\) (এবং \(\tau\) ও \(S\) unbounded), তাই কোনো hypothesis-ই মেটে না। এটি ফাঁস করতে \(N=10^5\) ধাপে cap বসানো হয় — \(+1\) ছুঁলে থামা (\(S_\tau=+1\)), নইলে cap-এ আটকে যাওয়া; cap-এ আটকা পথের ভগ্নাংশ শূন্যের বেশি এবং তাদের অবস্থান গভীর-ঋণাত্মক — এ-ই \(\mathbb E[\tau]=\infty\)-এর প্রত্যক্ষ প্রমাণ।
# =====================================================================
# PART 3 -- Optional stopping FAILS without a hypothesis.
# Same fair +-1 walk, but tau = first passage to +1.
# THEORY: the walk is recurrent, so tau < infinity a.s. and
# S_tau = +1 on EVERY path => E[S_tau] = 1 != 0 = E[S_0].
# Optional stopping is NOT contradicted: its hypotheses fail,
# because E[tau] = INFINITY (and tau is unbounded, S is
# unbounded). We expose this by CAPPING at N = 1e5 steps:
# - whenever a path hits +1 it stops with S_tau = +1;
# - the cap is hit on a noticeable fraction of paths, and
# among capped paths tau is enormous -> E[tau] diverges.
# Conclusion: E[S_tau] ~ 1 (not 0); the "E[tau] < inf"
# hypothesis is violated, so E[S_tau] = E[S_0] need not hold.
# =====================================================================
n_fp = 20_000
CAP = 100_000 # N = 1e5 step cap
S_fp = np.empty(n_fp) # S at stop-or-cap
tau_fp = np.empty(n_fp) # steps used (capped)
capped = np.empty(n_fp, dtype=bool) # cap reached before +1 ?
for g in range(n_fp):
pos = 0
t = 0
# (3) first-passage loop, same generator, hard cap at CAP steps
while pos < 1 and t < CAP:
pos += 1 if rng.random() < 0.5 else -1
t += 1
capped[g] = (pos < 1) # never reached +1 in time
S_fp[g] = pos
tau_fp[g] = t
frac_capped = capped.mean()
med_tau_fp = np.median(tau_fp) # typical tau is tiny ...
mean_tau_fp = tau_fp.mean() # ... but the MEAN blows up
# paths that actually reached +1 -> S_tau = +1 EXACTLY (this is the theorem
# target: tau<inf a.s., S_tau=1 on every stopped path). The capped paths
# are precisely the rare-but-heavy negative tail that makes E[tau] = inf.
reached = ~capped
Stau_reached = S_fp[reached].mean() # must be exactly 1.0000
mean_tau_reached = tau_fp[reached].mean() if reached.any() else float("nan")
max_tau_reached = tau_fp[reached].max() if reached.any() else float("nan")
mean_pos_capped = S_fp[capped].mean() if capped.any() else float("nan")
print("\nPART 3 -- first passage to +1 : optional stopping FAILS (E[tau]=inf)")
print(f" paths = {n_fp}, step cap N = {CAP}")
print(f" E[S_tau | reached +1] = {Stau_reached:+.4f} "
f"(EXACT: S_tau = +1 on every stopped path, != 0 = E[S_0])")
print(f" fraction NOT done after {CAP} steps (cap hit) = {frac_capped:.4f} "
f"(> 0 => tau is unbounded)")
print(f" median tau = {med_tau_fp:.1f} "
f"(typical first passage is SHORT)")
print(f" mean tau (capped) = {mean_tau_fp:.1f} "
f"(already huge & still grows with the cap -> true E[tau] = INFINITY)")
print(f" among paths reaching +1: mean tau = {mean_tau_reached:.1f}, "
f"max tau = {max_tau_reached:.0f}")
print(f" capped paths sit deep below 0: mean position = {mean_pos_capped:.1f}")
print(f" => S_tau = +1 (not 0) on every stopped path: the conserved-mean")
print(f" identity E[S_tau]=E[S_0] BREAKS because E[tau]=inf (hypothesis")
print(f" violated); the rare deep-negative capped paths carry the gap.")
PART 3 -- first passage to +1 : optional stopping FAILS (E[tau]=inf)
paths = 20000, step cap N = 100000
E[S_tau | reached +1] = +1.0000 (EXACT: S_tau = +1 on every stopped path, != 0 = E[S_0])
fraction NOT done after 100000 steps (cap hit) = 0.0027 (> 0 => tau is unbounded)
median tau = 3.0 (typical first passage is SHORT)
mean tau (capped) = 564.7 (already huge & still grows with the cap -> true E[tau] = INFINITY)
among paths reaching +1: mean tau = 290.5, max tau = 98395
capped paths sit deep below 0: mean position = -400.1
=> S_tau = +1 (not 0) on every stopped path: the conserved-mean
identity E[S_tau]=E[S_0] BREAKS because E[tau]=inf (hypothesis
violated); the rare deep-negative capped paths carry the gap.
পাঠোদ্ধার।
- \(\mathbb E[S_\tau]=1\), শূন্য নয় — উপপাদ্য ভেঙেছে। যে পথগুলো আসলে থেমেছে, তাদের প্রতিটিতে \(S_\tau\) ঠিক \(+1\), তাই \(\mathbb E[S_\tau\mid\text{reached}]=\mathbf{+1.0000}\) (হুবহু, কোনো approximation নয়) \(\ne0=\mathbb E[S_0]\)। ৫.২-এর gambler's ruin-এ যেখানে \(\mathbb E[S_\tau]=0\) মিলেছিল, এখানে একই martingale, একই walk, কিন্তু থামার নিয়ম বদলানোয় গড় \(0\) থেকে \(1\)-এ লাফ দিল — থামার নিয়ম নির্দোষ নয়।
- কারণ \(\mathbb E[\tau]=\infty\)। typical first passage ছোট (median \(\tau=\mathbf{3.0}\)), কিন্তু \(10^5\) ধাপেও \(\mathbf{0.0027}\) ভগ্নাংশ পথ থামেনি, আর তাদের অবস্থান গড়ে \(\mathbf{-400.1}\) — গভীর ঋণাত্মক। এই বিরল-কিন্তু-ভারী লেজই গড় \(\tau\)-কে (\(\mathbf{564.7}\), cap বাড়ালে আরও বাড়ে) অসীমে ঠেলে দেয়। তিন hypothesis (\(\tau\) bounded / \(S\) bounded / \(\mathbb E[\tau]<\infty\)) — একটিও মেটে না।
- শিক্ষা — শর্ত পড়েই উপপাদ্য খাটাতে হয়। martingale হলেই \(\mathbb E[S_\tau]=\mathbb E[S_0]\) "এমনিতেই" সত্য নয়; doubling-কৌশল ও first-passage এই কারণেই বাস্তবে কাজ করে না (অসীম পুঁজি/সময় লাগে)। ৫.২ আর ৫.৩-এর বৈপরীত্যই অধ্যায়ের কেন্দ্রীয় সতর্কবার্তা: optional stopping একটি শর্তসাপেক্ষ উপপাদ্য।
৫.৪ · Product martingale — গুণফলেও গড় এক¶
শেষ অংশ যোগ-কাঠামো থেকে গুণ-কাঠামোয় যায়। \(\xi_i=\pm1\) ন্যায্য, \(M_n=\prod_{i\le n}(1+0.05\,\xi_i)\), \(M_0=1\) — প্রতিটি গুণনীয়ক \(\{0.95,1.05\}\), আর \(\mathbb E[1+0.05\,\xi]=1\)। গুণনীয়কগুলো past থেকে স্বাধীন, তাই \(\mathbb E[M_{n+1}\mid\mathcal F_n]=M_n\cdot\mathbb E[1+0.05\,\xi_{n+1}]=M_n\) — martingale, এবং \(\mathbb E[M_n]=\mathbb E[M_0]=1\) সব \(n\)-এ। এটি ৫.১-এর যোগাত্মক walk-এর গুণাত্মক অ্যানালগ (likelihood-ratio martingale-এর গোড়াও এখানেই), আর এটি সর্বদা ধনাত্মক থাকে। \(200000\) পথে \(\mathbb E[M_{40}]\approx1\) ও তার কম ছড়ানো যাচাই—
# =====================================================================
# PART 4 -- A product martingale.
# xi_i = +-1 fair, M_n = prod_{i<=n} (1 + 0.05 * xi_i), M_0 = 1.
# Each factor has E[1 + 0.05 xi] = 1, and the factors are
# independent of the past, so
# E[M_{n+1} | F_n] = M_n * E[1 + 0.05 xi_{n+1}] = M_n.
# Hence M_n is a martingale with E[M_n] = E[M_0] = 1 for all n.
# We check E[M_40] ~ 1 with low spread (the multiplicative
# analogue of the additive walk in Part 1).
# =====================================================================
n_prod = 200_000
m_steps = 40
# (4) draw the product-martingale increments LAST: +-1 fair coins
xi = rng.choice(np.array([-1.0, 1.0]), size=(n_prod, m_steps))
factors = 1.0 + 0.05 * xi # each in {0.95, 1.05}
M = np.prod(factors, axis=1) # M_40 per path
mean_M40 = M.mean()
std_M40 = M.std()
# theory sd of M_40: E[M^2] = (E[(1+0.05xi)^2])^40 = (1 + 0.05^2)^40
e_m2 = (1.0 + 0.05**2) ** m_steps
var_M40_theory = e_m2 - 1.0
sd_M40_theory = np.sqrt(var_M40_theory)
print("\nPART 4 -- product martingale M_n = prod(1 + 0.05*xi_i) : E[M_40] = 1")
print(f" paths = {n_prod}, steps = {m_steps}")
print(f" E[M_40] = {mean_M40:.4f} (theory 1)")
print(f" sd(M_40) = {std_M40:.4f} (theory sqrt((1+0.05^2)^40 - 1) = "
f"{sd_M40_theory:.4f})")
print(f" min / max M_40 = {M.min():.4f} / {M.max():.4f} "
f"(stays positive; M_n > 0 always)")
print(f" fraction with M_40 < 1 = {(M < 1).mean():.4f} "
f"(~ half, by symmetry of the spread about 1)")
PART 4 -- product martingale M_n = prod(1 + 0.05*xi_i) : E[M_40] = 1
paths = 200000, steps = 40
E[M_40] = 1.0000 (theory 1)
sd(M_40) = 0.3244 (theory sqrt((1+0.05^2)^40 - 1) = 0.3241)
min / max M_40 = 0.2343 / 3.8617 (stays positive; M_n > 0 always)
fraction with M_40 < 1 = 0.5635 (~ half, by symmetry of the spread about 1)
পাঠোদ্ধার।
- গুণফলেও গড় ঠিক এক। \(\mathbb E[M_{40}]=\mathbf{1.0000}\) (তত্ত্ব \(1\)) — যদিও কাঠামো এবার গুণাত্মক। এটিই martingale-ধর্মের সর্বজনীনতা: যোগে increment-এর শর্তাধীন গড় \(0\), গুণে গুণনীয়কের শর্তাধীন গড় \(1\) — দুই ক্ষেত্রেই \(\mathbb E[X_n]=\mathbb E[X_0]\) অটুট।
- কম ছড়ানো, এবং সর্বদা ধনাত্মক। \(\mathrm{sd}(M_{40})=\mathbf{0.3244}\approx\sqrt{(1+0.05^2)^{40}-1}=0.3241\) — তত্ত্বের সাথে হুবহু; আর \(M_{40}\in[\mathbf{0.2343},\mathbf{3.8617}]\), কখনো \(\le0\) নয় (গুণনীয়ক সব ধনাত্মক)। প্রায় অর্ধেক পথে (\(\mathbf{0.5635}\)) \(M_{40}<1\) — অর্থাৎ গড় \(1\) হলেও অধিকাংশ পথ \(1\)-এর নিচে, কারণ গুণফল-বণ্টন ডানদিকে লেজ-টানা (right-skewed)। গড় টানে কম-সংখ্যক বড় মান।
- সংযোগ। এই ধনাত্মক martingale-ই likelihood-ratio martingale ও finance-এর discounted-price martingale-এর প্রোটোটাইপ; তার সর্বদা-ধনাত্মকতা ও ধ্রুব-গড় (\(=1\)) পরে martingale convergence (7.9) — \(M_n\to M_\infty\) a.s. — এবং change-of-measure-এর ভিত্তি।
সারসংক্ষেপ¶
চারটি অংশ একসুতোয় গাঁথে এই অধ্যায়ের যুক্তি-শৃঙ্খল — martingale → stopping → optional sampling (ও তার শর্ত) → গুণাত্মক রূপ:
| অংশ | দাবি | মূল সংখ্যা |
|---|---|---|
| ৫.১ | symmetric walk martingale; \(\mathbb E[S_n]=0\) সব \(n\)-এ | \(\mathbb E[S_{50}]=\mathbf{-0.0034}\), \(\max_n\lvert\mathbb E[S_n]\rvert=\mathbf{0.0245}\), \(\mathrm{sd}=\mathbf{7.08}\) |
| ৫.২ | gambler's ruin; optional stopping খাটে | \(\mathbb P(+4)=\mathbf{0.6654}\) (\(\approx\tfrac{8}{12}\)), \(\mathbb E[S_\tau]=\mathbf{-0.015}\) (\(\approx0\)), \(\mathbb E[\tau]=\mathbf{31.99}\) (\(\approx32\)) |
| ৫.৩ | first passage to \(+1\); optional stopping ভাঙে | \(\mathbb E[S_\tau]=\mathbf{+1.0000}\ne0\); cap-hit \(\mathbf{0.27\%}\); \(\mathbb E[\tau]=\infty\) |
| ৫.৪ | product martingale; \(\mathbb E[M_n]=1\) | \(\mathbb E[M_{40}]=\mathbf{1.0000}\), \(\mathrm{sd}=\mathbf{0.3244}\) (\(\approx0.3241\)) |
একই মূল ধারণা — \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) থেকে ধ্রুব-গড় \(\mathbb E[X_n]=\mathbb E[X_0]\) — চার মুখে ধরা দিল। যোগাত্মক walk-এ গড় সব সময়ে শূন্য, যদিও পথ \(\sqrt n\)-মাপে দোলে (৫.১); সেই martingale-কে একটা stopping time-এ থামালে — শর্ত মিটলে — গড় থামার পরেও সংরক্ষিত থাকে, যা gambler's ruin-এর \(\mathbb P(+b)=\tfrac{a}{a+b}\) ও \(\mathbb E[\tau]=ab\) পিন করে (৫.২); কিন্তু শর্ত (\(\mathbb E[\tau]<\infty\)) ভাঙলে — first passage-এ — সেই সংরক্ষণ ভেঙে \(\mathbb E[S_\tau]=1\ne0\) হয়ে যায়, যা optional stopping theorem একটি শর্তসাপেক্ষ উপপাদ্য এই কেন্দ্রীয় সতর্কবার্তা দেয় (৫.৩); আর একই ধ্রুব-গড় গুণাত্মক কাঠামোতেও (\(\mathbb E[M_n]=1\), সর্বদা ধনাত্মক, কম ছড়ানো) টিকে থাকে (৫.৪)। একটিমাত্র seed (20260619), একটিমাত্র draw-ক্রম — martingale-এর সংজ্ঞা থেকে optional sampling ও তার সীমা পর্যন্ত গোটা শৃঙ্খল সংখ্যায় ধরা পড়ল, এবং এটিই 7.9-এর martingale convergence ও Doob's inequalities-এর সরাসরি প্রস্তুতি।
৬ · ভিজ্যুয়ালাইজেশন¶
§১–৫-এর গোটা martingale (মার্টিঙ্গেল)-তত্ত্ব এতক্ষণ চলেছে শর্তাধীন প্রত্যাশা, \(\sigma\)-বীজগণিত আর অসমতার ভাষায় — বিমূর্ত, কিন্তু প্রতিটি বিবৃতির পিছনে আছে একটা ভীষণ দৃশ্যমান ছবি: এলোমেলো-হাঁটা পথ কীভাবে ছড়ায়, কোথায় থামে, কোথায় ন্যায্যতা টিকে থাকে আর কোথায় ভেঙে পড়ে। এই অংশে চারটে ছবি সেই স্বজ্ঞাকে চোখের সামনে এনে দেয়। প্রতিটি ছবি একই বীজে (np.random.default_rng(20260619)) সিমুলেট করা, তাই পুনরুৎপাদনযোগ্য — আপনি নিজে কোড চালালে হুবহু একই পথ পাবেন। ছবির ভেতরের সব লেখা ইংরেজিতে (matplotlib-এ বাংলা হরফ বিশ্বস্তভাবে আসে না), কিন্তু তার পাঠ ও তাৎপর্য নিচের বাংলা গদ্যে গুছিয়ে দেওয়া। চারটে ছবি একসঙ্গে গল্পের একটা চাপ তৈরি করে: প্রথমে martingale-এর সংজ্ঞা ("গড় সমতল, ছড়ানো বাড়ে"), তারপর optional stopping-এর সফল প্রয়োগ (gambler's ruin), তারপর তার নাটকীয় ব্যর্থতা (অসীম প্রত্যাশিত থামার সময়), আর শেষে Doob পচন — submartingale-কে martingale ও ক্ষতিপূরকে ভাঙা।
৬.১ martingale পথ — গড় সমতল, ছড়ানো বাড়ে¶
প্রথম ছবিটা martingale-এর হৃদয় ছুঁয়ে দেখায়। নিরপেক্ষ মুদ্রা-হাঁটা \(S_n=\sum_{i=1}^n\xi_i\) (\(\xi_i=\pm1\) সমসম্ভাব্য) থেকে ১২টা স্বাধীন পথ আঁকা। চোখে পড়ে দুটো জিনিস একসঙ্গে। এক, কোনো একটা পথ কোথায় যাবে তা মোটেই অনুমেয় নয় — কেউ উপরে ভাসে, কেউ নিচে ডোবে। দুই, তবু পুরো গুচ্ছটা গড়ে \(0\)-এর গা ঘেঁষেই থাকে: কালো ভাঙা-রেখা \(\mathbb E[S_n]=0\) একদম সমতল। এটাই martingale-সমতা \(\mathbb E[S_{n+1}\mid\mathcal F_n]=S_n\)-এর প্রত্যক্ষ ছাপ — tower property দিয়ে \(\mathbb E[S_n]=\mathbb E[S_0]=0\) সব \(n\)-তে, যত দূরই হাঁটা যাক।
কিন্তু "গড় সমতল" মানে "কিছু ঘটছে না" নয়। ধূসর বিন্দু-রেখা দুটো \(\pm\sqrt{n}\) দেখায় — এক প্রমিত বিচ্যুতির খাম, কারণ \(\operatorname{Var}(S_n)=n\), তাই \(\operatorname{sd}(S_n)=\sqrt n\)। সময়ের সঙ্গে এই খাম ক্রমশ চওড়া হয়: গড় না-সরলেও অনিশ্চয়তা বাড়ে। martingale তাই "স্থির" নয়, "ন্যায্য" — প্রতি ধাপের প্রত্যাশিত লাভ ঠিক শূন্য, কিন্তু ঝুঁকি জমতে থাকে। এই দুই বৈশিষ্ট্যের টানাপোড়েন — সমতল কেন্দ্র বনাম বর্ধমান ছড়ানো — পরের তিন ছবিরই ভিত্তি।
steps, n_paths = 60, 12
n = np.arange(steps + 1)
xi = rng.choice([-1, 1], size=(n_paths, steps))
S = np.zeros((n_paths, steps + 1), dtype=int)
S[:, 1:] = xi.cumsum(axis=1) # S_0=0, then partial sums
for k in range(n_paths):
ax.plot(n, S[k], lw=1.1, alpha=0.8, color=plt.cm.viridis(k / n_paths))
ax.plot(n, np.sqrt(n), color=GREY, ls=":") # +1 s.d. envelope
ax.plot(n, -np.sqrt(n), color=GREY, ls=":")
ax.axhline(0.0, color="black", ls="--") # E[S_n] = 0 stays flat
![১২টি নিরপেক্ষ random-walk martingale পথ; গড় \(\mathbb E[S_n]=0\) সমতল, ছড়ানো \(\sqrt n\) হারে বাড়ে।](../_assets/7-8-martingale-paths.png)
৬.২ optional stopping সফল — gambler's ruin¶
দ্বিতীয় ছবিটা optional stopping theorem (ঐচ্ছিক-থামার উপপাদ্য)-এর সবচেয়ে সুন্দর প্রয়োগ — gambler's ruin (জুয়াড়ির সর্বনাশ)। খেলোয়াড় \(0\) থেকে শুরু করে; থামে যখন হয় ভাগ্য \(+4\)-এ ওঠে (জয়, \(b=4\)) নয়তো \(-8\)-এ নামে (সর্বনাশ, \(a=8\))। প্রতিটি পথ তার থামার বিন্দু stopping time (থামার সময়) \(\tau\)-তে একটা বিন্দু দিয়ে চিহ্নিত — সবুজ হলে জয়, লাল হলে সর্বনাশ। লক্ষণীয়, \(\tau\) একটা বৈধ stopping time, কারণ "এখনই থামব কিনা" সিদ্ধান্ত শুধু এ-পর্যন্ত দেখা পথের উপরেই নির্ভর করে, ভবিষ্যৎ-জ্ঞান লাগে না।
এখন জাদুটা। \((S_n)\) martingale আর \(S_\tau\) পরিবদ্ধ (\(-8\le S_\tau\le 4\)), তাই optional stopping বলে \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\)। কিন্তু \(S_\tau\) মাত্র দুটো মান নেয়: \(+4\) (সম্ভাবনা \(p\)) বা \(-8\) (সম্ভাবনা \(1-p\))। তাই \(0=4p-8(1-p)\), যা মেলালে \(p=\tfrac{8}{12}=\tfrac{a}{a+b}=\tfrac23\)। অর্থাৎ একটামাত্র সমীকরণ — \(\mathbb E[S_\tau]=0\) — থেকে জয়ের সম্ভাবনা সরাসরি বেরিয়ে আসে, কোনো কঠিন পুনরাবৃত্ত হিসাব ছাড়াই। ছবিতে দেখুন কাছের (\(+4\)) বাধা দূরের (\(-8\)) বাধার চেয়ে বেশি পথ টানছে — এই জ্যামিতিই \(\tfrac23\) বনাম \(\tfrac13\) অনুপাতের মূল।
lo, hi = -8, 4 # ruin and win barriers
for k in range(n_paths):
S = walk(max_steps) # one symmetric +/-1 walk
t = np.where((S >= hi) | (S <= lo))[0][0] # first barrier hit = tau
path = S[:t + 1]
col = GREEN if path[-1] >= hi else RED
ax.plot(np.arange(t + 1), path, color=col)
ax.plot(t, path[-1], "o", color=col) # mark the stopping point
ax.axhline(hi, color=GREEN, ls="--") # P(hit +4) = a/(a+b) = 2/3, so E[S_tau]=0
ax.axhline(lo, color=RED, ls="--")

৬.৩ optional stopping ভেঙে পড়ে — অসীম থামার সময়¶
তৃতীয় ছবিটা সমান গুরুত্বপূর্ণ: কখন উপপাদ্যটা ব্যর্থ হয়। এখানে \(\tau=\) "\(+1\)-এ প্রথম পৌঁছানোর সময়"। নিরপেক্ষ হাঁটা recurrent (পুনরাবৃত্ত) বলে \(+1\)-এ পৌঁছানো নিশ্চিত (সম্ভাবনা \(1\)), তাই \(S_\tau=1\) সবসময় — মান একটাই, ছড়ানো নেই। তাহলে কি \(\mathbb E[S_\tau]=1\)? কিন্তু \(\mathbb E[S_0]=0\)! optional stopping তাহলে এখানে \(0=1\) বলবে — যা অসম্ভব। উপপাদ্যটা ভাঙল কোথায়?
ছবি উত্তরটা চিৎকার করে বলে। দুটো পথ আঁকা: একটা \(+1\) ছোঁয়ার আগে \(-27\)-এ নামে, আরেকটা ভয়াবহভাবে \(-101\) পর্যন্ত ডুবে যায়, আর তা ঘটে কয়েক হাজার ধাপ পরে (\(\tau\approx 485\) ও \(\tau\approx 4291\))। এটাই সূত্র: \(+1\) ছোঁয়া নিশ্চিত হলেও তাতে কত সময় লাগবে তার প্রত্যাশা অসীম — \(\mathbb E[\tau]=\infty\)। optional stopping-এর শর্ত (যেমন \(\tau\) পরিবদ্ধ, বা থামা-পর্যন্ত প্রক্রিয়াটি uniformly integrable) এখানে গুঁড়িয়ে যায়, কারণ গভীর-ঋণাত্মক ভ্রমণ যত-বড়-ইচ্ছা হতে পারে। শিক্ষা: \(\mathbb E[X_\tau]=\mathbb E[X_0]\) এমনি-এমনি খাটে না; \(\tau\)-এর উপর নিয়ন্ত্রণ-শর্ত আবশ্যক। এই একটা পাল্টা-উদাহরণ মনে রাখলে উপপাদ্যটা যান্ত্রিকভাবে প্রয়োগ করার ভুল আর হবে না।
target = 1
S = walk(big) # very long symmetric walk
t = np.where(S >= target)[0][0] # tau = first hit of +1
path = S[:t + 1]
ax.plot(np.arange(t + 1), path) # dips to min(path) (e.g. -101) before the hit
ax.plot(t, path[-1], "o") # S_tau = 1 always...
ax.axhline(target, color=GREEN, ls="--") # ...but E[tau]=inf => E[S_tau]=1 != 0
![\(+1\)-এ প্রথম পৌঁছানো: \(S_\tau=1\) সর্বদা, কিন্তু গভীর ঋণাত্মক ভ্রমণে \(\mathbb E[\tau]=\infty\), তাই \(\mathbb E[S_\tau]\neq0\)।](../_assets/7-8-optional-stopping-fails.png)
৬.৪ Doob পচন — submartingale = martingale + ক্ষতিপূরক¶
শেষ ছবিটা Doob decomposition (ডুব পচন) চোখের সামনে খুলে দেয়। \(S_n^2\) নিন। যেহেতু \(\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+1\ge S_n^2\) (এক ধাপে ভেদ ঠিক \(1\) বাড়ে), \((S_n^2)\) একটা submartingale (সাব-মার্টিঙ্গেল) — গড়ে উপরে টানে। নীল রেখায় দেখুন: \(S_n^2\) এবড়োখেবড়োভাবে লাফায় (যখন \(S_n\) শূন্যে ফেরে, \(S_n^2\)ও \(0\)-এ নামে), কিন্তু সামগ্রিক প্রবণতা ঊর্ধ্বমুখী।
Doob পচন বলে যেকোনো submartingale-কে অনন্যভাবে দুটো অংশে ভাঙা যায়: একটা martingale যোগ একটা বর্ধমান predictable (পূর্বানুমেয়) compensator (ক্ষতিপূরক)। এখানে হিসাব পরিষ্কার — ক্ষতিপূরক \(A_n=n\) (কমলা সরলরেখা), কারণ প্রতি ধাপের প্রত্যাশিত বৃদ্ধি ঠিক \(1\), আর সেই অনুমেয় বৃদ্ধি জমে \(A_n=n\) হয়; বাকিটা martingale \(M_n=S_n^2-n\) (সবুজ রেখা)। সবুজ রেখা \(0\)-এর চারপাশে ওঠানামা করে কিন্তু কোনো প্রবণতা নেই — ঠিক যা martingale-এর কাছে আশা করা যায় (\(\mathbb E[M_n]=0\))। তিন রেখা একসঙ্গে সমীকরণটা দৃশ্যমান করে: প্রতি \(n\)-তে \(\text{(নীল)}=\text{(সবুজ)}+\text{(কমলা)}\), অর্থাৎ এবড়োখেবড়ো বৃদ্ধি = বিশুদ্ধ ভাগ্য (martingale) + অনুমেয় প্রবণতা (ক্ষতিপূরক)। এই বিভাজনই ভেদ-প্রক্রিয়া (variance process), stochastic calculus আর quadratic variation-এর বীজ।
S = walk(60)
n = np.arange(len(S))
sub = S ** 2 # submartingale S_n^2 (jagged, rising)
comp = n.astype(float) # predictable compensator A_n = n
mart = sub - n # martingale part M_n = S_n^2 - n
ax.plot(n, sub, color=BLUE, marker="o", label=r"submartingale $S_n^2$")
ax.plot(n, comp, color=ORANGE, ls="--", label=r"compensator $A_n = n$")
ax.plot(n, mart, color=GREEN, label=r"martingale $M_n = S_n^2 - n$")
# S_n^2 = (S_n^2 - n) + n ==> submartingale = martingale + compensator

৭ · অনুশীলনী¶
নিচের অনুশীলনীগুলো অধ্যায়ের কেন্দ্রীয় বস্তু martingale (মার্টিঙ্গেল — ন্যায্য খেলা)-কে চার দিক থেকে যাচাই করে: কাঠামো (filtration \((\mathcal F_n)\), adapted vs predictable, এবং martingale-এর তিন শর্ত — integrability, adapted, \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\)); মূল হাতিয়ার (martingale transform \((H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})\) — "ন্যায্য খেলা হারানো যায় না"); stopping time \(\tau\) ও stopped process \(X_{n\wedge\tau}\); optional stopping theorem (OST) \(\mathbb E[X_\tau]=\mathbb E[X_0]\) — তার তিন hypothesis-গুচ্ছ, gambler's ruin প্রয়োগ, ও hypothesis ভাঙলে failure; এবং Doob decomposition (submartingale = martingale + predictable বর্ধমান compensator)। সমস্যাগুলো চার দলে সাজানো — ক (ধারণাগত), খ (গণনামূলক), গ (প্রমাণভিত্তিক), ঘ (কোডিং)। প্রতিটির শিরোনামে কঠিনতা-চিহ্ন (difficulty tag): ★ মৌলিক, ★★ মাঝারি, ★★★ গভীর। প্রতিটিতে একটি Hint: দেওয়া আছে।
পূর্ণাঙ্গ সমাধান (ধাপে-ধাপে):
_solutions/07-08-martingales-solutions.md। আগে নিজে চেষ্টা করুন, তারপর মেলান।
প্রসঙ্গত গোটা অংশে একটা filtered probability space \((\Omega,\mathcal F,(\mathcal F_n)_{n\ge0},\mathbb P)\) ধরা; random variable বলতে measurable \(X:\Omega\to\mathbb R\) (7.3), \(\mathbb E[X]=\int_\Omega X\,d\mathbb P\) (7.4), \(X\in L^1\iff\mathbb E\lvert X\rvert<\infty\)। একটা process \((X_n)\) adapted যদি \(X_n\) \(\mathcal F_n\)-measurable, predictable যদি \(H_n\) \(\mathcal F_{n-1}\)-measurable। \((X_n)\) একটা martingale যদি তা integrable, adapted, এবং \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s. (\(\ge\) হলে submartingale, \(\le\) হলে supermartingale)। সর্বত্র conditioning-এ \(\mid\) (raw উল্লম্ব-দণ্ড নয়), \(\lvert\cdot\rvert\) পরম-মান, \(\lVert\cdot\rVert\) norm। সব সিমুলেশন seed np.random.default_rng(20260619)-এ চালানো, যাতে সংখ্যাগুলো পুনরুৎপাদনযোগ্য থাকে।
ক · ধারণাগত¶
অনুশীলন ১ (★)¶
একটা integrable, adapted process \((X_n)\) কখন একটা martingale (মার্টিঙ্গেল) — অর্থাৎ "ন্যায্য খেলা" — তা ঠিক তিনটি শর্তে দাঁড়ায়। (ক) তিনটি শর্ত হুবহু লিখুন: (i) integrability, (ii) adapted, (iii) martingale property (\(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\)) — এবং এক বাক্যে বলুন প্রতিটি কেন দরকার (যেমন integrability না-থাকলে \(\mathbb E[\cdot\mid\mathcal F_n]\) সংজ্ঞায়িতই নয়, adapted না-হলে "\(=X_n\)" তুলনাই অর্থহীন)। (খ) submartingale ও supermartingale-এর সংজ্ঞা লিখুন (শর্ত iii-তে "\(=\)"-এর বদলে যথাক্রমে কী), এবং কোনটা "গড়ে বাড়ে", কোনটা "গড়ে কমে" তা চিহ্নিত করুন। (গ) এক বাক্যে: কেন martingale মানে "বায়াসহীন", কিন্তু "নিশ্চল" নয় — অর্থাৎ \((X_n)\) দিব্যি দুলতে-লাফাতে পারে, শর্ত কেবল পরবর্তী পদক্ষেপের গড় (বর্তমান তথ্যের সাপেক্ষে) শূন্য।
Hint: তিন শর্ত — (i) \(X_n\in L^1\) (নইলে শর্তাধীন প্রত্যাশা অর্থহীন); (ii) \(X_n\) \(\mathcal F_n\)-measurable ("এখনই জানা"); (iii) \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) ("আগামীকালের সেরা পূর্বাভাস = আজকের মান")। \(\ge\) ⇒ submartingale (পক্ষে-ঝোঁকা, গড়ে বাড়ে), \(\le\) ⇒ supermartingale (বিপক্ষে-ঝোঁকা, গড়ে কমে)। "বায়াসহীন": প্রতি ধাপের গড়-বৃদ্ধি শূন্য — কিন্তু পথ যত-খুশি দুলতে পারে। (← §২.৩)
অনুশীলন ২ (★)¶
একটা martingale \((X_n)\) ও একটা stopping time (থামার সময়) \(\tau\) নিলে stopped process (থামানো প্রক্রিয়া) \(X_n^\tau:=X_{n\wedge\tau}\) আবার একটা martingale — এই কথাটাই OST-এর ভিত্তি। (ক) এক-দুই বাক্যে স্বজ্ঞা দিন কেন থামালেও ন্যায্যতা টেকে — অর্থাৎ "\(\tau\)-তে থেমে যাওয়া" নিজেই কেন একটা ন্যায্য (predictable) বাজি-কৌশল, কোনো প্রতারণা নয়। (খ) দেখান "থামা" আসলে একটা martingale transform — বাজি \(H_n=\mathbf 1_{\{\tau\ge n\}}\) ("\(\tau\) পর্যন্ত প্রতি ধাপে এক-একক বাজি, তারপর শূন্য") নিলে \(X_{n\wedge\tau}-X_0=(H\cdot X)_n\); এবং যুক্তি দিন কেন এই \(H_n\) predictable (অর্থাৎ \(\{\tau\ge n\}\in\mathcal F_{n-1}\) কেন)। (গ) এক বাক্যে: \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) প্রতিটি স্থির \(n\)-তে খাটলেও, কেন এটি এখনও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) নয় — কোথায় বাড়তি যত্ন লাগে।
Hint: (ক) থামা একটা valid কৌশল — প্রতি ধাপে আপনি জানেন থেমেছেন কিনা, তাই ন্যায্যতা ভাঙে না। (খ) \(\{\tau\ge n\}=\{\tau\le n-1\}^c\), আর \(\{\tau\le n-1\}\in\mathcal F_{n-1}\) (stopping time-এর সংজ্ঞা), তাই পরিপূরকও \(\mathcal F_{n-1}\)-এ — \(H_n\) predictable; martingale transform (§২.৫) থেকেই \(X_{n\wedge\tau}\) martingale। (গ) \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) থেকে \(\mathbb E[X_\tau]=\mathbb E[X_0]\) পেতে \(n\to\infty\)-সীমা পার করতে হয় — সেখানেই OST-এর hypothesis (DCT/MCT) লাগে। (← §২.৭)
অনুশীলন ৩ (★★)¶
optional stopping theorem (OST) বলে \(\mathbb E[X_\tau]=\mathbb E[X_0]\) — কিন্তু শর্তসাপেক্ষে। (ক) তিন hypothesis-গুচ্ছের যেকোনো একটি লিখুন যার অধীনে OST সত্য (যেমন: \(\tau\) bounded; বা \(X\) bounded ও \(\tau<\infty\); বা \(\mathbb E[\tau]<\infty\) ও bounded increments), এবং এক বাক্যে বলুন প্রতিটি শর্ত আসলে কোন সীমা-বিনিময় (\(n\to\infty\)-এ \(\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]\)) বৈধ করতে কাজ করে। (খ) নিচের ব্যর্থতাটি বিশ্লেষণ করুন: ন্যায্য simple random walk \(S_n\) (\(S_0=0\)), \(\tau=\) "প্রথম যখন \(S_n=1\)"। জানা যায় \(\tau<\infty\) a.s., তাই \(S_\tau\equiv1\) — অর্থাৎ \(\mathbb E[S_\tau]=1\ne0=\mathbb E[S_0]\)। কোন hypothesis-টি ভেঙেছে তা নাম ধরে বলুন (এক বা একাধিক)। (গ) এক বাক্যে: এই ব্যর্থতা কীভাবে বিখ্যাত doubling (martingale) কৌশল-এর "অমোঘ জয়"-কে একটা বিভ্রম হিসেবে ব্যাখ্যা করে।
Hint: (ক) তিনটির যেকোনো একটি যথেষ্ট; প্রতিটিই \(\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]\) সীমা-বিনিময়কে বৈধ করে — (ক) তুচ্ছভাবে (\(n\ge N\)-এ \(X_{n\wedge\tau}=X_\tau\)), (খ) bounded convergence (DCT), (গ) bounded increments + \(\mathbb E[\tau]<\infty\) দিয়ে dominating function। (খ) first-passage-এ সব ভাঙে: \(\tau\) unbounded, \(S\) unbounded, এবং \(\mathbb E[\tau]=\infty\) — যেকোনো একটিই যথেষ্ট। (গ) "নিশ্চিত ৳১ লাভ" পেতে দরকার অসীম পুঁজি ও অসীম সময় (\(\mathbb E[\tau]=\infty\)), যা বাস্তবে নেই। (← §২.৮)
খ · গণনামূলক¶
অনুশীলন ৪ (★★)¶
gambler's ruin (জুয়াড়ির সর্বনাশ) — দুই বাধায় থামা। নিরপেক্ষ simple random walk \(S_n\) শুরু \(S_0=0\), দুই বাধা: নিচে \(-a\), উপরে \(+b\) (এখানে \(a=8,\ b=4\)); \(\tau=\) "প্রথম যখন \(-a\) অথবা \(+b\)-এ পৌঁছাই"। martingale \(S_n\) ও \(S_n^2-n\) ব্যবহার করে কষুন: (ক) প্রথমে OST প্রয়োগযোগ্যতা যাচাই করুন (কোন hypothesis-গুচ্ছ মেটে — \(\mathbb E[\tau]<\infty\) ও bounded increments \(\lvert S_n-S_{n-1}\rvert=1\)), তারপর \(\mathbb E[S_\tau]=\mathbb E[S_0]=0\) ও দুই-মান \(S_\tau\in\{-a,+b\}\) ভেঙে \(\mathbb P(\text{hit }+b)\) বের করুন। (খ) \(S_n^2-n\) martingale-এ OST লাগিয়ে \(\mathbb E[\tau]\) বের করুন (\(\mathbb E[\tau]=\mathbb E[S_\tau^2]\) থেকে শুরু করে)। (গ) সংখ্যা দুটি লিখুন এবং সাধারণ সূত্রে (\(a,b\)-তে) প্রকাশ করুন।
Hint: (ক) \(0=\mathbb E[S_\tau]=(-a)(1-p)+(b)p\) যেখানে \(p=\mathbb P(\text{hit }+b)\), তাই \(p=\frac{a}{a+b}=\frac{8}{12}=\frac23\approx0.6667\)। (খ) OST-এ \(\mathbb E[S_\tau^2-\tau]=0\Rightarrow\mathbb E[\tau]=\mathbb E[S_\tau^2]=b^2p+a^2(1-p)=\frac{ab(a+b)}{a+b}=ab\), তাই \(\mathbb E[\tau]=ab=8\times4=32\)। (গ) \(\mathbb P(+b)=\frac{a}{a+b}=\frac23\), \(\mathbb E[\tau]=ab=32\)। (← §২.৮)
অনুশীলন ৫ (★)¶
একটা প্রক্রিয়া (sub/super)martingale কিনা যাচাই করুন — সংজ্ঞা প্রয়োগ করে। \(\eta_1,\eta_2,\dots\) স্বাধীন, \(\eta_k\ge0\), \(\mathbb E[\eta_k]=1\); \(M_0=1\), \(M_n=\prod_{k=1}^n\eta_k\), \(\mathcal F_n=\sigma(\eta_1,\dots,\eta_n)\) (product martingale / গুণফল)। (ক) তিন শর্ত (integrability, adapted, martingale property) যাচাই করে দেখান \((M_n)\) একটা martingale — মূল ধাপে pull-out (\(M_n\) \(\mathcal F_n\)-measurable) ও independence (\(\eta_{n+1}\perp\mathcal F_n\), \(\mathbb E[\eta_{n+1}]=1\)) ব্যবহার করুন; এবং \(\mathbb E[M_n]\) বের করুন। (খ) এবার ধরুন \(\mathbb E[\eta_k]=\mu\) সাধারণভাবে: কোন \(\mu\)-তে \((M_n)\) submartingale, কোন \(\mu\)-তে supermartingale, কোন \(\mu\)-তে martingale (ধরে নিন \(M_n\ge0\))? (গ) এক বাক্যে: কেন একই প্রক্রিয়া \(\log M_n=\sum\log\eta_k\) সাধারণত martingale নয় (Jensen-এর দিকে ইঙ্গিত করুন)।
Hint: (ক) \(\mathbb E[M_{n+1}\mid\mathcal F_n]=\mathbb E[M_n\eta_{n+1}\mid\mathcal F_n]=M_n\,\mathbb E[\eta_{n+1}]=M_n\cdot1=M_n\) (pull-out + independence); integrability: \(\mathbb E\lvert M_n\rvert=\mathbb E[M_n]=\prod\mathbb E[\eta_k]=1<\infty\), তাই \(\mathbb E[M_n]=1\) সব \(n\)-তে। (খ) \(\mathbb E[M_{n+1}\mid\mathcal F_n]=\mu M_n\), তাই \(\mu>1\) ⇒ sub, \(\mu<1\) ⇒ super, \(\mu=1\) ⇒ martingale। (গ) \(\log\) concave ⇒ Jensen-এ \(\mathbb E[\log\eta]\le\log\mathbb E[\eta]=0\), তাই \(\log M_n\) গড়ে কমে (supermartingale), সমান নয়। (← §২.৪)
অনুশীলন ৬ (★★)¶
Doob decomposition — compensator \(A_n\) বের করুন। \(S_n\) নিরপেক্ষ simple random walk (\(\xi_k=\pm1\) সমসম্ভাব্য, \(\mathbb E[\xi_k]=0\), \(\xi_k^2=1\)), \(S_0=0\)। (ক) \(X_n:=S_n^2\) যে একটা submartingale তা \(\mathbb E[X_{n+1}\mid\mathcal F_n]\) কষে দেখান (\(S_{n+1}^2=S_n^2+2S_n\xi_{n+1}+\xi_{n+1}^2\) ভেঙে প্রতি পদে শর্তাধীন প্রত্যাশা)। (খ) Doob decomposition \(X_n=M_n+A_n\)-এর predictable বর্ধমান compensator \(A_n\) বের করুন (সংজ্ঞা \(A_n=\sum_{k=1}^n(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})\) ব্যবহার করে), এবং martingale-অংশ \(M_n=X_n-A_n\) লিখুন। (গ) এক বাক্যে: এই \(A_n\)-কে quadratic variation \(\langle S\rangle_n\) বলা হয় কেন — অর্থাৎ এটি কোন জমা-হওয়া রাশি মাপে, এবং \(\mathbb E[S_n^2]\)-এর সঙ্গে এর সম্পর্ক কী।
Hint: (ক) \(\mathbb E[S_{n+1}^2\mid\mathcal F_n]=S_n^2+2S_n\cdot0+1=S_n^2+1\ge S_n^2\) (কারণ \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=0\), \(\mathbb E[\xi_{n+1}^2\mid\mathcal F_n]=1\)) — submartingale। (খ) প্রতি পদ \(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1}=1\), তাই \(A_n=\sum_{k=1}^n 1=n\) (predictable, \(A_n-A_{n-1}=1\ge0\)), আর \(M_n=S_n^2-n\) (martingale)। (গ) \(A_n=\langle S\rangle_n=\sum_k\mathbb E[\xi_k^2\mid\mathcal F_{k-1}]=n\) = জমা-হওয়া শর্তাধীন ভেদ; \(\mathbb E[M_n]=0\Rightarrow\mathbb E[S_n^2]=n=\operatorname{Var}(S_n)\)। (← §২.৯)
গ · প্রমাণভিত্তিক¶
অনুশীলন ৭ (★★)¶
martingale transform একটা martingale — প্রমাণ করুন (pull-out দিয়ে)। \((X_n)\) একটা martingale, \((H_n)_{n\ge1}\) predictable ও bounded (\(\lvert H_n\rvert\le C\)); সংজ্ঞা \((H\cdot X)_n=\sum_{k=1}^n H_k(X_k-X_{k-1})\), \((H\cdot X)_0=0\)। দেখান \((H\cdot X)_n\) আবার একটা martingale। (ক) integrability ও adapted যাচাই করুন: \((H\cdot X)_n\) কেন \(L^1\)-এ (\(H\) bounded, \(X_k\in L^1\)) এবং কেন \(\mathcal F_n\)-measurable। (খ) মূল ধাপ — এক-ধাপের increment \(\Delta_{n+1}=(H\cdot X)_{n+1}-(H\cdot X)_n=H_{n+1}(X_{n+1}-X_n)\)-এর শর্তাধীন প্রত্যাশা \(\mathbb E[\Delta_{n+1}\mid\mathcal F_n]\) কষুন; দেখান pull-out-এ \(H_{n+1}\) (যা \(\mathcal F_n\)-measurable, কারণ predictable) বেরিয়ে আসে এবং \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) (martingale property)। (গ) এক বাক্যে: কেন এই প্রমাণ ঠিক "you cannot beat a fair game" — এবং predictability শর্তটি কোথায় সিদ্ধান্তকারী (যদি \(H_{n+1}\) ভবিষ্যৎ "দেখতে" পারত)।
Hint: (খ) \(\mathbb E[\Delta_{n+1}\mid\mathcal F_n]=\mathbb E[H_{n+1}(X_{n+1}-X_n)\mid\mathcal F_n]\overset{\text{pull-out}}{=}H_{n+1}\,\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=H_{n+1}\cdot0=0\) — তাই \(\mathbb E[(H\cdot X)_{n+1}\mid\mathcal F_n]=(H\cdot X)_n\)। (গ) সঞ্চিত মুনাফা গড়ে শূন্য — কোনো predictable কৌশল ন্যায্যতা ভাঙে না; predictability (\(H_{n+1}\) \(\mathcal F_n\)-measurable) ছাড়া pull-out অবৈধ, আর তখন কৌশলটা প্রতারণা (আজকের ফল আগে-জানা)। (← §২.৫, ← 7.7 pull-out)
অনুশীলন ৮ (★★)¶
stopped process \(X_{n\wedge\tau}\) একটা martingale — প্রমাণ করুন। \((X_n)\) martingale ও \(\tau\) stopping time। দেখান \(X_n^\tau:=X_{n\wedge\tau}\) একটা martingale, এবং উপসংহারে \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব \(n\)-তে। (ক) দেখান \(X_{n\wedge\tau}-X_0=(H\cdot X)_n\) যেখানে \(H_n=\mathbf 1_{\{\tau\ge n\}}=\mathbf 1_{\{n\le\tau\}}\) (telescoping যোগফল লিখে যাচাই করুন)। (খ) যুক্তি দিন \(H\) predictable ও bounded — অর্থাৎ \(\{\tau\ge n\}\in\mathcal F_{n-1}\) (stopping time-এর সংজ্ঞা থেকে) এবং \(0\le H_n\le1\)। (গ) অনুশীলন ৭-এর martingale-transform ফল প্রয়োগ করে উপসংহার দিন, এবং এক বাক্যে বলুন কেন super-/submartingale-ও থামালে তা-ই থাকে।
Hint: (ক) \(\sum_{k=1}^n\mathbf 1_{\{\tau\ge k\}}(X_k-X_{k-1})\)-এ \(\tau\ge k\) মানে \(k\)-তম ধাপ এখনো "চালু" — যোগফল ঠিক \(X_{n\wedge\tau}-X_0\) পর্যন্ত telescope করে (থামার পর সব increment-এর সহগ \(0\))। (খ) \(\{\tau\ge n\}=\{\tau\le n-1\}^c\in\mathcal F_{n-1}\) — predictable; \(H_n\in\{0,1\}\) — bounded। (গ) martingale transform-এ predictable bounded \(H\ge0\) হলে super-/sub-ত্ব সংরক্ষিত। (← §২.৭)
অনুশীলন ৯ (★)¶
\(\mathbb E[X_n]=\mathbb E[X_0]\) প্রমাণ করুন — martingale-এ গড় ধ্রুব। \((X_n)\) একটা martingale। (ক) এক-ধাপের ফল দিয়ে দেখান \(\mathbb E[X_{n+1}]=\mathbb E[X_n]\) — মূল ধাপ: total expectation/tower \(\mathbb E[\mathbb E[X_{n+1}\mid\mathcal F_n]]=\mathbb E[X_{n+1}]\) এবং martingale property \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) একত্র করুন। (খ) আরোহণ (induction) দিয়ে উপসংহার দিন \(\mathbb E[X_n]=\mathbb E[X_0]\) সব \(n\)-তে; এবং দেখান submartingale-এ \(\mathbb E[X_n]\) অ-হ্রাসমান, supermartingale-এ অ-বর্ধমান। (গ) এক বাক্যে: এটি কীভাবে "ন্যায্য খেলায় কোনো স্থির সময়ে গড়ে লাভ-ক্ষতি নেই"-র গাণিতিক রূপ — এবং কেন এটি এখনও এলোমেলো \(\tau\)-তে (\(\mathbb E[X_\tau]=\mathbb E[X_0]\)) বলে না।
Hint: (ক) \(\mathbb E[X_{n+1}]=\mathbb E[\mathbb E[X_{n+1}\mid\mathcal F_n]]=\mathbb E[X_n]\) — প্রথম সমতা \(\mathcal H=\{\varnothing,\Omega\}\)-এ tower (7.7), দ্বিতীয়টা martingale property। (খ) \(\mathbb E[X_0]=\mathbb E[X_1]=\cdots=\mathbb E[X_n]\); \(\ge\) হলে \(\mathbb E[X_{n+1}]\ge\mathbb E[X_n]\) (অ-হ্রাসমান)। (গ) স্থির \(n\)-এ গড় অপরিবর্তিত, কিন্তু এলোমেলো (data-dependent) \(\tau\)-তে গড় পার করতে OST-এর hypothesis লাগে (অনুশীলন ৩)। (← §২.৩)
ঘ · কোডিং¶
অনুশীলন ১০ (★★)¶
gambler's ruin সিমুলেট করে \(\mathbb P(+b)=2/3\) ও \(\mathbb E[\tau]=32\) ফিরে পাওয়া। seed np.random.default_rng(20260619), বাধা \(-a=-8,\ +b=+4\), বহু (যেমন \(200{,}000\)) নিরপেক্ষ random walk চালান, প্রতিটি \(-a\) অথবা \(+b\)-এ থামা পর্যন্ত। (ক) তিন রাশি মাপুন: \(\mathbb P(\text{hit }+b)\) (canonical \(\approx0.6667\)), \(\mathbb E[S_\tau]\) (canonical \(\approx0\) — OST), \(\mathbb E[\tau]\) (canonical \(\approx32\))। (খ) তিনটিই §২.৮/§৩-এর তত্ত্বের (\(\frac{a}{a+b}=\frac23\), \(0\), \(ab=32\)) সঙ্গে মেলান (একটা ছোট তুলনা-টেবিল ছাপুন)। (গ) এক বাক্যে কোড-comment-এ লিখুন কেন \(\mathbb E[S_\tau]\approx0\) এখানে বৈধ — কোন OST-শর্ত মিটছে।
Hint:
import numpy as np
rng = np.random.default_rng(20260619)
a, b, trials = 8, 4, 200_000
hitB = np.zeros(trials); Stau = np.zeros(trials); tau = np.zeros(trials)
for t in range(trials):
s, n = 0, 0
while -a < s < b: # দুই বাধার মাঝে যতক্ষণ
s += rng.choice([-1, 1]); n += 1
hitB[t] = (s == b); Stau[t] = s; tau[t] = n
print("P(hit +b) ≈", round(hitB.mean(), 4)) # ≈ 0.667 (= a/(a+b) = 2/3)
print("E[S_tau] ≈", round(Stau.mean(), 4)) # ≈ 0 (OST: E[τ]<∞ ও |ΔS|=1)
print("E[tau] ≈", round(tau.mean(), 2)) # ≈ 32 (= ab)
অনুশীলন ১১ (★★)¶
optional-stopping failure দেখানো — first passage to \(+1\), \(\mathbb E[S_\tau]=1\)। seed 20260619, নিরপেক্ষ simple random walk (\(S_0=0\)), \(\tau=\) "প্রথম যখন \(S_n=1\)"। \(\mathbb E[\tau]=\infty\) বলে কম্পিউটারে \(\tau\) পুরো চালানো যায় না; বরং সময়-সীমা \(T\) বাড়িয়ে stopped-process \(S_{T\wedge\tau}\)-এর আচরণ দেখুন। (ক) কয়েকটা বাড়তে-থাকা \(T\)-তে (যেমন \(100,1000,10000\)) বহু path চালিয়ে \(\mathbb P(\tau\le T)\) ও \(\mathbb E[S_{T\wedge\tau}]\) ছাপুন; দেখান স্থির \(T\)-তে \(\mathbb E[S_{T\wedge\tau}]\approx0\) (martingale অটুট), যদিও \(\mathbb P(\tau\le T)\) ধীরে-ধীরে \(1\)-এর দিকে ওঠে। (খ) এক বাক্যে ব্যাখ্যা করুন কেন \(T\to\infty\)-এর সীমায় \(S_\tau\equiv1\) হয়ে \(\mathbb E[S_\tau]=1\ne0\) — অর্থাৎ "ভর কোথায় পালায়"। (গ) এক বাক্যে: কোন OST-শর্তগুলো ভেঙেছে এবং এটি কোন limit-interchange (DCT) ব্যর্থতার মুখোশ।
Hint:
import numpy as np
rng = np.random.default_rng(20260619)
paths = 100_000
for T in (100, 1_000, 10_000):
s = np.zeros(paths); stopped = np.zeros(paths, bool)
for _ in range(T):
live = ~stopped
s[live] += rng.choice([-1, 1], size=live.sum())
stopped |= (s >= 1) # +1 ছুঁলে থামা
print(f"T={T:>6}: P(τ≤T)≈{stopped.mean():.3f}, E[S_(T∧τ)]≈{s.mean():+.3f}")
# স্থির T-তে E[S_(T∧τ)]≈0; শুধু T→∞ সীমায় S_τ≡1 ⇒ E[S_τ]=1≠0 (DCT-ভঙ্গ)
অনুশীলন ১২ (★★)¶
\(S_n^2-n\) সিমুলেট করে গড়-শূন্য/সমতল যাচাই। seed 20260619, বহু (যেমন \(400{,}000\)) নিরপেক্ষ random-walk path প্রতিটি \(40\) ধাপ চালিয়ে প্রতি \(n\)-তে \(\mathbb E[S_n^2]\) আনুমান করুন। (ক) দেখান \(\mathbb E[S_n^2]\approx n\) সব \(n\)-তে (যেমন \(\mathbb E[S_5^2]\approx5\), \(\mathbb E[S_{40}^2]\approx40\)), তাই \(\mathbb E[S_n^2-n]\approx0\) — \(M_n=S_n^2-n\) একটা গড়-শূন্য martingale। (খ) \(\max_n\lvert\mathbb E[S_n^2]-n\rvert\approx0\) ছাপিয়ে নিশ্চিত করুন রেখাটি সমতল (compensator ঠিক \(A_n=n\))। (গ) এক বাক্যে কোড-comment-এ লিখুন এটি কীভাবে Doob decomposition \(S_n^2=(S_n^2-n)+n\)-কে সংখ্যায় নিশ্চিত করে, এবং \(\mathbb E[S_n^2]=n\) কেন ঠিক \(\operatorname{Var}(S_n)\)।
Hint:
import numpy as np
rng = np.random.default_rng(20260619)
paths, steps = 400_000, 40
xi = rng.choice([-1, 1], size=(paths, steps))
S = xi.cumsum(axis=1)
n = np.arange(1, steps+1)
ES2 = (S**2).mean(axis=0) # E[S_n^2] প্রতি n-এ
print("E[S_5^2] =", round(ES2[4], 3), " (তত্ত্ব 5 )") # ≈ 5
print("E[S_40^2] =", round(ES2[39], 3), " (তত্ত্ব 40)") # ≈ 40
print("max|E[S_n^2 - n]| =", round(np.abs(ES2 - n).max(), 3)) # ≈ 0
# M_n = S_n^2 - n গড়-শূন্য ⇒ Doob: S_n^2 = M_n + n, compensator A_n = n = Var(S_n)
৮ · সারসংক্ষেপ ও সংযোগ¶
এই অধ্যায়ে 7.7-এর একক-σ-algebra শর্তাধীন প্রত্যাশা \(\mathbb E[X\mid\mathcal G]\)-কে সময়ে ছড়িয়ে দেওয়া হয়েছে: তথ্যের জমে-ওঠা প্রবাহকে একটা বর্ধমান σ-algebra-অনুক্রম filtration \((\mathcal F_n)\) দিয়ে ধরে, "ন্যায্য খেলা"-র কঠোর গাণিতিক রূপ martingale গড়া হয়েছে, এবং তার দুই বড় ফল — "ন্যায্য খেলা হারানো যায় না" (martingale transform) ও "কখন থামলে গড় বদলায় না" (optional stopping) — প্রতিষ্ঠা করা হয়েছে।
১. filtration ও martingale। filtration \((\mathcal F_n)_{n\ge0}\) হলো বর্ধমান sub-σ-algebra-অনুক্রম (\(\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\), "তথ্য জমে, হারায় না"); সবচেয়ে স্বাভাবিক উদাহরণ natural filtration \(\mathcal F_n=\sigma(X_0,\dots,X_n)\)। একটা process adapted যদি \(X_n\) \(\mathcal F_n\)-measurable ("এখনই জানা"), predictable যদি \(H_n\) \(\mathcal F_{n-1}\)-measurable ("এক-ধাপ-আগেই জানা", যেমন বাজির আকার)। \((X_n)\) একটা martingale যদি তা integrable, adapted, এবং \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s. (\(\ge\) ⇒ submartingale, গড়ে বাড়ে; \(\le\) ⇒ supermartingale, গড়ে কমে)। tower থেকে \(\mathbb E[X_m\mid\mathcal F_n]=X_n\) (\(m>n\)) ও \(\mathbb E[X_n]=\mathbb E[X_0]\) ধ্রুব; convex \(\varphi\)-তে conditional Jensen martingale→submartingale বানায়। canonical উদাহরণ: mean-0 random walk (\(\mathbb E[S_n]=0\)), mean-1 iid-এর গুণফল (\(\mathbb E[M_n]=1\)), Doob martingale \(X_n=\mathbb E[Y\mid\mathcal F_n]\), likelihood-ratio, Pólya urn।
২. martingale transform — "ন্যায্য খেলা হারানো যায় না"। \(H\) predictable ও bounded হলে martingale transform \((H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})\) আবার একটা martingale — প্রমাণ এক-লাইন pull-out (\(H_{n+1}\) \(\mathcal F_n\)-measurable বলে বের করে \(\mathbb E[X_{n+1}-X_n\mid\mathcal F_n]=0\) গুণ)। অর্থাৎ predictable (অতীত-নির্ভর) কোনো বাজি-কৌশল ন্যায্যতা ভাঙতে পারে না — you cannot beat a fair game; এটিই discrete stochastic integral, আর continuous-time-এ Itô-ইন্টিগ্রালের বিচ্ছিন্ন পূর্বসূরি।
৩. stopping time ও stopped process। stopping time \(\tau\): \(\{\tau\le n\}\in\mathcal F_n\) ("থামার সিদ্ধান্ত কেবল অতীত-তথ্যে"; যেমন hitting time \(\tau_B=\min\{n:X_n\in B\}\))। stopped process \(X_{n\wedge\tau}\) আবার একটা martingale — কারণ "থামা" হলো predictable bounded বাজি \(H_n=\mathbf 1_{\{\tau\ge n\}}\) (\(\{\tau\ge n\}\in\mathcal F_{n-1}\)) দিয়ে একটা martingale transform — তাই \(\mathbb E[X_{n\wedge\tau}]=\mathbb E[X_0]\) সব স্থির \(n\)-তে।
৪. optional stopping theorem ও তার সীমা। OST: martingale ও stopping time \(\tau\)-তে \(\mathbb E[X_\tau]=\mathbb E[X_0]\) — যদি (ক) \(\tau\) bounded, (খ) \(X\) bounded ও \(\tau<\infty\), বা (গ) \(\mathbb E[\tau]<\infty\) ও bounded increments (প্রতিটিই \(n\to\infty\)-এ \(\mathbb E[X_{n\wedge\tau}]\to\mathbb E[X_\tau]\) সীমা-বিনিময়কে DCT/MCT দিয়ে বৈধ করে)। প্রয়োগ — gambler's ruin (\(-a=-8,+b=+4\)): \(\mathbb E[S_\tau]=0\) থেকে \(\mathbb P(\text{hit }+b)=\frac{a}{a+b}=\frac23\approx0.6667\), আর \(S_n^2-n\) martingale থেকে \(\mathbb E[\tau]=ab=32\)। failure — hypothesis ছাড়া: first-passage-to-\(+1\)-এ \(S_\tau\equiv1\), তাই \(\mathbb E[S_\tau]=1\ne0\) (কারণ \(\mathbb E[\tau]=\infty\), \(\tau\) ও \(S\) unbounded) — যা doubling-কৌশলের "অমোঘ জয়"-এর বিভ্রম ব্যাখ্যা করে। নৈতিকতা: \(\mathbb E[X_\tau]=\mathbb E[X_0]\) লেখার আগে সবসময় একটা OST-শর্ত আগে যাচাই করুন।
৫. Doob decomposition। যেকোনো submartingale \(X_n=M_n+A_n\) অনন্যভাবে (a.s.), যেখানে \(M\) martingale (বিশুদ্ধ গোলমাল) ও \(A\) predictable অ-হ্রাসমান compensator (\(A_n=\sum_{k\le n}(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})\), drift) — অর্থাৎ ঝোঁক ও গোলমাল আলাদা। canonical উদাহরণ \(S_n^2=(S_n^2-n)+n\), যেখানে \(A_n=\langle S\rangle_n=n\) ঠিক জমা-হওয়া variance (quadratic variation) — যা gambler's-ruin-এর \(\mathbb E[\tau]\) বের করতে কাজে লাগে।
মূল সংজ্ঞা/উপপাদ্য (mini-list)। - filtration / adapted / predictable: \(\mathcal F_0\subseteq\mathcal F_1\subseteq\cdots\); \(X_n\) \(\mathcal F_n\)-measurable (adapted); \(H_n\) \(\mathcal F_{n-1}\)-measurable (predictable)। - martingale: integrable + adapted + \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) a.s.; \(\ge\) ⇒ submartingale, \(\le\) ⇒ supermartingale; tower ⇒ \(\mathbb E[X_m\mid\mathcal F_n]=X_n\) (\(m>n\)), \(\mathbb E[X_n]=\mathbb E[X_0]\)। - martingale transform: \(H\) predictable, bounded ⇒ \((H\cdot X)_n=\sum_{k\le n}H_k(X_k-X_{k-1})\) martingale (pull-out)। - stopping time: \(\{\tau\le n\}\in\mathcal F_n\); stopped process \(X_{n\wedge\tau}\) martingale (\(H_n=\mathbf 1_{\{\tau\ge n\}}\))। - optional stopping (Doob): \(\mathbb E[X_\tau]=\mathbb E[X_0]\) যদি \(\tau\) bounded, বা \(X\) bounded, বা \(\mathbb E[\tau]<\infty\) ও bounded increments; gambler's ruin \(\mathbb P(+b)=\frac{a}{a+b}=\frac23\), \(\mathbb E[\tau]=ab=32\); failure: first passage \(\mathbb E[S_\tau]=1\ne0\), \(\mathbb E[\tau]=\infty\)। - Doob decomposition: submartingale \(X_n=M_n+A_n\) অনন্য; \(A_n=\sum_k(\mathbb E[X_k\mid\mathcal F_{k-1}]-X_{k-1})\) predictable বর্ধমান; \(S_n^2=(S_n^2-n)+n\), \(\langle S\rangle_n=n\)।
পেছনের সংযোগ: - ← 7.7 (Conditional expectation): এই অধ্যায়ের একমাত্র মৌলিক ইঞ্জিন — martingale-এর সংজ্ঞা \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) আক্ষরিকভাবে একটা conditional-expectation সমীকরণ; tower \(m>n\)-এ \(\mathbb E[X_m\mid\mathcal F_n]=X_n\) টানে, pull-out martingale transform-এর প্রাণ (\(H_k\) বের করা), conditional Jensen convex \(\varphi\)-তে martingale→submartingale বানায়, আর Doob martingale \(X_n=\mathbb E[Y\mid\mathcal F_n]\) সরাসরি 7.7-এর ক্রমবর্ধমান-তথ্যে-অনুমান। - ← 7.6 (Independence, 0–1 law, SLLN): martingale-এর চেনা উদাহরণগুলোর কাঁচামাল — iid increment \(\xi_k\) থেকে random walk \(S_n=\sum\xi_k\) (mean-0 ⇒ martingale), mean-1 iid-এর গুণফল (likelihood-ratio martingale-এর গোড়া); স্বাধীনতা থেকেই \(\mathbb E[\xi_{n+1}\mid\mathcal F_n]=\mathbb E[\xi_{n+1}]\) আসে — martingale-যাচাইয়ের প্রথম ধাপ। - ← 3.5 (Random processes ও random walk): এই অধ্যায়ের স্বজ্ঞাগত মঞ্চ — সেখানকার simple random walk \(S_n=\sum\xi_k\) ও gambler's-ruin-এর elementary রূপকে এখানে measure-তাত্ত্বিকভাবে কঠোর করা হলো; random walk-ই canonical martingale, gambler's ruin-ই OST-এর সরাসরি প্রয়োগ।
সামনের সংযোগ: - → 7.9 (Martingale convergence ও Doob's inequalities): এই অধ্যায়ের সরাসরি পুরস্কার — martingale convergence theorem ("bounded martingale a.s. converges", যা Doob martingale \(X_n=\mathbb E[Y\mid\mathcal F_n]\to Y\) ও SLLN-এর martingale-প্রমাণ দেয়) এবং Doob's maximal ও \(L^p\) inequalities (convex-submartingale \(\lvert X_n\rvert,X_n^2\) ও quadratic variation \(\langle S\rangle_n\) যার ভিত্তি)। - → 7.10 (Rigorous CLT ও characteristic functions): martingale-CLT ও martingale-difference কাঠামো সেখানকার কঠোর central limit theorem-এর একটা পথ।
উৎস: Klenke, Probability Theory: A Comprehensive Course, অধ্যায় ৯ (Martingales) ও অধ্যায় ১০ (Optional Sampling Theorems) — filtration, adapted/predictable process, martingale/sub-/supermartingale-এর সংজ্ঞা ও মৌলিক উদাহরণ (random walk, Doob martingale, likelihood ratio); martingale transform ও "a gambling strategy cannot beat a fair game"; stopping time, stopped process \(X_{n\wedge\tau}\), এবং optional sampling/stopping theorem-এর সম্পূর্ণ hypothesis-গুচ্ছ (bounded \(\tau\) / bounded \(X\) / \(\mathbb E[\tau]<\infty\) ও bounded increments) সহ gambler's ruin ও hypothesis-ভাঙা failure; এবং Doob decomposition — এই অধ্যায়ের কঠোর মেরুদণ্ড ও 7.9-এর martingale convergence-এর সরাসরি প্রস্তুতি।
এক বাক্যে: তথ্যের জমে-ওঠা প্রবাহকে একটা বর্ধমান filtration \((\mathcal F_n)\) দিয়ে ধরে, martingale হলো ন্যায্য খেলার কঠোর রূপ \(\mathbb E[X_{n+1}\mid\mathcal F_n]=X_n\) — যার প্রথম ফল "predictable কোনো বাজি-কৌশল ন্যায্য খেলা হারাতে পারে না" (martingale transform), আর দ্বিতীয় ফল "এলোমেলো stopping time \(\tau\)-তে থামলেও \(\mathbb E[X_\tau]=\mathbb E[X_0]\) — তবে শর্তসাপেক্ষে" (optional stopping: gambler's ruin-এ \(\mathbb P(+b)=\frac23\) ও \(\mathbb E[\tau]=32\), কিন্তু first-passage-এ \(\mathbb E[S_\tau]=1\ne0\) বলে hypothesis ভাঙলে তা-ও ভাঙে), সঙ্গে Doob decomposition যা submartingale-কে martingale ও predictable compensator-এ (\(S_n^2=(S_n^2-n)+n\)) আলাদা করে — এই martingale-ভিত্তিই 7.9-এর convergence ও Doob's inequalities-এর সরা