Skip to content

পরিসংখ্যান শিক্ষাক্রম — মাস্টার প্ল্যান

Statistics Curriculum — Master Plan (scratch → PhD)

ভাষা: বাংলা (medium) · সকল scientific/mathematical term ইংরেজিতে · কোড: Python · ফরম্যাট: Markdown chapter repo উৎস: এই ফোল্ডারের ৮টি বই · লক্ষ্য: শূন্য background থেকে PhD-level পরিসংখ্যানবিদ স্ট্যাটাস: পরিকল্পনা (Plan) — অনুমোদনের অপেক্ষায় · তারিখ: ১৬ জুন ২০২৬


১. লক্ষ্য ও শিক্ষাদর্শন (Goal & Teaching Philosophy)

একজন শিক্ষার্থী, যার পরিসংখ্যানে কোনো background নেই, তাকে ধাপে ধাপে এমনভাবে শেখানো যাতে সে শেষ পর্যন্ত PhD-level (measure-theoretic probability, rigorous inference, statistical machine learning) পর্যন্ত পৌঁছাতে পারে। এই শিক্ষাক্রম একটি সম্পূর্ণ স্বয়ংসম্পূর্ণ (self-contained) বই+কোর্স হিসেবে তৈরি হবে।

পাঁচটি মূলনীতি (five guiding principles):

  1. Applied → Rigor (spiral approach): প্রতিটি বড় ধারণা প্রথমে intuition ও বাস্তব উদাহরণ দিয়ে আসবে, তারপর ধীরে ধীরে formal definition ও proof-এ গভীর হবে। একই ধারণা একাধিকবার, ক্রমবর্ধমান কঠোরতায় (increasing rigor) ফিরে আসবে — যেমন "expectation" প্রথমে গড় হিসেবে, পরে Lebesgue integral হিসেবে।
  2. প্রতিটি topic-এ ৬টি স্তম্ভ (six pillars): explanation, example, proof, code, visualization, exercise — কোনোটিই বাদ যাবে না (নিচে §৫ দেখুন)।
  3. বাংলা মাধ্যম, ইংরেজি পরিভাষা: ব্যাখ্যা, intuition, গল্প — সব বাংলায়। কিন্তু প্রতিটি technical term (random variable, variance, likelihood, σ-algebra) ইংরেজিতেই থাকবে, কারণ এগুলোই শিক্ষার্থীকে international literature ও paper পড়তে সক্ষম করবে।
  4. From-scratch তারপর library: প্রতিটি গুরুত্বপূর্ণ algorithm প্রথমে NumPy দিয়ে হাতে-কলমে (from first principles) লেখা হবে, তারপর scipy/statsmodels/scikit-learn-এর production version দেখানো হবে — যাতে black box না থেকে যায়।
  5. Visualization-first intuition: প্রতিটি বিমূর্ত (abstract) ধারণার সাথে অন্তত একটি ছবি/animation থাকবে (যেমন CLT-এর জন্য convergence animation, MLE-এর জন্য likelihood surface)।

২. শিক্ষার্থী প্রোফাইল ও পূর্বশর্ত (Learner Profile & Prerequisites)

ধরে নেওয়া হচ্ছে শিক্ষার্থী: উচ্চমাধ্যমিক স্তরের সাধারণ গণিত জানে কিন্তু calculus, linear algebra বা programming-এ আত্মবিশ্বাসী নয়; পরিসংখ্যান প্রায় শূন্য থেকে শুরু করছে।

সমাধান — Part 0: আমরা ধরে নেব না যে শিক্ষার্থী আগে থেকেই calculus/linear algebra/Python জানে। Part 0 (গাণিতিক ভিত্তি) ঠিক যতটুকু গণিত ও programming লাগবে ততটুকু "just-in-time" শেখাবে — না কম, না বেশি। পরে যখন কোনো advanced tool লাগবে (যেমন Part VII-এ functional analysis), তখন সেই অধ্যায়েই সংক্ষিপ্ত refresher box থাকবে।

পড়ার গতি (study pace): দৈনিক ২–৩ ঘণ্টা ধরে নিলে সম্পূর্ণ পথ (Part 0 → Part VIII) traverse করতে আনুমানিক ১০–১৪ মাস লাগবে (§৯ দেখুন)। তবে প্রতিটি Part স্বয়ংসম্পূর্ণ checkpoint, তাই গতি নমনীয়।


৩. উৎস বই ম্যাপিং (Source-Book Mapping)

৮টি বই একসাথে শূন্য→PhD একটি প্রায়-সম্পূর্ণ ladder তৈরি করে। প্রতিটি বইয়ের ভূমিকা:

# বই (চিহ্নিতকৃত) লেখক স্তর কারিকুলামে ভূমিকা
1 Practical Statistics for Data Scientists Bruce, Bruce & Gedeck Intro / applied Part I, V — intuition + code on-ramp
2 Statistics for Machine Learning (9781788...) Pratap Dangeti Intro / applied Part IV, VI — stats↔ML bridge, Python
3 Probability & Statistics for Data Science (probability_stats_for_DS) C. Fernández-Granda (NYU) Intermediate Part II, III, IV — পরিষ্কার proof, random processes, Markov chains
4 Mathematical Statistics & Data Analysis John A. Rice Upper-undergrad/grad Core spine — Part II, III, IV, V
5 All of Statistics Larry Wasserman Grad (concise) Core spine — Part III, IV — দ্রুত rigorous inference + decision theory
6 STA121 Statistical Modeling (script_sta121) R. Furrer (UZH) Grad Part V — regression, GLM, mixed models, PCA, clustering
7 Introduction to Statistical Machine Learning (sugiyama2016) M. Sugiyama Grad Part VI — estimation theory → modern ML
8 Probability Theory: A Comprehensive Course (978-3-030-56402-5) Achim Klenke PhD Part VII — measure theory, martingales — the summit

মূল spine: Rice + Wasserman পুরো কাঠামোর মেরুদণ্ড। Fernández-Granda intuition+proof-এর সেতু। Furrer ও Sugiyama modeling/ML। Klenke চূড়া। Practical Statistics ও Dangeti প্রতিটি Part-এ applied/coding অবতরণ (landing) দেয়।


৪. শিক্ষাক্রমের কাঠামো (Curriculum Structure) — Parts 0–VIII

মোট ৯টি Part, আনুমানিক ৬৬টি chapter। প্রতিটি chapter = একটি Markdown ফাইল, যা §৫-এর ৮-স্তম্ভ template অনুসরণ করবে।

Part 0 — গাণিতিক ভিত্তি (Mathematical Foundations) · ~৬ ch

"no background" শিক্ষার্থীর জন্য just-in-time pre-math + Python।

  • 0.1 Sets, functions, logic ও proof করার মৌলিক কৌশল (direct, contradiction, induction)
  • 0.2 Summation/product notation, combinatorics ও counting
  • 0.3 Calculus refresher I: limit, derivative, optimization (maxima/minima)
  • 0.4 Calculus refresher II: integration, multiple integrals (probability-র জন্য যতটুকু দরকার)
  • 0.5 Linear algebra essentials: vector, matrix, eigenvalue/eigenvector
  • 0.6 Python on-ramp: NumPy, pandas, matplotlib, Jupyter — scientific computing workflow

Part I — বর্ণনামূলক পরিসংখ্যান ও EDA (Descriptive Statistics & EDA) · ~৫ ch

  • 1.1 Data types, population vs sample, variable types
  • 1.2 Location ও variability: mean, median, variance, robust statistics (MAD, IQR)
  • 1.3 Distribution ও visualization: histogram, density, boxplot, ECDF, QQ-plot
  • 1.4 Correlation ও bivariate exploration
  • 1.5 Exploratory Data Analysis (EDA) workflow — একটি case study

Part II — সম্ভাব্যতা তত্ত্ব: ভিত্তি (Probability: Foundations) · ~৭ ch

  • 2.1 Sample space, axioms of probability, counting-based probability
  • 2.2 Conditional probability, independence, Bayes' theorem
  • 2.3 Random variables; discrete distributions (Bernoulli, Binomial, Poisson, Geometric)
  • 2.4 Continuous distributions (Uniform, Exponential, Normal, Gamma, Beta)
  • 2.5 Expectation, variance, moments, moment-generating function (MGF)
  • 2.6 Joint, marginal ও conditional distribution; covariance, correlation
  • 2.7 Transformations ও functions of random variables; order statistics

Part III — অসমতা, অভিসারণ ও random process (Inequalities, Convergence & Processes) · ~৬ ch

  • 3.1 Probability inequalities: Markov, Chebyshev, Jensen, Hoeffding
  • 3.2 Types of convergence: in probability, almost sure, in distribution, Lp
  • 3.3 Law of Large Numbers (weak ও strong)
  • 3.4 Central Limit Theorem ও the Delta method
  • 3.5 Random processes; Poisson process; Gaussian process
  • 3.6 Markov chains ও MCMC-র সূচনা

Part IV — পরিসংখ্যানিক অনুমান (Statistical Inference) · ~১০ ch

  • 4.1 Inference-র সমস্যা; sampling distribution; χ², t, F distribution
  • 4.2 Point estimation: method of moments
  • 4.3 Maximum Likelihood Estimation (MLE)
  • 4.4 Estimator-এর properties: bias, variance, consistency, efficiency
  • 4.5 Sufficiency, Fisher information, Cramér–Rao bound, asymptotic normality
  • 4.6 Confidence intervals
  • 4.7 Hypothesis testing: Neyman–Pearson lemma, p-value, power
  • 4.8 Likelihood ratio / Wald / score test; χ² goodness-of-fit
  • 4.9 The Bootstrap, jackknife ও resampling
  • 4.10 Bayesian inference: prior, posterior, credible interval, decision theory

Part V — পরিসংখ্যানিক মডেলিং (Statistical Modeling) · ~৯ ch

  • 5.1 Simple ও multiple linear regression
  • 5.2 Regression diagnostics, inference ও model selection
  • 5.3 ANOVA ও experimental design
  • 5.4 Generalized Linear Models (GLM): logistic regression
  • 5.5 GLM: Poisson regression ও beyond
  • 5.6 Mixed-effects / hierarchical models
  • 5.7 Nonparametric regression: kernels ও splines
  • 5.8 Resampling ও model validation (cross-validation, bootstrap)
  • 5.9 Multivariate methods: PCA ও clustering

Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical Machine Learning) · ~৯ ch

  • 6.1 Learning theory: bias–variance tradeoff, generalization, overfitting
  • 6.2 Regularization: ridge, lasso, sparse regression
  • 6.3 Classification I: LDA/QDA, logistic, Naive Bayes, kNN
  • 6.4 Classification II: Support Vector Machines ও kernel methods
  • 6.5 Decision trees, bagging, random forests
  • 6.6 Boosting (AdaBoost, gradient boosting, XGBoost) ও ensembles
  • 6.7 Density estimation ও EM algorithm (Gaussian mixture models)
  • 6.8 Dimensionality reduction (linear ও nonlinear)
  • 6.9 Outlier/change detection; semi-supervised ও online learning (survey)

Part VII — মেজার-তাত্ত্বিক সম্ভাব্যতা (Measure-Theoretic Probability — PhD summit) · ~১০ ch

Klenke-ভিত্তিক চূড়া। এখানেই "PhD-level" অর্জিত হয়।

  • 7.1 কেন measure theory? naive থেকে rigorous probability-তে উত্তরণ
  • 7.2 σ-algebra, measure, measure extension theorem
  • 7.3 Measurable map ও random variable (rigorous)
  • 7.4 Lebesgue integral; convergence theorems (Monotone, Fatou, Dominated)
  • 7.5 Lp spaces, inequalities, Hilbert space, Radon–Nikodym theorem
  • 7.6 Independence (revisited), Kolmogorov 0–1 law, rigorous LLN
  • 7.7 Conditional expectation (measure-theoretic)
  • 7.8 Martingales: filtration, stopping time, optional sampling theorem
  • 7.9 Martingale convergence theorems ও applications
  • 7.10 Characteristic functions ও CLT — সম্পূর্ণ rigorous proof (capstone)

Part VIII — ক্যাপস্টোন ও গবেষণা-প্রস্তুতি (Capstone & Research Readiness) · ~৪ ch

  • 8.1 End-to-end data analysis project (বাস্তব dataset)
  • 8.2 Simulation study — একটি পরিচিত ফলাফল reproduce করা
  • 8.3 একটি statistics/ML paper পড়া ও reproduce করা
  • 8.4 এরপর কোথায়: গবেষণা ক্ষেত্র, journal, পরবর্তী পথ

৫. প্রতি অধ্যায়ের অ্যানাটমি (Per-Chapter Template — the 8 pillars)

প্রতিটি chapter একই কাঠামো অনুসরণ করবে। এই consistency-ই পরে একটি "tutor agent"-কে এই বই থেকে শেখানো সম্ভব করবে (§১০)। আপনার চাওয়া ৬টি উপাদান (explanation, example, proof, exercise, code, visualization) এই ৮টি অংশে অন্তর্ভুক্ত:

  1. ভূমিকা ও অন্তর্দৃষ্টি (Motivation & Intuition) — এই topic কেন দরকার, একটি বাস্তব hook/গল্প, বাংলায়।
  2. মূল ধারণা ও সংজ্ঞা (Core Concepts — explanation) — definition (English term), ধাপে ধাপে ব্যাখ্যা, প্রতিটি notation বাংলায় খুলে বলা।
  3. পূর্ণাঙ্গ উদাহরণ (Worked Examples) — অন্তত ২–৩টি সংখ্যাসহ উদাহরণ, হাতে-কলমে সমাধান।
  4. প্রমাণ ও উৎপাদন (Proofs & Derivations) — rigorous, কিন্তু প্রতিটি লাইন বাংলায় ব্যাখ্যাসহ। কঠিন proof-এ difficulty tag (★ / ★★ / ★★★) — প্রথম পাঠে কোনগুলো skip করা যায় তা চিহ্নিত।
  5. কোড ল্যাব (Code Lab — Python) — from-scratch implementation (NumPy) → তারপর library version (scipy/statsmodels/sklearn); simulation দিয়ে theory যাচাই।
  6. ভিজ্যুয়ালাইজেশন (Visualization) — ধারণাটিকে দৃশ্যমান করার plot, এবং সেই plot তৈরির পূর্ণ কোড; ছবি _assets/-এ সংরক্ষিত।
  7. অনুশীলনী (Exercises) — চার ধরনের: conceptual, computational, proof-based, coding। প্রতিটিতে hint; পূর্ণ সমাধান আলাদা _solutions/ ফাইলে।
  8. সারসংক্ষেপ ও সংযোগ (Summary & Links) — মূল পয়েন্ট, পরবর্তী অধ্যায়ের সাথে সংযোগ, এবং উৎস বইয়ের নির্দিষ্ট অধ্যায়/theorem-এ pointer (যেমন "Rice §৪.৫, Wasserman Ch.৯")।

প্রতিটি chapter-এর শুরুতে একটি metadata header থাকবে (prerequisites, learning objectives, আনুমানিক সময়, source pointer) — মানুষ ও agent উভয়ের জন্য।


৬. রিপোজিটরি কাঠামো ও টুলিং (Repo Layout & Tooling)

Statistics/
├── curriculum/
│   ├── README.md                 ← মাস্টার সিলেবাস / index (পড়া শুরুর দরজা)
│   ├── PLAN.md                    ← এই পরিকল্পনা
│   ├── GLOSSARY.md               ← bilingual পরিভাষা: English term → বাংলা ব্যাখ্যা
│   ├── part-0-foundations/
│   │   ├── 00-01-sets-functions-logic.md
│   │   ├── 00-02-combinatorics.md
│   │   └── ...
│   ├── part-1-descriptive/
│   ├── part-2-probability-foundations/
│   ├── ...
│   ├── part-7-measure-theoretic/
│   ├── part-8-capstone/
│   ├── _assets/                  ← সব generated figure (PNG/SVG), অধ্যায়-ভিত্তিক
│   ├── _code/                    ← পুনঃব্যবহারযোগ্য helper (plotting, datasets loader)
│   ├── _solutions/               ← অনুশীলনীর পূর্ণ সমাধান
│   └── _data/                    ← ছোট dataset (CSV)
└── (৮টি উৎস PDF — যেখানে আছে সেখানেই)

Python stack: numpy, scipy, pandas, matplotlib, seaborn, statsmodels, scikit-learn, sympy (symbolic proof যাচাই), এবং Bayesian অংশে pymc। প্রতিটি Part-এ requirements.txt pin করা থাকবে।

Authoring বনাম delivery: কোড Jupyter-এ লিখে যাচাই করা হবে, কিন্তু চূড়ান্ত deliverable হলো .md ফাইল — যেখানে code block + pre-rendered figure embedded। ফলে GitHub-এ সরাসরি render হবে, আবার শিক্ষার্থী চাইলে কোড copy করে চালাতে পারবে।

Math rendering: সব গণিত LaTeX ($...$ / $$...$$)-এ, যা GitHub ও অধিকাংশ Markdown viewer-এ render হয়।


৭. পরিভাষা ও ভাষা-নীতি (Glossary & Language Policy)

ধারাবাহিকতা (consistency) রক্ষায় একটি GLOSSARY.md থাকবে — যেখানে প্রতিটি English technical term-এর পাশে এককথায় বাংলা ব্যাখ্যা ও প্রথম-ব্যবহারের অধ্যায় লেখা থাকবে। নিয়ম:

  • Technical/scientific/mathematical term → সর্বদা ইংরেজিতে (random variable, variance, σ-algebra, eigenvalue, likelihood)। বাংলা অনুবাদ চাপিয়ে দেওয়া হবে না।
  • ব্যাখ্যা, intuition, সংযোগকারী বাক্য → বাংলায়।
  • প্রথমবার কোনো term এলে: ইংরেজি term + বন্ধনীতে সংক্ষিপ্ত বাংলা ইঙ্গিত। তারপর শুধু ইংরেজি term।
  • গাণিতিক symbol ও notation আন্তর্জাতিক মানে (international standard) — কোনো localization নয়।

৮. গুণমান নিশ্চিতকরণ (Quality Assurance / Verification)

প্রতিটি chapter "done" বলার আগে একটি verification pass:

  • Proof যাচাই: প্রতিটি proof উৎস বইয়ের সংশ্লিষ্ট theorem-এর সাথে মিলিয়ে দেখা; logical gap চিহ্নিত করা। sympy দিয়ে যেখানে সম্ভব symbolic যাচাই (derivative, integral, identity)।
  • Code যাচাই: প্রতিটি code block আসলে চলে কিনা (runs), সঠিক figure বানায় কিনা, এবং simulation theory-র সাথে মেলে কিনা (যেমন LLN simulation সত্যিই converge করছে কিনা) — সব পরীক্ষা করা।
  • Numerical sanity: closed-form ফলাফল বনাম simulation — দুইয়ের তুলনা।
  • কঠিন অংশে subagent: Part VII (measure theory, martingales)-এর proof একটি আলাদা verification subagent দিয়ে স্বাধীনভাবে cross-check করা।
  • পরিভাষা consistency: নতুন term GLOSSARY.md-এ আছে কিনা ও ব্যবহার একরূপ কিনা।

৯. নির্মাণ পর্যায় ও টাইমলাইন (Build Phases & Timeline)

নির্মাণ (build) ধাপে ধাপে হবে; প্রতিটি phase শেষে আপনি পর্যালোচনা করতে পারবেন।

Phase কী তৈরি হবে উদ্দেশ্য
Phase 0 Repo scaffold + GLOSSARY.md + Part 0-এর ১–২টি exemplar chapter (সব ৮ স্তম্ভসহ) template ও style লক করা; আপনার অনুমোদন
Phase 1 Part 0 ও Part I সম্পূর্ণ ভিত্তি + descriptive
Phase 2 Part II ও Part III probability core
Phase 3 Part IV inference
Phase 4 Part V modeling
Phase 5 Part VI statistical ML
Phase 6 Part VII measure-theoretic summit (সবচেয়ে কঠিন)
Phase 7 Part VIII + সম্পূর্ণ polish, cross-link, index capstone ও সমাপ্তি

দুটি টাইমলাইন আলাদা: - শিক্ষার্থীর study timeline (দৈনিক ২–৩ ঘণ্টা): সম্পূর্ণ পথ ≈ ১০–১৪ মাস। - নির্মাণ timeline: আমি phase ধরে ধরে chapter তৈরি করব; আপনি প্রতিটি phase পর্যালোচনা করে এগোতে বলবেন। Phase 0 প্রথমে — যাতে অল্প কাজেই style নিশ্চিত হয়, পরে বড় পরিসরে ভুল না ছড়ায়।


১০. "এজেন্ট" সংযোগ (The Agent Angle)

আপনার project-এর লক্ষ্য: "accumulate books, make an agent to learn them।" এই শিক্ষাক্রম সেই agent-এর ভিত্তি (foundation):

  • প্রতিটি chapter-এর অভিন্ন schema ও metadata header (prerequisites, objectives, source pointer) machine-readable — একটি tutor agent এখান থেকে সরাসরি পাঠ, কুইজ, ও hint দিতে পারবে।
  • Difficulty tagprerequisite link একটি knowledge graph তৈরি করে — agent শিক্ষার্থীর স্তর বুঝে পথ ঠিক করতে পারবে।
  • _solutions/ ও exercise pool agent-চালিত অনুশীলন/মূল্যায়নের উপাদান দেয়।

পরবর্তী একটি (ঐচ্ছিক) phase-এ এই repo-র উপর একটি tutor/Q&A agent বসানো যাবে। তবে সেটি বর্তমান "first plan"-এর সুযোগের (scope) বাইরে — আগে বিষয়বস্তু (content), পরে agent।


১১. একটি নমুনা অধ্যায়-অংশ (Sample Chapter Excerpt)

স্টাইল লক করার জন্য নিচে Chapter 3.3 — Law of Large Numbers-এর একটি সংক্ষিপ্ত নমুনা (পূর্ণ অধ্যায় নয়, শুধু টোন ও ৬ স্তম্ভ বোঝাতে):


১ · ভূমিকা ও অন্তর্দৃষ্টি

একটা ন্যায্য (fair) ছক্কা বারবার ছুঁড়লে গড় ফলাফল কীসের কাছে যায়? আমরা সবাই অনুমান করি — ৩.৫-এর কাছে। কিন্তু "কাছে যায়" কথাটার গাণিতিক মানে কী? এই প্রশ্নের উত্তরই Law of Large Numbers (LLN) — পরিসংখ্যানের সবচেয়ে ভিত্তিমূলক ফলাফলগুলোর একটি, যা বলে কেন বেশি data মানে বেশি নির্ভরযোগ্য estimate।

২ · মূল ধারণা (explanation)

ধরা যাক \(X_1, X_2, \dots, X_n\) হলো i.i.d. (independent and identically distributed) random variable, প্রত্যেকের expectation \(\mathbb{E}[X_i] = \mu\) এবং variance \(\mathrm{Var}(X_i) = \sigma^2 < \infty\)। sample mean সংজ্ঞায়িত করি: $\(\bar{X}_n = \frac{1}{n}\sum_{i=1}^{n} X_i\)$ Weak Law of Large Numbers (WLLN) বলে: যেকোনো \(\varepsilon > 0\)-এর জন্য, $\(\lim_{n \to \infty} P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) = 0.\)$ অর্থাৎ, \(n\) যত বড় হয়, sample mean \(\bar{X}_n\) true mean \(\mu\) থেকে \(\varepsilon\)-এর বেশি দূরে থাকার সম্ভাবনা তত শূন্যের দিকে যায়। একে বলে convergence in probability: \(\bar{X}_n \xrightarrow{P} \mu\)

৩ · উদাহরণ

ছক্কার ক্ষেত্রে \(\mu = (1+2+3+4+5+6)/6 = 3.5\) এবং \(\sigma^2 = 35/12 \approx 2.92\)। WLLN বলছে যত বেশিবার ছুঁড়ব, গড় তত নিশ্চিতভাবে ৩.৫-এর কাছে থাকবে।

৪ · প্রমাণ (proof) ★

WLLN-এর একটি সরল proof আসে Chebyshev's inequality থেকে। প্রথমে, linearity of expectation থেকে \(\mathbb{E}[\bar{X}_n] = \mu\), এবং independence থেকে $\(\mathrm{Var}(\bar{X}_n) = \frac{1}{n^2}\sum_{i=1}^n \mathrm{Var}(X_i) = \frac{\sigma^2}{n}.\)$ এখন Chebyshev's inequality প্রয়োগ করি: $\(P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) \leq \frac{\mathrm{Var}(\bar{X}_n)}{\varepsilon^2} = \frac{\sigma^2}{n\varepsilon^2}.\)$ \(n \to \infty\) হলে ডান পাশ \(\to 0\)। অতএব বাঁ পাশও \(\to 0\)\(\blacksquare\) (এই proof-এ finite variance ধরা হয়েছে; Part VII-এ এই শর্ত শিথিল করে strong LLN প্রমাণ করা হবে।)

৫ · কোড ল্যাব (Python)

import numpy as np
import matplotlib.pyplot as plt

rng = np.random.default_rng(42)
n = 10_000
rolls = rng.integers(1, 7, size=n)          # ১ থেকে ৬, fair die
running_mean = np.cumsum(rolls) / np.arange(1, n + 1)

print(f"১০,০০০ বার পরে গড়: {running_mean[-1]:.4f}  (theory: 3.5)")

৬ · ভিজ্যুয়ালাইজেশন

plt.figure(figsize=(9, 4))
plt.plot(running_mean, lw=1)
plt.axhline(3.5, color="red", ls="--", label=r"true mean $\mu = 3.5$")
plt.xscale("log")
plt.xlabel("number of rolls (n)"); plt.ylabel(r"running mean $\bar{X}_n$")
plt.title("Law of Large Numbers — ছক্কার running mean ৩.৫-এ থিতু হচ্ছে")
plt.legend(); plt.tight_layout()
plt.savefig("_assets/3-3-lln-die.png", dpi=150)

(ফলাফল ছবি: শুরুতে গড় লাফায়, কিন্তু \(n\) বাড়লে লাল রেখা ৩.৫-এ স্থির হয়ে যায়।)

৭ · অনুশীলনী

  • (conceptual) WLLN ও "gambler's fallacy"-র পার্থক্য ব্যাখ্যা করো: LLN কি বলে যে কয়েকবার কম এলে এখন বেশি আসবে? ★
  • (computational) \(\sigma^2\) জানা থাকলে, \(P(|\bar X_n - \mu| \ge 0.1) \le 0.05\) নিশ্চিত করতে \(n\) অন্তত কত লাগবে (Chebyshev bound)? ★★
  • (coding) Exponential(\(\lambda=1\)) থেকে নমুনা নিয়ে running mean প্লট করো; ১-এ converge করে কিনা দেখাও। ★
  • (proof) দেখাও \(\mathrm{Var}(\bar X_n) = \sigma^2/n\) — independence কোথায় লাগল? ★★

৮ · সারসংক্ষেপ ও সংযোগ

LLN নিশ্চিত করে sample mean → true mean (in probability)। কিন্তু কত দ্রুত, এবং error-এর আকৃতি কী? — সেই উত্তর পরের অধ্যায় 3.4 Central Limit Theorem-এ। উৎস: Wasserman Ch.৫, Rice §৫.২, Fernández-Granda "Convergence"।


১২. পরবর্তী পদক্ষেপ (Next Steps)

আপনার অনুমোদনের অপেক্ষায়। সবুজ সংকেত দিলে আমি Phase 0 শুরু করব:

  1. Repo scaffold তৈরি (সব Part ফোল্ডার + README.md সিলেবাস + GLOSSARY.md শুরু)।
  2. Part 0-এর ১–২টি পূর্ণাঙ্গ exemplar chapter (সব ৮ স্তম্ভসহ, কোড চালানো ও figure সমেত) — যাতে আপনি style চূড়ান্ত অনুমোদন/সংশোধন করতে পারেন।
  3. তারপর Phase ধরে ধরে সম্পূর্ণ বই।

আপনার কাছে প্রশ্ন/সিদ্ধান্ত যেগুলো এখন বা Phase 0-এর পরে ঠিক করা যায়: - chapter সংখ্যা/গভীরতা ঠিক আছে, নাকি কোনো Part হালকা/ভারী করব? - exercise-এর সমাধান প্রতিটি chapter-এর সাথেই, নাকি আলাদা solution ফাইলে? - কোনো নির্দিষ্ট Part আগে চান (যেমন আগে inference, পরে measure theory)?