পরিসংখ্যান শিক্ষাক্রম — মাস্টার প্ল্যান¶

Statistics Curriculum — Master Plan (scratch → PhD)

ভাষা: বাংলা (medium) · সকল scientific/mathematical term ইংরেজিতে · কোড: Python · ফরম্যাট: Markdown chapter repo উৎস: এই ফোল্ডারের ৮টি বই · লক্ষ্য: শূন্য background থেকে PhD-level পরিসংখ্যানবিদ স্ট্যাটাস: পরিকল্পনা (Plan) — অনুমোদনের অপেক্ষায় · তারিখ: ১৬ জুন ২০২৬

১. লক্ষ্য ও শিক্ষাদর্শন (Goal & Teaching Philosophy)¶

একজন শিক্ষার্থী, যার পরিসংখ্যানে কোনো background নেই, তাকে ধাপে ধাপে এমনভাবে শেখানো যাতে সে শেষ পর্যন্ত PhD-level (measure-theoretic probability, rigorous inference, statistical machine learning) পর্যন্ত পৌঁছাতে পারে। এই শিক্ষাক্রম একটি সম্পূর্ণ স্বয়ংসম্পূর্ণ (self-contained) বই+কোর্স হিসেবে তৈরি হবে।

পাঁচটি মূলনীতি (five guiding principles):

Applied → Rigor (spiral approach): প্রতিটি বড় ধারণা প্রথমে intuition ও বাস্তব উদাহরণ দিয়ে আসবে, তারপর ধীরে ধীরে formal definition ও proof-এ গভীর হবে। একই ধারণা একাধিকবার, ক্রমবর্ধমান কঠোরতায় (increasing rigor) ফিরে আসবে — যেমন "expectation" প্রথমে গড় হিসেবে, পরে Lebesgue integral হিসেবে।
প্রতিটি topic-এ ৬টি স্তম্ভ (six pillars): explanation, example, proof, code, visualization, exercise — কোনোটিই বাদ যাবে না (নিচে §৫ দেখুন)।
বাংলা মাধ্যম, ইংরেজি পরিভাষা: ব্যাখ্যা, intuition, গল্প — সব বাংলায়। কিন্তু প্রতিটি technical term (random variable, variance, likelihood, σ-algebra) ইংরেজিতেই থাকবে, কারণ এগুলোই শিক্ষার্থীকে international literature ও paper পড়তে সক্ষম করবে।
From-scratch তারপর library: প্রতিটি গুরুত্বপূর্ণ algorithm প্রথমে NumPy দিয়ে হাতে-কলমে (from first principles) লেখা হবে, তারপর scipy/statsmodels/scikit-learn-এর production version দেখানো হবে — যাতে black box না থেকে যায়।
Visualization-first intuition: প্রতিটি বিমূর্ত (abstract) ধারণার সাথে অন্তত একটি ছবি/animation থাকবে (যেমন CLT-এর জন্য convergence animation, MLE-এর জন্য likelihood surface)।

২. শিক্ষার্থী প্রোফাইল ও পূর্বশর্ত (Learner Profile & Prerequisites)¶

ধরে নেওয়া হচ্ছে শিক্ষার্থী: উচ্চমাধ্যমিক স্তরের সাধারণ গণিত জানে কিন্তু calculus, linear algebra বা programming-এ আত্মবিশ্বাসী নয়; পরিসংখ্যান প্রায় শূন্য থেকে শুরু করছে।

সমাধান — Part 0: আমরা ধরে নেব না যে শিক্ষার্থী আগে থেকেই calculus/linear algebra/Python জানে। Part 0 (গাণিতিক ভিত্তি) ঠিক যতটুকু গণিত ও programming লাগবে ততটুকু "just-in-time" শেখাবে — না কম, না বেশি। পরে যখন কোনো advanced tool লাগবে (যেমন Part VII-এ functional analysis), তখন সেই অধ্যায়েই সংক্ষিপ্ত refresher box থাকবে।

পড়ার গতি (study pace): দৈনিক ২–৩ ঘণ্টা ধরে নিলে সম্পূর্ণ পথ (Part 0 → Part VIII) traverse করতে আনুমানিক ১০–১৪ মাস লাগবে (§৯ দেখুন)। তবে প্রতিটি Part স্বয়ংসম্পূর্ণ checkpoint, তাই গতি নমনীয়।

৩. উৎস বই ম্যাপিং (Source-Book Mapping)¶

৮টি বই একসাথে শূন্য→PhD একটি প্রায়-সম্পূর্ণ ladder তৈরি করে। প্রতিটি বইয়ের ভূমিকা:

#	বই (চিহ্নিতকৃত)	লেখক	স্তর	কারিকুলামে ভূমিকা
1	Practical Statistics for Data Scientists	Bruce, Bruce & Gedeck	Intro / applied	Part I, V — intuition + code on-ramp
2	Statistics for Machine Learning (`9781788...`)	Pratap Dangeti	Intro / applied	Part IV, VI — stats↔ML bridge, Python
3	Probability & Statistics for Data Science (`probability_stats_for_DS`)	C. Fernández-Granda (NYU)	Intermediate	Part II, III, IV — পরিষ্কার proof, random processes, Markov chains
4	Mathematical Statistics & Data Analysis	John A. Rice	Upper-undergrad/grad	Core spine — Part II, III, IV, V
5	All of Statistics	Larry Wasserman	Grad (concise)	Core spine — Part III, IV — দ্রুত rigorous inference + decision theory
6	STA121 Statistical Modeling (`script_sta121`)	R. Furrer (UZH)	Grad	Part V — regression, GLM, mixed models, PCA, clustering
7	Introduction to Statistical Machine Learning (`sugiyama2016`)	M. Sugiyama	Grad	Part VI — estimation theory → modern ML
8	Probability Theory: A Comprehensive Course (`978-3-030-56402-5`)	Achim Klenke	PhD	Part VII — measure theory, martingales — the summit

মূল spine: Rice + Wasserman পুরো কাঠামোর মেরুদণ্ড। Fernández-Granda intuition+proof-এর সেতু। Furrer ও Sugiyama modeling/ML। Klenke চূড়া। Practical Statistics ও Dangeti প্রতিটি Part-এ applied/coding অবতরণ (landing) দেয়।

৪. শিক্ষাক্রমের কাঠামো (Curriculum Structure) — Parts 0–VIII¶

মোট ৯টি Part, আনুমানিক ৬৬টি chapter। প্রতিটি chapter = একটি Markdown ফাইল, যা §৫-এর ৮-স্তম্ভ template অনুসরণ করবে।

Part 0 — গাণিতিক ভিত্তি (Mathematical Foundations) · ~৬ ch¶

"no background" শিক্ষার্থীর জন্য just-in-time pre-math + Python।

0.1 Sets, functions, logic ও proof করার মৌলিক কৌশল (direct, contradiction, induction)
0.2 Summation/product notation, combinatorics ও counting
0.3 Calculus refresher I: limit, derivative, optimization (maxima/minima)
0.4 Calculus refresher II: integration, multiple integrals (probability-র জন্য যতটুকু দরকার)
0.5 Linear algebra essentials: vector, matrix, eigenvalue/eigenvector
0.6 Python on-ramp: NumPy, pandas, matplotlib, Jupyter — scientific computing workflow

Part I — বর্ণনামূলক পরিসংখ্যান ও EDA (Descriptive Statistics & EDA) · ~৫ ch¶

1.1 Data types, population vs sample, variable types
1.2 Location ও variability: mean, median, variance, robust statistics (MAD, IQR)
1.3 Distribution ও visualization: histogram, density, boxplot, ECDF, QQ-plot
1.4 Correlation ও bivariate exploration
1.5 Exploratory Data Analysis (EDA) workflow — একটি case study

Part II — সম্ভাব্যতা তত্ত্ব: ভিত্তি (Probability: Foundations) · ~৭ ch¶

2.1 Sample space, axioms of probability, counting-based probability
2.2 Conditional probability, independence, Bayes' theorem
2.3 Random variables; discrete distributions (Bernoulli, Binomial, Poisson, Geometric)
2.4 Continuous distributions (Uniform, Exponential, Normal, Gamma, Beta)
2.5 Expectation, variance, moments, moment-generating function (MGF)
2.6 Joint, marginal ও conditional distribution; covariance, correlation
2.7 Transformations ও functions of random variables; order statistics

Part III — অসমতা, অভিসারণ ও random process (Inequalities, Convergence & Processes) · ~৬ ch¶

3.1 Probability inequalities: Markov, Chebyshev, Jensen, Hoeffding
3.2 Types of convergence: in probability, almost sure, in distribution, Lp
3.3 Law of Large Numbers (weak ও strong)
3.4 Central Limit Theorem ও the Delta method
3.5 Random processes; Poisson process; Gaussian process
3.6 Markov chains ও MCMC-র সূচনা

Part IV — পরিসংখ্যানিক অনুমান (Statistical Inference) · ~১০ ch¶

4.1 Inference-র সমস্যা; sampling distribution; χ², t, F distribution
4.2 Point estimation: method of moments
4.3 Maximum Likelihood Estimation (MLE)
4.4 Estimator-এর properties: bias, variance, consistency, efficiency
4.5 Sufficiency, Fisher information, Cramér–Rao bound, asymptotic normality
4.6 Confidence intervals
4.7 Hypothesis testing: Neyman–Pearson lemma, p-value, power
4.8 Likelihood ratio / Wald / score test; χ² goodness-of-fit
4.9 The Bootstrap, jackknife ও resampling
4.10 Bayesian inference: prior, posterior, credible interval, decision theory

Part V — পরিসংখ্যানিক মডেলিং (Statistical Modeling) · ~৯ ch¶

5.1 Simple ও multiple linear regression
5.2 Regression diagnostics, inference ও model selection
5.3 ANOVA ও experimental design
5.4 Generalized Linear Models (GLM): logistic regression
5.5 GLM: Poisson regression ও beyond
5.6 Mixed-effects / hierarchical models
5.7 Nonparametric regression: kernels ও splines
5.8 Resampling ও model validation (cross-validation, bootstrap)
5.9 Multivariate methods: PCA ও clustering

Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical Machine Learning) · ~৯ ch¶

6.1 Learning theory: bias–variance tradeoff, generalization, overfitting
6.2 Regularization: ridge, lasso, sparse regression
6.3 Classification I: LDA/QDA, logistic, Naive Bayes, kNN
6.4 Classification II: Support Vector Machines ও kernel methods
6.5 Decision trees, bagging, random forests
6.6 Boosting (AdaBoost, gradient boosting, XGBoost) ও ensembles
6.7 Density estimation ও EM algorithm (Gaussian mixture models)
6.8 Dimensionality reduction (linear ও nonlinear)
6.9 Outlier/change detection; semi-supervised ও online learning (survey)

Part VII — মেজার-তাত্ত্বিক সম্ভাব্যতা (Measure-Theoretic Probability — PhD summit) · ~১০ ch¶

Klenke-ভিত্তিক চূড়া। এখানেই "PhD-level" অর্জিত হয়।

7.1 কেন measure theory? naive থেকে rigorous probability-তে উত্তরণ
7.2 σ-algebra, measure, measure extension theorem
7.3 Measurable map ও random variable (rigorous)
7.4 Lebesgue integral; convergence theorems (Monotone, Fatou, Dominated)
7.5 Lp spaces, inequalities, Hilbert space, Radon–Nikodym theorem
7.6 Independence (revisited), Kolmogorov 0–1 law, rigorous LLN
7.7 Conditional expectation (measure-theoretic)
7.8 Martingales: filtration, stopping time, optional sampling theorem
7.9 Martingale convergence theorems ও applications
7.10 Characteristic functions ও CLT — সম্পূর্ণ rigorous proof (capstone)

Part VIII — ক্যাপস্টোন ও গবেষণা-প্রস্তুতি (Capstone & Research Readiness) · ~৪ ch¶

8.1 End-to-end data analysis project (বাস্তব dataset)
8.2 Simulation study — একটি পরিচিত ফলাফল reproduce করা
8.3 একটি statistics/ML paper পড়া ও reproduce করা
8.4 এরপর কোথায়: গবেষণা ক্ষেত্র, journal, পরবর্তী পথ

৫. প্রতি অধ্যায়ের অ্যানাটমি (Per-Chapter Template — the 8 pillars)¶

প্রতিটি chapter একই কাঠামো অনুসরণ করবে। এই consistency-ই পরে একটি "tutor agent"-কে এই বই থেকে শেখানো সম্ভব করবে (§১০)। আপনার চাওয়া ৬টি উপাদান (explanation, example, proof, exercise, code, visualization) এই ৮টি অংশে অন্তর্ভুক্ত:

ভূমিকা ও অন্তর্দৃষ্টি (Motivation & Intuition) — এই topic কেন দরকার, একটি বাস্তব hook/গল্প, বাংলায়।
মূল ধারণা ও সংজ্ঞা (Core Concepts — explanation) — definition (English term), ধাপে ধাপে ব্যাখ্যা, প্রতিটি notation বাংলায় খুলে বলা।
পূর্ণাঙ্গ উদাহরণ (Worked Examples) — অন্তত ২–৩টি সংখ্যাসহ উদাহরণ, হাতে-কলমে সমাধান।
প্রমাণ ও উৎপাদন (Proofs & Derivations) — rigorous, কিন্তু প্রতিটি লাইন বাংলায় ব্যাখ্যাসহ। কঠিন proof-এ difficulty tag (★ / ★★ / ★★★) — প্রথম পাঠে কোনগুলো skip করা যায় তা চিহ্নিত।
কোড ল্যাব (Code Lab — Python) — from-scratch implementation (NumPy) → তারপর library version (scipy/statsmodels/sklearn); simulation দিয়ে theory যাচাই।
ভিজ্যুয়ালাইজেশন (Visualization) — ধারণাটিকে দৃশ্যমান করার plot, এবং সেই plot তৈরির পূর্ণ কোড; ছবি _assets/-এ সংরক্ষিত।
অনুশীলনী (Exercises) — চার ধরনের: conceptual, computational, proof-based, coding। প্রতিটিতে hint; পূর্ণ সমাধান আলাদা _solutions/ ফাইলে।
সারসংক্ষেপ ও সংযোগ (Summary & Links) — মূল পয়েন্ট, পরবর্তী অধ্যায়ের সাথে সংযোগ, এবং উৎস বইয়ের নির্দিষ্ট অধ্যায়/theorem-এ pointer (যেমন "Rice §৪.৫, Wasserman Ch.৯")।

প্রতিটি chapter-এর শুরুতে একটি metadata header থাকবে (prerequisites, learning objectives, আনুমানিক সময়, source pointer) — মানুষ ও agent উভয়ের জন্য।

৬. রিপোজিটরি কাঠামো ও টুলিং (Repo Layout & Tooling)¶

Statistics/
├── curriculum/
│   ├── README.md                 ← মাস্টার সিলেবাস / index (পড়া শুরুর দরজা)
│   ├── PLAN.md                    ← এই পরিকল্পনা
│   ├── GLOSSARY.md               ← bilingual পরিভাষা: English term → বাংলা ব্যাখ্যা
│   ├── part-0-foundations/
│   │   ├── 00-01-sets-functions-logic.md
│   │   ├── 00-02-combinatorics.md
│   │   └── ...
│   ├── part-1-descriptive/
│   ├── part-2-probability-foundations/
│   ├── ...
│   ├── part-7-measure-theoretic/
│   ├── part-8-capstone/
│   ├── _assets/                  ← সব generated figure (PNG/SVG), অধ্যায়-ভিত্তিক
│   ├── _code/                    ← পুনঃব্যবহারযোগ্য helper (plotting, datasets loader)
│   ├── _solutions/               ← অনুশীলনীর পূর্ণ সমাধান
│   └── _data/                    ← ছোট dataset (CSV)
└── (৮টি উৎস PDF — যেখানে আছে সেখানেই)

Python stack: numpy, scipy, pandas, matplotlib, seaborn, statsmodels, scikit-learn, sympy (symbolic proof যাচাই), এবং Bayesian অংশে pymc। প্রতিটি Part-এ requirements.txt pin করা থাকবে।

Authoring বনাম delivery: কোড Jupyter-এ লিখে যাচাই করা হবে, কিন্তু চূড়ান্ত deliverable হলো .md ফাইল — যেখানে code block + pre-rendered figure embedded। ফলে GitHub-এ সরাসরি render হবে, আবার শিক্ষার্থী চাইলে কোড copy করে চালাতে পারবে।

Math rendering: সব গণিত LaTeX ( $...$ / $$...$$)-এ, যা GitHub ও অধিকাংশ Markdown viewer-এ render হয়।

৭. পরিভাষা ও ভাষা-নীতি (Glossary & Language Policy)¶

ধারাবাহিকতা (consistency) রক্ষায় একটি GLOSSARY.md থাকবে — যেখানে প্রতিটি English technical term-এর পাশে এককথায় বাংলা ব্যাখ্যা ও প্রথম-ব্যবহারের অধ্যায় লেখা থাকবে। নিয়ম:

Technical/scientific/mathematical term → সর্বদা ইংরেজিতে (random variable, variance, σ-algebra, eigenvalue, likelihood)। বাংলা অনুবাদ চাপিয়ে দেওয়া হবে না।
ব্যাখ্যা, intuition, সংযোগকারী বাক্য → বাংলায়।
প্রথমবার কোনো term এলে: ইংরেজি term + বন্ধনীতে সংক্ষিপ্ত বাংলা ইঙ্গিত। তারপর শুধু ইংরেজি term।
গাণিতিক symbol ও notation আন্তর্জাতিক মানে (international standard) — কোনো localization নয়।

৮. গুণমান নিশ্চিতকরণ (Quality Assurance / Verification)¶

প্রতিটি chapter "done" বলার আগে একটি verification pass:

Proof যাচাই: প্রতিটি proof উৎস বইয়ের সংশ্লিষ্ট theorem-এর সাথে মিলিয়ে দেখা; logical gap চিহ্নিত করা। sympy দিয়ে যেখানে সম্ভব symbolic যাচাই (derivative, integral, identity)।
Code যাচাই: প্রতিটি code block আসলে চলে কিনা (runs), সঠিক figure বানায় কিনা, এবং simulation theory-র সাথে মেলে কিনা (যেমন LLN simulation সত্যিই converge করছে কিনা) — সব পরীক্ষা করা।
Numerical sanity: closed-form ফলাফল বনাম simulation — দুইয়ের তুলনা।
কঠিন অংশে subagent: Part VII (measure theory, martingales)-এর proof একটি আলাদা verification subagent দিয়ে স্বাধীনভাবে cross-check করা।
পরিভাষা consistency: নতুন term GLOSSARY.md-এ আছে কিনা ও ব্যবহার একরূপ কিনা।

৯. নির্মাণ পর্যায় ও টাইমলাইন (Build Phases & Timeline)¶

নির্মাণ (build) ধাপে ধাপে হবে; প্রতিটি phase শেষে আপনি পর্যালোচনা করতে পারবেন।

Phase	কী তৈরি হবে	উদ্দেশ্য
Phase 0	Repo scaffold + `GLOSSARY.md` + Part 0-এর ১–২টি exemplar chapter (সব ৮ স্তম্ভসহ)	template ও style লক করা; আপনার অনুমোদন
Phase 1	Part 0 ও Part I সম্পূর্ণ	ভিত্তি + descriptive
Phase 2	Part II ও Part III	probability core
Phase 3	Part IV	inference
Phase 4	Part V	modeling
Phase 5	Part VI	statistical ML
Phase 6	Part VII	measure-theoretic summit (সবচেয়ে কঠিন)
Phase 7	Part VIII + সম্পূর্ণ polish, cross-link, index	capstone ও সমাপ্তি

দুটি টাইমলাইন আলাদা: - শিক্ষার্থীর study timeline (দৈনিক ২–৩ ঘণ্টা): সম্পূর্ণ পথ ≈ ১০–১৪ মাস। - নির্মাণ timeline: আমি phase ধরে ধরে chapter তৈরি করব; আপনি প্রতিটি phase পর্যালোচনা করে এগোতে বলবেন। Phase 0 প্রথমে — যাতে অল্প কাজেই style নিশ্চিত হয়, পরে বড় পরিসরে ভুল না ছড়ায়।

১০. "এজেন্ট" সংযোগ (The Agent Angle)¶

আপনার project-এর লক্ষ্য: "accumulate books, make an agent to learn them।" এই শিক্ষাক্রম সেই agent-এর ভিত্তি (foundation):

প্রতিটি chapter-এর অভিন্ন schema ও metadata header (prerequisites, objectives, source pointer) machine-readable — একটি tutor agent এখান থেকে সরাসরি পাঠ, কুইজ, ও hint দিতে পারবে।
Difficulty tag ও prerequisite link একটি knowledge graph তৈরি করে — agent শিক্ষার্থীর স্তর বুঝে পথ ঠিক করতে পারবে।
_solutions/ ও exercise pool agent-চালিত অনুশীলন/মূল্যায়নের উপাদান দেয়।

পরবর্তী একটি (ঐচ্ছিক) phase-এ এই repo-র উপর একটি tutor/Q&A agent বসানো যাবে। তবে সেটি বর্তমান "first plan"-এর সুযোগের (scope) বাইরে — আগে বিষয়বস্তু (content), পরে agent।

১১. একটি নমুনা অধ্যায়-অংশ (Sample Chapter Excerpt)¶

স্টাইল লক করার জন্য নিচে Chapter 3.3 — Law of Large Numbers-এর একটি সংক্ষিপ্ত নমুনা (পূর্ণ অধ্যায় নয়, শুধু টোন ও ৬ স্তম্ভ বোঝাতে):

১ · ভূমিকা ও অন্তর্দৃষ্টি¶

একটা ন্যায্য (fair) ছক্কা বারবার ছুঁড়লে গড় ফলাফল কীসের কাছে যায়? আমরা সবাই অনুমান করি — ৩.৫-এর কাছে। কিন্তু "কাছে যায়" কথাটার গাণিতিক মানে কী? এই প্রশ্নের উত্তরই Law of Large Numbers (LLN) — পরিসংখ্যানের সবচেয়ে ভিত্তিমূলক ফলাফলগুলোর একটি, যা বলে কেন বেশি data মানে বেশি নির্ভরযোগ্য estimate।

২ · মূল ধারণা (explanation)¶

ধরা যাক $X_1, X_2, \dots, X_n$ হলো i.i.d. (independent and identically distributed) random variable, প্রত্যেকের expectation $\mathbb{E}[X_i] = \mu$ এবং variance $\mathrm{Var}(X_i) = \sigma^2 < \infty$। sample mean সংজ্ঞায়িত করি: $$\bar{X}_n = \frac{1}{n}\sum_{i=1}^{n} X_i$$ Weak Law of Large Numbers (WLLN) বলে: যেকোনো $\varepsilon > 0$-এর জন্য, $$\lim_{n \to \infty} P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) = 0.$$ অর্থাৎ, $n$ যত বড় হয়, sample mean $\bar{X}_n$ true mean $\mu$ থেকে $\varepsilon$-এর বেশি দূরে থাকার সম্ভাবনা তত শূন্যের দিকে যায়। একে বলে convergence in probability: $\bar{X}_n \xrightarrow{P} \mu$।

৩ · উদাহরণ¶

ছক্কার ক্ষেত্রে $\mu = (1+2+3+4+5+6)/6 = 3.5$ এবং $\sigma^2 = 35/12 \approx 2.92$। WLLN বলছে যত বেশিবার ছুঁড়ব, গড় তত নিশ্চিতভাবে ৩.৫-এর কাছে থাকবে।

৪ · প্রমাণ (proof) ★¶

WLLN-এর একটি সরল proof আসে Chebyshev's inequality থেকে। প্রথমে, linearity of expectation থেকে $\mathbb{E}[\bar{X}_n] = \mu$, এবং independence থেকে $$\mathrm{Var}(\bar{X}_n) = \frac{1}{n^2}\sum_{i=1}^n \mathrm{Var}(X_i) = \frac{\sigma^2}{n}.$$ এখন Chebyshev's inequality প্রয়োগ করি: $$P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) \leq \frac{\mathrm{Var}(\bar{X}_n)}{\varepsilon^2} = \frac{\sigma^2}{n\varepsilon^2}.$$ $n \to \infty$ হলে ডান পাশ $\to 0$। অতএব বাঁ পাশও $\to 0$। $\blacksquare$ (এই proof-এ finite variance ধরা হয়েছে; Part VII-এ এই শর্ত শিথিল করে strong LLN প্রমাণ করা হবে।)

৫ · কোড ল্যাব (Python)¶
import numpy as np
import matplotlib.pyplot as plt

rng = np.random.default_rng(42)
n = 10_000
rolls = rng.integers(1, 7, size=n)          # ১ থেকে ৬, fair die
running_mean = np.cumsum(rolls) / np.arange(1, n + 1)

print(f"১০,০০০ বার পরে গড়: {running_mean[-1]:.4f}  (theory: 3.5)")
৬ · ভিজ্যুয়ালাইজেশন¶
plt.figure(figsize=(9, 4))
plt.plot(running_mean, lw=1)
plt.axhline(3.5, color="red", ls="--", label=r"true mean $\mu = 3.5$")
plt.xscale("log")
plt.xlabel("number of rolls (n)"); plt.ylabel(r"running mean $\bar{X}_n$")
plt.title("Law of Large Numbers — ছক্কার running mean ৩.৫-এ থিতু হচ্ছে")
plt.legend(); plt.tight_layout()
plt.savefig("_assets/3-3-lln-die.png", dpi=150)
(ফলাফল ছবি: শুরুতে গড় লাফায়, কিন্তু $n$ বাড়লে লাল রেখা ৩.৫-এ স্থির হয়ে যায়।)

৭ · অনুশীলনী¶

(conceptual) WLLN ও "gambler's fallacy"-র পার্থক্য ব্যাখ্যা করো: LLN কি বলে যে কয়েকবার কম এলে এখন বেশি আসবে? ★

(computational) $\sigma^2$ জানা থাকলে, $P(|\bar X_n - \mu| \ge 0.1) \le 0.05$ নিশ্চিত করতে $n$ অন্তত কত লাগবে (Chebyshev bound)? ★★

(coding) Exponential($\lambda=1$) থেকে নমুনা নিয়ে running mean প্লট করো; ১-এ converge করে কিনা দেখাও। ★

(proof) দেখাও $\mathrm{Var}(\bar X_n) = \sigma^2/n$ — independence কোথায় লাগল? ★★

৮ · সারসংক্ষেপ ও সংযোগ¶

LLN নিশ্চিত করে sample mean → true mean (in probability)। কিন্তু কত দ্রুত, এবং error-এর আকৃতি কী? — সেই উত্তর পরের অধ্যায় 3.4 Central Limit Theorem-এ। উৎস: Wasserman Ch.৫, Rice §৫.২, Fernández-Granda "Convergence"।

১২. পরবর্তী পদক্ষেপ (Next Steps)¶

আপনার অনুমোদনের অপেক্ষায়। সবুজ সংকেত দিলে আমি Phase 0 শুরু করব:

Repo scaffold তৈরি (সব Part ফোল্ডার + README.md সিলেবাস + GLOSSARY.md শুরু)।
Part 0-এর ১–২টি পূর্ণাঙ্গ exemplar chapter (সব ৮ স্তম্ভসহ, কোড চালানো ও figure সমেত) — যাতে আপনি style চূড়ান্ত অনুমোদন/সংশোধন করতে পারেন।
তারপর Phase ধরে ধরে সম্পূর্ণ বই।

আপনার কাছে প্রশ্ন/সিদ্ধান্ত যেগুলো এখন বা Phase 0-এর পরে ঠিক করা যায়: - chapter সংখ্যা/গভীরতা ঠিক আছে, নাকি কোনো Part হালকা/ভারী করব? - exercise-এর সমাধান প্রতিটি chapter-এর সাথেই, নাকি আলাদা solution ফাইলে? - কোনো নির্দিষ্ট Part আগে চান (যেমন আগে inference, পরে measure theory)?