পরিসংখ্যান শিক্ষাক্রম — মাস্টার প্ল্যান¶
Statistics Curriculum — Master Plan (scratch → PhD)
ভাষা: বাংলা (medium) · সকল scientific/mathematical term ইংরেজিতে · কোড: Python · ফরম্যাট: Markdown chapter repo উৎস: এই ফোল্ডারের ৮টি বই · লক্ষ্য: শূন্য background থেকে PhD-level পরিসংখ্যানবিদ স্ট্যাটাস: পরিকল্পনা (Plan) — অনুমোদনের অপেক্ষায় · তারিখ: ১৬ জুন ২০২৬
১. লক্ষ্য ও শিক্ষাদর্শন (Goal & Teaching Philosophy)¶
একজন শিক্ষার্থী, যার পরিসংখ্যানে কোনো background নেই, তাকে ধাপে ধাপে এমনভাবে শেখানো যাতে সে শেষ পর্যন্ত PhD-level (measure-theoretic probability, rigorous inference, statistical machine learning) পর্যন্ত পৌঁছাতে পারে। এই শিক্ষাক্রম একটি সম্পূর্ণ স্বয়ংসম্পূর্ণ (self-contained) বই+কোর্স হিসেবে তৈরি হবে।
পাঁচটি মূলনীতি (five guiding principles):
- Applied → Rigor (spiral approach): প্রতিটি বড় ধারণা প্রথমে intuition ও বাস্তব উদাহরণ দিয়ে আসবে, তারপর ধীরে ধীরে formal definition ও proof-এ গভীর হবে। একই ধারণা একাধিকবার, ক্রমবর্ধমান কঠোরতায় (increasing rigor) ফিরে আসবে — যেমন "expectation" প্রথমে গড় হিসেবে, পরে Lebesgue integral হিসেবে।
- প্রতিটি topic-এ ৬টি স্তম্ভ (six pillars): explanation, example, proof, code, visualization, exercise — কোনোটিই বাদ যাবে না (নিচে §৫ দেখুন)।
- বাংলা মাধ্যম, ইংরেজি পরিভাষা: ব্যাখ্যা, intuition, গল্প — সব বাংলায়। কিন্তু প্রতিটি technical term (random variable, variance, likelihood, σ-algebra) ইংরেজিতেই থাকবে, কারণ এগুলোই শিক্ষার্থীকে international literature ও paper পড়তে সক্ষম করবে।
- From-scratch তারপর library: প্রতিটি গুরুত্বপূর্ণ algorithm প্রথমে NumPy দিয়ে হাতে-কলমে (from first principles) লেখা হবে, তারপর
scipy/statsmodels/scikit-learn-এর production version দেখানো হবে — যাতে black box না থেকে যায়। - Visualization-first intuition: প্রতিটি বিমূর্ত (abstract) ধারণার সাথে অন্তত একটি ছবি/animation থাকবে (যেমন CLT-এর জন্য convergence animation, MLE-এর জন্য likelihood surface)।
২. শিক্ষার্থী প্রোফাইল ও পূর্বশর্ত (Learner Profile & Prerequisites)¶
ধরে নেওয়া হচ্ছে শিক্ষার্থী: উচ্চমাধ্যমিক স্তরের সাধারণ গণিত জানে কিন্তু calculus, linear algebra বা programming-এ আত্মবিশ্বাসী নয়; পরিসংখ্যান প্রায় শূন্য থেকে শুরু করছে।
সমাধান — Part 0: আমরা ধরে নেব না যে শিক্ষার্থী আগে থেকেই calculus/linear algebra/Python জানে। Part 0 (গাণিতিক ভিত্তি) ঠিক যতটুকু গণিত ও programming লাগবে ততটুকু "just-in-time" শেখাবে — না কম, না বেশি। পরে যখন কোনো advanced tool লাগবে (যেমন Part VII-এ functional analysis), তখন সেই অধ্যায়েই সংক্ষিপ্ত refresher box থাকবে।
পড়ার গতি (study pace): দৈনিক ২–৩ ঘণ্টা ধরে নিলে সম্পূর্ণ পথ (Part 0 → Part VIII) traverse করতে আনুমানিক ১০–১৪ মাস লাগবে (§৯ দেখুন)। তবে প্রতিটি Part স্বয়ংসম্পূর্ণ checkpoint, তাই গতি নমনীয়।
৩. উৎস বই ম্যাপিং (Source-Book Mapping)¶
৮টি বই একসাথে শূন্য→PhD একটি প্রায়-সম্পূর্ণ ladder তৈরি করে। প্রতিটি বইয়ের ভূমিকা:
| # | বই (চিহ্নিতকৃত) | লেখক | স্তর | কারিকুলামে ভূমিকা |
|---|---|---|---|---|
| 1 | Practical Statistics for Data Scientists | Bruce, Bruce & Gedeck | Intro / applied | Part I, V — intuition + code on-ramp |
| 2 | Statistics for Machine Learning (9781788...) |
Pratap Dangeti | Intro / applied | Part IV, VI — stats↔ML bridge, Python |
| 3 | Probability & Statistics for Data Science (probability_stats_for_DS) |
C. Fernández-Granda (NYU) | Intermediate | Part II, III, IV — পরিষ্কার proof, random processes, Markov chains |
| 4 | Mathematical Statistics & Data Analysis | John A. Rice | Upper-undergrad/grad | Core spine — Part II, III, IV, V |
| 5 | All of Statistics | Larry Wasserman | Grad (concise) | Core spine — Part III, IV — দ্রুত rigorous inference + decision theory |
| 6 | STA121 Statistical Modeling (script_sta121) |
R. Furrer (UZH) | Grad | Part V — regression, GLM, mixed models, PCA, clustering |
| 7 | Introduction to Statistical Machine Learning (sugiyama2016) |
M. Sugiyama | Grad | Part VI — estimation theory → modern ML |
| 8 | Probability Theory: A Comprehensive Course (978-3-030-56402-5) |
Achim Klenke | PhD | Part VII — measure theory, martingales — the summit |
মূল spine: Rice + Wasserman পুরো কাঠামোর মেরুদণ্ড। Fernández-Granda intuition+proof-এর সেতু। Furrer ও Sugiyama modeling/ML। Klenke চূড়া। Practical Statistics ও Dangeti প্রতিটি Part-এ applied/coding অবতরণ (landing) দেয়।
৪. শিক্ষাক্রমের কাঠামো (Curriculum Structure) — Parts 0–VIII¶
মোট ৯টি Part, আনুমানিক ৬৬টি chapter। প্রতিটি chapter = একটি Markdown ফাইল, যা §৫-এর ৮-স্তম্ভ template অনুসরণ করবে।
Part 0 — গাণিতিক ভিত্তি (Mathematical Foundations) · ~৬ ch¶
"no background" শিক্ষার্থীর জন্য just-in-time pre-math + Python।
- 0.1 Sets, functions, logic ও proof করার মৌলিক কৌশল (direct, contradiction, induction)
- 0.2 Summation/product notation, combinatorics ও counting
- 0.3 Calculus refresher I: limit, derivative, optimization (maxima/minima)
- 0.4 Calculus refresher II: integration, multiple integrals (probability-র জন্য যতটুকু দরকার)
- 0.5 Linear algebra essentials: vector, matrix, eigenvalue/eigenvector
- 0.6 Python on-ramp: NumPy, pandas, matplotlib, Jupyter — scientific computing workflow
Part I — বর্ণনামূলক পরিসংখ্যান ও EDA (Descriptive Statistics & EDA) · ~৫ ch¶
- 1.1 Data types, population vs sample, variable types
- 1.2 Location ও variability: mean, median, variance, robust statistics (MAD, IQR)
- 1.3 Distribution ও visualization: histogram, density, boxplot, ECDF, QQ-plot
- 1.4 Correlation ও bivariate exploration
- 1.5 Exploratory Data Analysis (EDA) workflow — একটি case study
Part II — সম্ভাব্যতা তত্ত্ব: ভিত্তি (Probability: Foundations) · ~৭ ch¶
- 2.1 Sample space, axioms of probability, counting-based probability
- 2.2 Conditional probability, independence, Bayes' theorem
- 2.3 Random variables; discrete distributions (Bernoulli, Binomial, Poisson, Geometric)
- 2.4 Continuous distributions (Uniform, Exponential, Normal, Gamma, Beta)
- 2.5 Expectation, variance, moments, moment-generating function (MGF)
- 2.6 Joint, marginal ও conditional distribution; covariance, correlation
- 2.7 Transformations ও functions of random variables; order statistics
Part III — অসমতা, অভিসারণ ও random process (Inequalities, Convergence & Processes) · ~৬ ch¶
- 3.1 Probability inequalities: Markov, Chebyshev, Jensen, Hoeffding
- 3.2 Types of convergence: in probability, almost sure, in distribution, Lp
- 3.3 Law of Large Numbers (weak ও strong)
- 3.4 Central Limit Theorem ও the Delta method
- 3.5 Random processes; Poisson process; Gaussian process
- 3.6 Markov chains ও MCMC-র সূচনা
Part IV — পরিসংখ্যানিক অনুমান (Statistical Inference) · ~১০ ch¶
- 4.1 Inference-র সমস্যা; sampling distribution; χ², t, F distribution
- 4.2 Point estimation: method of moments
- 4.3 Maximum Likelihood Estimation (MLE)
- 4.4 Estimator-এর properties: bias, variance, consistency, efficiency
- 4.5 Sufficiency, Fisher information, Cramér–Rao bound, asymptotic normality
- 4.6 Confidence intervals
- 4.7 Hypothesis testing: Neyman–Pearson lemma, p-value, power
- 4.8 Likelihood ratio / Wald / score test; χ² goodness-of-fit
- 4.9 The Bootstrap, jackknife ও resampling
- 4.10 Bayesian inference: prior, posterior, credible interval, decision theory
Part V — পরিসংখ্যানিক মডেলিং (Statistical Modeling) · ~৯ ch¶
- 5.1 Simple ও multiple linear regression
- 5.2 Regression diagnostics, inference ও model selection
- 5.3 ANOVA ও experimental design
- 5.4 Generalized Linear Models (GLM): logistic regression
- 5.5 GLM: Poisson regression ও beyond
- 5.6 Mixed-effects / hierarchical models
- 5.7 Nonparametric regression: kernels ও splines
- 5.8 Resampling ও model validation (cross-validation, bootstrap)
- 5.9 Multivariate methods: PCA ও clustering
Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical Machine Learning) · ~৯ ch¶
- 6.1 Learning theory: bias–variance tradeoff, generalization, overfitting
- 6.2 Regularization: ridge, lasso, sparse regression
- 6.3 Classification I: LDA/QDA, logistic, Naive Bayes, kNN
- 6.4 Classification II: Support Vector Machines ও kernel methods
- 6.5 Decision trees, bagging, random forests
- 6.6 Boosting (AdaBoost, gradient boosting, XGBoost) ও ensembles
- 6.7 Density estimation ও EM algorithm (Gaussian mixture models)
- 6.8 Dimensionality reduction (linear ও nonlinear)
- 6.9 Outlier/change detection; semi-supervised ও online learning (survey)
Part VII — মেজার-তাত্ত্বিক সম্ভাব্যতা (Measure-Theoretic Probability — PhD summit) · ~১০ ch¶
Klenke-ভিত্তিক চূড়া। এখানেই "PhD-level" অর্জিত হয়।
- 7.1 কেন measure theory? naive থেকে rigorous probability-তে উত্তরণ
- 7.2 σ-algebra, measure, measure extension theorem
- 7.3 Measurable map ও random variable (rigorous)
- 7.4 Lebesgue integral; convergence theorems (Monotone, Fatou, Dominated)
- 7.5 Lp spaces, inequalities, Hilbert space, Radon–Nikodym theorem
- 7.6 Independence (revisited), Kolmogorov 0–1 law, rigorous LLN
- 7.7 Conditional expectation (measure-theoretic)
- 7.8 Martingales: filtration, stopping time, optional sampling theorem
- 7.9 Martingale convergence theorems ও applications
- 7.10 Characteristic functions ও CLT — সম্পূর্ণ rigorous proof (capstone)
Part VIII — ক্যাপস্টোন ও গবেষণা-প্রস্তুতি (Capstone & Research Readiness) · ~৪ ch¶
- 8.1 End-to-end data analysis project (বাস্তব dataset)
- 8.2 Simulation study — একটি পরিচিত ফলাফল reproduce করা
- 8.3 একটি statistics/ML paper পড়া ও reproduce করা
- 8.4 এরপর কোথায়: গবেষণা ক্ষেত্র, journal, পরবর্তী পথ
৫. প্রতি অধ্যায়ের অ্যানাটমি (Per-Chapter Template — the 8 pillars)¶
প্রতিটি chapter একই কাঠামো অনুসরণ করবে। এই consistency-ই পরে একটি "tutor agent"-কে এই বই থেকে শেখানো সম্ভব করবে (§১০)। আপনার চাওয়া ৬টি উপাদান (explanation, example, proof, exercise, code, visualization) এই ৮টি অংশে অন্তর্ভুক্ত:
- ভূমিকা ও অন্তর্দৃষ্টি (Motivation & Intuition) — এই topic কেন দরকার, একটি বাস্তব hook/গল্প, বাংলায়।
- মূল ধারণা ও সংজ্ঞা (Core Concepts — explanation) — definition (English term), ধাপে ধাপে ব্যাখ্যা, প্রতিটি notation বাংলায় খুলে বলা।
- পূর্ণাঙ্গ উদাহরণ (Worked Examples) — অন্তত ২–৩টি সংখ্যাসহ উদাহরণ, হাতে-কলমে সমাধান।
- প্রমাণ ও উৎপাদন (Proofs & Derivations) — rigorous, কিন্তু প্রতিটি লাইন বাংলায় ব্যাখ্যাসহ। কঠিন proof-এ difficulty tag (★ / ★★ / ★★★) — প্রথম পাঠে কোনগুলো skip করা যায় তা চিহ্নিত।
- কোড ল্যাব (Code Lab — Python) — from-scratch implementation (NumPy) → তারপর library version (
scipy/statsmodels/sklearn); simulation দিয়ে theory যাচাই। - ভিজ্যুয়ালাইজেশন (Visualization) — ধারণাটিকে দৃশ্যমান করার plot, এবং সেই plot তৈরির পূর্ণ কোড; ছবি
_assets/-এ সংরক্ষিত। - অনুশীলনী (Exercises) — চার ধরনের: conceptual, computational, proof-based, coding। প্রতিটিতে hint; পূর্ণ সমাধান আলাদা
_solutions/ফাইলে। - সারসংক্ষেপ ও সংযোগ (Summary & Links) — মূল পয়েন্ট, পরবর্তী অধ্যায়ের সাথে সংযোগ, এবং উৎস বইয়ের নির্দিষ্ট অধ্যায়/theorem-এ pointer (যেমন "Rice §৪.৫, Wasserman Ch.৯")।
প্রতিটি chapter-এর শুরুতে একটি metadata header থাকবে (prerequisites, learning objectives, আনুমানিক সময়, source pointer) — মানুষ ও agent উভয়ের জন্য।
৬. রিপোজিটরি কাঠামো ও টুলিং (Repo Layout & Tooling)¶
Statistics/
├── curriculum/
│ ├── README.md ← মাস্টার সিলেবাস / index (পড়া শুরুর দরজা)
│ ├── PLAN.md ← এই পরিকল্পনা
│ ├── GLOSSARY.md ← bilingual পরিভাষা: English term → বাংলা ব্যাখ্যা
│ ├── part-0-foundations/
│ │ ├── 00-01-sets-functions-logic.md
│ │ ├── 00-02-combinatorics.md
│ │ └── ...
│ ├── part-1-descriptive/
│ ├── part-2-probability-foundations/
│ ├── ...
│ ├── part-7-measure-theoretic/
│ ├── part-8-capstone/
│ ├── _assets/ ← সব generated figure (PNG/SVG), অধ্যায়-ভিত্তিক
│ ├── _code/ ← পুনঃব্যবহারযোগ্য helper (plotting, datasets loader)
│ ├── _solutions/ ← অনুশীলনীর পূর্ণ সমাধান
│ └── _data/ ← ছোট dataset (CSV)
└── (৮টি উৎস PDF — যেখানে আছে সেখানেই)
Python stack: numpy, scipy, pandas, matplotlib, seaborn, statsmodels, scikit-learn, sympy (symbolic proof যাচাই), এবং Bayesian অংশে pymc। প্রতিটি Part-এ requirements.txt pin করা থাকবে।
Authoring বনাম delivery: কোড Jupyter-এ লিখে যাচাই করা হবে, কিন্তু চূড়ান্ত deliverable হলো .md ফাইল — যেখানে code block + pre-rendered figure embedded। ফলে GitHub-এ সরাসরি render হবে, আবার শিক্ষার্থী চাইলে কোড copy করে চালাতে পারবে।
Math rendering: সব গণিত LaTeX ($...$ / $$...$$)-এ, যা GitHub ও অধিকাংশ Markdown viewer-এ render হয়।
৭. পরিভাষা ও ভাষা-নীতি (Glossary & Language Policy)¶
ধারাবাহিকতা (consistency) রক্ষায় একটি GLOSSARY.md থাকবে — যেখানে প্রতিটি English technical term-এর পাশে এককথায় বাংলা ব্যাখ্যা ও প্রথম-ব্যবহারের অধ্যায় লেখা থাকবে। নিয়ম:
- Technical/scientific/mathematical term → সর্বদা ইংরেজিতে (random variable, variance, σ-algebra, eigenvalue, likelihood)। বাংলা অনুবাদ চাপিয়ে দেওয়া হবে না।
- ব্যাখ্যা, intuition, সংযোগকারী বাক্য → বাংলায়।
- প্রথমবার কোনো term এলে: ইংরেজি term + বন্ধনীতে সংক্ষিপ্ত বাংলা ইঙ্গিত। তারপর শুধু ইংরেজি term।
- গাণিতিক symbol ও notation আন্তর্জাতিক মানে (international standard) — কোনো localization নয়।
৮. গুণমান নিশ্চিতকরণ (Quality Assurance / Verification)¶
প্রতিটি chapter "done" বলার আগে একটি verification pass:
- Proof যাচাই: প্রতিটি proof উৎস বইয়ের সংশ্লিষ্ট theorem-এর সাথে মিলিয়ে দেখা; logical gap চিহ্নিত করা।
sympyদিয়ে যেখানে সম্ভব symbolic যাচাই (derivative, integral, identity)। - Code যাচাই: প্রতিটি code block আসলে চলে কিনা (runs), সঠিক figure বানায় কিনা, এবং simulation theory-র সাথে মেলে কিনা (যেমন LLN simulation সত্যিই converge করছে কিনা) — সব পরীক্ষা করা।
- Numerical sanity: closed-form ফলাফল বনাম simulation — দুইয়ের তুলনা।
- কঠিন অংশে subagent: Part VII (measure theory, martingales)-এর proof একটি আলাদা verification subagent দিয়ে স্বাধীনভাবে cross-check করা।
- পরিভাষা consistency: নতুন term
GLOSSARY.md-এ আছে কিনা ও ব্যবহার একরূপ কিনা।
৯. নির্মাণ পর্যায় ও টাইমলাইন (Build Phases & Timeline)¶
নির্মাণ (build) ধাপে ধাপে হবে; প্রতিটি phase শেষে আপনি পর্যালোচনা করতে পারবেন।
| Phase | কী তৈরি হবে | উদ্দেশ্য |
|---|---|---|
| Phase 0 | Repo scaffold + GLOSSARY.md + Part 0-এর ১–২টি exemplar chapter (সব ৮ স্তম্ভসহ) |
template ও style লক করা; আপনার অনুমোদন |
| Phase 1 | Part 0 ও Part I সম্পূর্ণ | ভিত্তি + descriptive |
| Phase 2 | Part II ও Part III | probability core |
| Phase 3 | Part IV | inference |
| Phase 4 | Part V | modeling |
| Phase 5 | Part VI | statistical ML |
| Phase 6 | Part VII | measure-theoretic summit (সবচেয়ে কঠিন) |
| Phase 7 | Part VIII + সম্পূর্ণ polish, cross-link, index | capstone ও সমাপ্তি |
দুটি টাইমলাইন আলাদা: - শিক্ষার্থীর study timeline (দৈনিক ২–৩ ঘণ্টা): সম্পূর্ণ পথ ≈ ১০–১৪ মাস। - নির্মাণ timeline: আমি phase ধরে ধরে chapter তৈরি করব; আপনি প্রতিটি phase পর্যালোচনা করে এগোতে বলবেন। Phase 0 প্রথমে — যাতে অল্প কাজেই style নিশ্চিত হয়, পরে বড় পরিসরে ভুল না ছড়ায়।
১০. "এজেন্ট" সংযোগ (The Agent Angle)¶
আপনার project-এর লক্ষ্য: "accumulate books, make an agent to learn them।" এই শিক্ষাক্রম সেই agent-এর ভিত্তি (foundation):
- প্রতিটি chapter-এর অভিন্ন schema ও metadata header (prerequisites, objectives, source pointer) machine-readable — একটি tutor agent এখান থেকে সরাসরি পাঠ, কুইজ, ও hint দিতে পারবে।
- Difficulty tag ও prerequisite link একটি knowledge graph তৈরি করে — agent শিক্ষার্থীর স্তর বুঝে পথ ঠিক করতে পারবে।
_solutions/ও exercise pool agent-চালিত অনুশীলন/মূল্যায়নের উপাদান দেয়।
পরবর্তী একটি (ঐচ্ছিক) phase-এ এই repo-র উপর একটি tutor/Q&A agent বসানো যাবে। তবে সেটি বর্তমান "first plan"-এর সুযোগের (scope) বাইরে — আগে বিষয়বস্তু (content), পরে agent।
১১. একটি নমুনা অধ্যায়-অংশ (Sample Chapter Excerpt)¶
স্টাইল লক করার জন্য নিচে Chapter 3.3 — Law of Large Numbers-এর একটি সংক্ষিপ্ত নমুনা (পূর্ণ অধ্যায় নয়, শুধু টোন ও ৬ স্তম্ভ বোঝাতে):
১ · ভূমিকা ও অন্তর্দৃষ্টি¶
একটা ন্যায্য (fair) ছক্কা বারবার ছুঁড়লে গড় ফলাফল কীসের কাছে যায়? আমরা সবাই অনুমান করি — ৩.৫-এর কাছে। কিন্তু "কাছে যায়" কথাটার গাণিতিক মানে কী? এই প্রশ্নের উত্তরই Law of Large Numbers (LLN) — পরিসংখ্যানের সবচেয়ে ভিত্তিমূলক ফলাফলগুলোর একটি, যা বলে কেন বেশি data মানে বেশি নির্ভরযোগ্য estimate।
২ · মূল ধারণা (explanation)¶
ধরা যাক \(X_1, X_2, \dots, X_n\) হলো i.i.d. (independent and identically distributed) random variable, প্রত্যেকের expectation \(\mathbb{E}[X_i] = \mu\) এবং variance \(\mathrm{Var}(X_i) = \sigma^2 < \infty\)। sample mean সংজ্ঞায়িত করি: $\(\bar{X}_n = \frac{1}{n}\sum_{i=1}^{n} X_i\)$ Weak Law of Large Numbers (WLLN) বলে: যেকোনো \(\varepsilon > 0\)-এর জন্য, $\(\lim_{n \to \infty} P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) = 0.\)$ অর্থাৎ, \(n\) যত বড় হয়, sample mean \(\bar{X}_n\) true mean \(\mu\) থেকে \(\varepsilon\)-এর বেশি দূরে থাকার সম্ভাবনা তত শূন্যের দিকে যায়। একে বলে convergence in probability: \(\bar{X}_n \xrightarrow{P} \mu\)।
৩ · উদাহরণ¶
ছক্কার ক্ষেত্রে \(\mu = (1+2+3+4+5+6)/6 = 3.5\) এবং \(\sigma^2 = 35/12 \approx 2.92\)। WLLN বলছে যত বেশিবার ছুঁড়ব, গড় তত নিশ্চিতভাবে ৩.৫-এর কাছে থাকবে।
৪ · প্রমাণ (proof) ★¶
WLLN-এর একটি সরল proof আসে Chebyshev's inequality থেকে। প্রথমে, linearity of expectation থেকে \(\mathbb{E}[\bar{X}_n] = \mu\), এবং independence থেকে $\(\mathrm{Var}(\bar{X}_n) = \frac{1}{n^2}\sum_{i=1}^n \mathrm{Var}(X_i) = \frac{\sigma^2}{n}.\)$ এখন Chebyshev's inequality প্রয়োগ করি: $\(P\big(|\bar{X}_n - \mu| \geq \varepsilon\big) \leq \frac{\mathrm{Var}(\bar{X}_n)}{\varepsilon^2} = \frac{\sigma^2}{n\varepsilon^2}.\)$ \(n \to \infty\) হলে ডান পাশ \(\to 0\)। অতএব বাঁ পাশও \(\to 0\)। \(\blacksquare\) (এই proof-এ finite variance ধরা হয়েছে; Part VII-এ এই শর্ত শিথিল করে strong LLN প্রমাণ করা হবে।)
৫ · কোড ল্যাব (Python)¶
import numpy as np import matplotlib.pyplot as plt rng = np.random.default_rng(42) n = 10_000 rolls = rng.integers(1, 7, size=n) # ১ থেকে ৬, fair die running_mean = np.cumsum(rolls) / np.arange(1, n + 1) print(f"১০,০০০ বার পরে গড়: {running_mean[-1]:.4f} (theory: 3.5)")৬ · ভিজ্যুয়ালাইজেশন¶
plt.figure(figsize=(9, 4)) plt.plot(running_mean, lw=1) plt.axhline(3.5, color="red", ls="--", label=r"true mean $\mu = 3.5$") plt.xscale("log") plt.xlabel("number of rolls (n)"); plt.ylabel(r"running mean $\bar{X}_n$") plt.title("Law of Large Numbers — ছক্কার running mean ৩.৫-এ থিতু হচ্ছে") plt.legend(); plt.tight_layout() plt.savefig("_assets/3-3-lln-die.png", dpi=150)(ফলাফল ছবি: শুরুতে গড় লাফায়, কিন্তু \(n\) বাড়লে লাল রেখা ৩.৫-এ স্থির হয়ে যায়।)
৭ · অনুশীলনী¶
- (conceptual) WLLN ও "gambler's fallacy"-র পার্থক্য ব্যাখ্যা করো: LLN কি বলে যে কয়েকবার কম এলে এখন বেশি আসবে? ★
- (computational) \(\sigma^2\) জানা থাকলে, \(P(|\bar X_n - \mu| \ge 0.1) \le 0.05\) নিশ্চিত করতে \(n\) অন্তত কত লাগবে (Chebyshev bound)? ★★
- (coding) Exponential(\(\lambda=1\)) থেকে নমুনা নিয়ে running mean প্লট করো; ১-এ converge করে কিনা দেখাও। ★
- (proof) দেখাও \(\mathrm{Var}(\bar X_n) = \sigma^2/n\) — independence কোথায় লাগল? ★★
৮ · সারসংক্ষেপ ও সংযোগ¶
LLN নিশ্চিত করে sample mean → true mean (in probability)। কিন্তু কত দ্রুত, এবং error-এর আকৃতি কী? — সেই উত্তর পরের অধ্যায় 3.4 Central Limit Theorem-এ। উৎস: Wasserman Ch.৫, Rice §৫.২, Fernández-Granda "Convergence"।
১২. পরবর্তী পদক্ষেপ (Next Steps)¶
আপনার অনুমোদনের অপেক্ষায়। সবুজ সংকেত দিলে আমি Phase 0 শুরু করব:
- Repo scaffold তৈরি (সব Part ফোল্ডার +
README.mdসিলেবাস +GLOSSARY.mdশুরু)। - Part 0-এর ১–২টি পূর্ণাঙ্গ exemplar chapter (সব ৮ স্তম্ভসহ, কোড চালানো ও figure সমেত) — যাতে আপনি style চূড়ান্ত অনুমোদন/সংশোধন করতে পারেন।
- তারপর Phase ধরে ধরে সম্পূর্ণ বই।
আপনার কাছে প্রশ্ন/সিদ্ধান্ত যেগুলো এখন বা Phase 0-এর পরে ঠিক করা যায়: - chapter সংখ্যা/গভীরতা ঠিক আছে, নাকি কোনো Part হালকা/ভারী করব? - exercise-এর সমাধান প্রতিটি chapter-এর সাথেই, নাকি আলাদা solution ফাইলে? - কোনো নির্দিষ্ট Part আগে চান (যেমন আগে inference, পরে measure theory)?