Integrative Capstone Project — শূন্য→PhD পরিসংখ্যানের প্রতিটি ধারণা, এক জায়গায়¶
এই project পুরো শিক্ষাক্রমের (Parts 0–VII, ৬২ অধ্যায়) প্রতিটি অধ্যায়ের একটি flagship ধারণা নিয়ে চারভাবে দেখায় — (১) scratch থেকে implement, (২) library version, (৩) empirical demonstration/"proof", (৪) visualization — সব real open data-তে। উদ্দেশ্য: তত্ত্বকে চলমান, যাচাইযোগ্য কোডে রূপ দেওয়া।
পূর্ণ পরিকল্পনা ও অধ্যায়→ধারণা→dataset map: CAPSTONE_PLAN.md।
গঠন (Structure)¶
capstone-project/
CAPSTONE_PLAN.md # master spec: flagship-concept-per-chapter map
README.md # this file
data/ # 7 bundled REAL datasets (CSV, offline)
src/common.py # data loaders, seed, figure style, helpers
notebooks/ # one .ipynb per Part (00..07) — runnable end-to-end
docs/ # one .md per Part — curriculum-style writeup (Bangla + English terms)
solutions/ # one .md per Part — full worked solutions
figures/ # generated PNGs (prefix Part-Chapter-*)
Real datasets (data/, offline-bundled)¶
iris (150×5) · wine (178×14) · breast_cancer (569×31) · digits (1797×65) · diabetes (442×11) · co2 (weekly time series) · sunspots (309×2)। সব sklearn.datasets / statsmodels থেকে reproducibly সংরক্ষিত (network লাগে না)।
চালানো (How to run)¶
প্রতিটি notebook src/common.py-র উপর দাঁড়ায় (fixed seed 20260619)। execute:
cd capstone-project/notebooks
python3 -m nbconvert --to notebook --execute --inplace 00-foundations.ipynb --ExecutePreprocessor.timeout=600
অথবা Jupyter-এ খুলে cell-by-cell চালান। প্রতিটি Part-module-এর সঙ্গী docs/ (ব্যাখ্যা) ও solutions/ (পূর্ণ সমাধান)।
Deliverable মানচিত্র (Parts 0–VII)¶
| notebook / doc | Part | flagship demos |
|---|---|---|
00-foundations |
0 | sets/logic, combinatorics, derivative-optimization (gradient descent), integration, linear algebra (eigen), numpy vectorization |
01-descriptive-eda |
I | location/spread, distributions (KDE/ECDF/QQ), correlation, EDA case study |
02-probability |
II | axioms, Bayes/naive-Bayes, discrete & continuous dists, expectation/MGF, joint/covariance, transforms/order stats |
03-convergence-processes |
III | inequalities, convergence types, LLN, CLT+delta, Poisson/Gaussian process, Markov chain + MCMC |
04-inference |
IV | sampling dist, MoM, MLE, estimator properties, Fisher/CRLB, CI+coverage, t-test+power, LRT/Wald/score, bootstrap, Bayesian |
05-modeling |
V | OLS scratch, diagnostics, ANOVA, logistic IRLS, Poisson GLM, mixed-effects, nonparametric, CV, PCA+k-means |
06-statistical-ml |
VI | bias–variance, ridge/lasso, LDA/QDA/NB/kNN, SVM/kernel, trees/RF, boosting, EM/GMM, manifold, anomaly |
07-measure-theoretic |
VII | Dirichlet/Cantor, empirical measure, pushforward, Lebesgue=averaging, Lp/L²-projection/RN, SLLN, E[X|group], martingale, char-function→CLT |
এর পাশাপাশি Part VIII (../curriculum/part-8-capstone/): 8.1 end-to-end project · 8.2 simulation study · 8.3 paper reproduction · 8.4 where-next — curriculum-style অধ্যায়।
এই project ও Part VIII মিলিয়ে গোটা শূন্য→PhD যাত্রার সমাপ্তি।