Skip to content

Integrative Capstone Project — শূন্য→PhD পরিসংখ্যানের প্রতিটি ধারণা, এক জায়গায়

এই project পুরো শিক্ষাক্রমের (Parts 0–VII, ৬২ অধ্যায়) প্রতিটি অধ্যায়ের একটি flagship ধারণা নিয়ে চারভাবে দেখায় — (১) scratch থেকে implement, (২) library version, (৩) empirical demonstration/"proof", (৪) visualization — সব real open data-তে। উদ্দেশ্য: তত্ত্বকে চলমান, যাচাইযোগ্য কোডে রূপ দেওয়া।

পূর্ণ পরিকল্পনা ও অধ্যায়→ধারণা→dataset map: CAPSTONE_PLAN.md

গঠন (Structure)

capstone-project/
  CAPSTONE_PLAN.md     # master spec: flagship-concept-per-chapter map
  README.md            # this file
  data/                # 7 bundled REAL datasets (CSV, offline)
  src/common.py        # data loaders, seed, figure style, helpers
  notebooks/           # one .ipynb per Part (00..07) — runnable end-to-end
  docs/                # one .md per Part — curriculum-style writeup (Bangla + English terms)
  solutions/           # one .md per Part — full worked solutions
  figures/             # generated PNGs (prefix Part-Chapter-*)

Real datasets (data/, offline-bundled)

iris (150×5) · wine (178×14) · breast_cancer (569×31) · digits (1797×65) · diabetes (442×11) · co2 (weekly time series) · sunspots (309×2)। সব sklearn.datasets / statsmodels থেকে reproducibly সংরক্ষিত (network লাগে না)।

চালানো (How to run)

প্রতিটি notebook src/common.py-র উপর দাঁড়ায় (fixed seed 20260619)। execute:

cd capstone-project/notebooks
python3 -m nbconvert --to notebook --execute --inplace 00-foundations.ipynb --ExecutePreprocessor.timeout=600

অথবা Jupyter-এ খুলে cell-by-cell চালান। প্রতিটি Part-module-এর সঙ্গী docs/ (ব্যাখ্যা) ও solutions/ (পূর্ণ সমাধান)।

Deliverable মানচিত্র (Parts 0–VII)

notebook / doc Part flagship demos
00-foundations 0 sets/logic, combinatorics, derivative-optimization (gradient descent), integration, linear algebra (eigen), numpy vectorization
01-descriptive-eda I location/spread, distributions (KDE/ECDF/QQ), correlation, EDA case study
02-probability II axioms, Bayes/naive-Bayes, discrete & continuous dists, expectation/MGF, joint/covariance, transforms/order stats
03-convergence-processes III inequalities, convergence types, LLN, CLT+delta, Poisson/Gaussian process, Markov chain + MCMC
04-inference IV sampling dist, MoM, MLE, estimator properties, Fisher/CRLB, CI+coverage, t-test+power, LRT/Wald/score, bootstrap, Bayesian
05-modeling V OLS scratch, diagnostics, ANOVA, logistic IRLS, Poisson GLM, mixed-effects, nonparametric, CV, PCA+k-means
06-statistical-ml VI bias–variance, ridge/lasso, LDA/QDA/NB/kNN, SVM/kernel, trees/RF, boosting, EM/GMM, manifold, anomaly
07-measure-theoretic VII Dirichlet/Cantor, empirical measure, pushforward, Lebesgue=averaging, Lp/L²-projection/RN, SLLN, E[X|group], martingale, char-function→CLT

এর পাশাপাশি Part VIII (../curriculum/part-8-capstone/): 8.1 end-to-end project · 8.2 simulation study · 8.3 paper reproduction · 8.4 where-next — curriculum-style অধ্যায়।


এই project ও Part VIII মিলিয়ে গোটা শূন্য→PhD যাত্রার সমাপ্তি।