Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical Machine Learning)¶
মডেলিং (Part V) থেকে এবার শেখার তত্ত্ব ও আধুনিক ML: কেন learning কাজ করে (generalization), capacity নিয়ন্ত্রণ (regularization), classifier-দের পরিবার (LDA/QDA/NB/kNN, SVM), ensemble (trees → bagging → boosting), unsupervised (EM/GMM, manifold learning), আর বাস্তব frontier (anomaly, semi-supervised, online)। পরিসংখ্যানের ভিত্তির উপর দাঁড়িয়ে আধুনিক ML-এর পূর্ণ toolkit। Part 0–V ধরে নেওয়া হয়েছে।
প্রতিটি অধ্যায়ে ৮টি অংশ — ভূমিকা → মূল ধারণা → উদাহরণ → প্রমাণ → কোড ল্যাব (Python) → ভিজ্যুয়ালাইজেশন → অনুশীলনী → সারসংক্ষেপ। সমাধান: _solutions/।
অধ্যায়সমূহ (Chapters)¶
| # | অধ্যায় | মূল বিষয় |
|---|---|---|
| 6.1 | Learning Theory: Bias–Variance, Generalization & Overfitting | risk vs empirical risk, ERM, generalization gap, bias–variance decomposition, PAC, VC dimension, no-free-lunch |
| 6.2 | Regularization: Ridge, Lasso & Sparse Regression | L2/L1 penalty, shrinkage, sparsity, soft-thresholding, elastic net, regularization path |
| 6.3 | Classification I: LDA, QDA, Naive Bayes & k-NN | Bayes classifier & error, generative vs discriminative, linear/quadratic boundaries, conditional independence |
| 6.4 | Classification II: SVM & Kernel Methods | max-margin, support vectors, soft margin/\(C\), hinge loss, Lagrangian dual, kernel trick (RBF) |
| 6.5 | Decision Trees, Bagging & Random Forests | CART, Gini/entropy, bagging variance reduction \(\rho\sigma^2+\frac{1-\rho}{B}\sigma^2\), OOB, feature importance |
| 6.6 | Boosting: AdaBoost & Gradient Boosting | sequential weak learners, exponential loss, \(\alpha_t\), functional gradient descent, shrinkage \(\nu\) |
| 6.7 | Density Estimation, EM & Gaussian Mixture Models | mixture models, latent variables, EM (E/M-step, ELBO), responsibilities, BIC |
| 6.8 | Nonlinear Dimensionality Reduction & Manifold Learning | manifold hypothesis, kernel PCA, MDS, Isomap (geodesic), LLE, t-SNE, trustworthiness |
| 6.9 | Anomaly Detection, Semi-Supervised & Online Learning | Mahalanobis/χ², Isolation Forest, LOF, One-Class SVM; label propagation; online/regret |
নির্মাণ পদ্ধতি (Build method)¶
প্রতিটি অধ্যায় ৬ জন writer + ৩ জন reviewer agent দিয়ে তৈরি (header+ধারণা / উদাহরণ / প্রমাণ / কোড ল্যাব / চিত্র / অনুশীলনী+সমাধান+পরিভাষা), shared brief ও আগে-থেকে-গণিত canonical সংখ্যা মেনে; তারপর math · code · pedagogy reviewer স্বাধীনভাবে যাচাই (sklearn-এ সংখ্যা পুনরুৎপাদন, প্রমাণ, চিত্র, সংগতি)। fixed seed 20260619, ৪টি করে generated figure, runnable Python (scikit-learn)।
এরপর (Next)¶
Part VII — মেজার-তাত্ত্বিক সম্ভাব্যতা (Measure-Theoretic Probability): σ-algebra, Lebesgue integration, convergence theorems, martingales — Klenke-ভিত্তিক PhD-স্তরের চূড়া, যেখানে এতদিনের সব ধারণা কঠোর measure-তত্ত্বের ভিত্তি পায়।
পরিভাষা: ../GLOSSARY.md · পরিকল্পনা: ../PLAN.md · সিলেবাস: ../README.md