Skip to content

Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical Machine Learning)

মডেলিং (Part V) থেকে এবার শেখার তত্ত্ব ও আধুনিক ML: কেন learning কাজ করে (generalization), capacity নিয়ন্ত্রণ (regularization), classifier-দের পরিবার (LDA/QDA/NB/kNN, SVM), ensemble (trees → bagging → boosting), unsupervised (EM/GMM, manifold learning), আর বাস্তব frontier (anomaly, semi-supervised, online)। পরিসংখ্যানের ভিত্তির উপর দাঁড়িয়ে আধুনিক ML-এর পূর্ণ toolkit। Part 0–V ধরে নেওয়া হয়েছে।

প্রতিটি অধ্যায়ে ৮টি অংশ — ভূমিকা → মূল ধারণা → উদাহরণ → প্রমাণ → কোড ল্যাব (Python) → ভিজ্যুয়ালাইজেশন → অনুশীলনী → সারসংক্ষেপ। সমাধান: _solutions/

অধ্যায়সমূহ (Chapters)

# অধ্যায় মূল বিষয়
6.1 Learning Theory: Bias–Variance, Generalization & Overfitting risk vs empirical risk, ERM, generalization gap, bias–variance decomposition, PAC, VC dimension, no-free-lunch
6.2 Regularization: Ridge, Lasso & Sparse Regression L2/L1 penalty, shrinkage, sparsity, soft-thresholding, elastic net, regularization path
6.3 Classification I: LDA, QDA, Naive Bayes & k-NN Bayes classifier & error, generative vs discriminative, linear/quadratic boundaries, conditional independence
6.4 Classification II: SVM & Kernel Methods max-margin, support vectors, soft margin/\(C\), hinge loss, Lagrangian dual, kernel trick (RBF)
6.5 Decision Trees, Bagging & Random Forests CART, Gini/entropy, bagging variance reduction \(\rho\sigma^2+\frac{1-\rho}{B}\sigma^2\), OOB, feature importance
6.6 Boosting: AdaBoost & Gradient Boosting sequential weak learners, exponential loss, \(\alpha_t\), functional gradient descent, shrinkage \(\nu\)
6.7 Density Estimation, EM & Gaussian Mixture Models mixture models, latent variables, EM (E/M-step, ELBO), responsibilities, BIC
6.8 Nonlinear Dimensionality Reduction & Manifold Learning manifold hypothesis, kernel PCA, MDS, Isomap (geodesic), LLE, t-SNE, trustworthiness
6.9 Anomaly Detection, Semi-Supervised & Online Learning Mahalanobis/χ², Isolation Forest, LOF, One-Class SVM; label propagation; online/regret

নির্মাণ পদ্ধতি (Build method)

প্রতিটি অধ্যায় ৬ জন writer + ৩ জন reviewer agent দিয়ে তৈরি (header+ধারণা / উদাহরণ / প্রমাণ / কোড ল্যাব / চিত্র / অনুশীলনী+সমাধান+পরিভাষা), shared brief ও আগে-থেকে-গণিত canonical সংখ্যা মেনে; তারপর math · code · pedagogy reviewer স্বাধীনভাবে যাচাই (sklearn-এ সংখ্যা পুনরুৎপাদন, প্রমাণ, চিত্র, সংগতি)। fixed seed 20260619, ৪টি করে generated figure, runnable Python (scikit-learn)।

এরপর (Next)

Part VII — মেজার-তাত্ত্বিক সম্ভাব্যতা (Measure-Theoretic Probability): σ-algebra, Lebesgue integration, convergence theorems, martingales — Klenke-ভিত্তিক PhD-স্তরের চূড়া, যেখানে এতদিনের সব ধারণা কঠোর measure-তত্ত্বের ভিত্তি পায়।


পরিভাষা: ../GLOSSARY.md · পরিকল্পনা: ../PLAN.md · সিলেবাস: ../README.md