Skip to content

Part V — পরিসংখ্যানিক মডেলিং (Statistical Modeling)

inference (Part IV) থেকে এবার মডেল-এ: data-র ভেতরের সম্পর্ক ধরা, যাচাই করা, প্রসারিত করা ও কাঠামো খোঁজা। সরল রেখা থেকে শুরু করে GLM, mixed model, nonparametric curve, cross-validation, আর শেষে unsupervised (PCA/clustering) — আধুনিক applied statistics ও data science-এর মূল হাতিয়ার। Part 0–IV ধরে নেওয়া হয়েছে।

প্রতিটি অধ্যায়ে ৮টি অংশ — ভূমিকা → মূল ধারণা → উদাহরণ → প্রমাণ → কোড ল্যাব (Python) → ভিজ্যুয়ালাইজেশন → অনুশীলনী → সারসংক্ষেপ। সমাধান: _solutions/

অধ্যায়সমূহ (Chapters)

# অধ্যায় মূল বিষয়
5.1 Simple & Multiple Linear Regression OLS, design matrix \(X\beta\), \(\hat\beta=(X^\top X)^{-1}X^\top y\), \(R^2\), multiple predictors
5.2 Regression Diagnostics, Inference & Selection residual plots, leverage, Cook's distance, VIF, \(t\)/\(F\), AIC/BIC, stepwise
5.3 ANOVA & Experimental Design one/two-way ANOVA, \(F\)-test, interaction, ANOVA = dummy-variable regression, design
5.4 GLM: Logistic Regression logit link, odds ratio, Bernoulli MLE/IRLS, deviance, confusion matrix, ROC/AUC
5.5 GLM: Poisson Regression & Beyond log link, rate ratio, offset, overdispersion, quasi-Poisson, Negative Binomial
5.6 Mixed-Effects / Hierarchical Models fixed vs random effects, variance components, ICC, shrinkage/BLUP, REML
5.7 Nonparametric Regression: Kernels & Splines Nadaraya–Watson, bandwidth, B-splines, smoothing spline, effective df = \(\operatorname{tr}(S)\)
5.8 Cross-Validation & Model Validation train vs test error, \(K\)-fold, LOOCV, optimism, one-standard-error rule
5.9 Multivariate Methods: PCA & Clustering PCA (eigen-decomposition, explained variance), \(k\)-means, elbow & silhouette

নির্মাণ পদ্ধতি (Build method)

এই Part-এর প্রতিটি অধ্যায় ৬ জন writer + ৩ জন reviewer agent দিয়ে তৈরি: ছয় writer আলাদা অংশ লেখেন (header+ধারণা / উদাহরণ / প্রমাণ / কোড ল্যাব / চিত্র / অনুশীলনী+সমাধান+পরিভাষা — একটি shared brief ও আগে-থেকে-গণিত canonical সংখ্যা মেনে), তারপর math · code · pedagogy reviewer স্বাধীনভাবে যাচাই করেন (সংখ্যা পুনরুৎপাদন, প্রমাণ, চিত্র, সংগতি) — সব scratch থেকে ব্যাখ্যা নিশ্চিত করতে। প্রতিটি অধ্যায়ে fixed seed 20260619-এ পুনরুৎপাদনযোগ্য dataset, ৪টি করে generated figure, ও runnable Python কোড।

এরপর (Next)

Part VI — পরিসংখ্যানিক মেশিন লার্নিং (Statistical ML): regularization (ridge/lasso), SVM, decision tree, random forest, boosting, EM — Part V-এর মডেল-ভিত্তির উপর আরও শক্তিশালী predictive model।


পরিভাষা: ../GLOSSARY.md · পরিকল্পনা: ../PLAN.md · সিলেবাস: ../README.md