Skip to content

4.6 — Confidence Intervals (আস্থা ব্যবধান)

১ · ভূমিকা ও insight (অন্তর্দৃষ্টি) — একটিমাত্র সংখ্যা কখনো ঠিক সত্য নয়; তবে কতটা নিশ্চিত?

১.১ আগের অধ্যায়গুলো কোথায় রেখে এসেছিল — আর এখন কোন প্রশ্ন

Part IV-এর এ পর্যন্ত আমরা point estimation (বিন্দু-অনুমান) শিখেছি — অজানা parameter \(\theta\)-র জন্য data থেকে একটিমাত্র সংখ্যা \(\hat\theta\) বানানো। সংক্ষেপে মনে করিয়ে দিই, কারণ এই অধ্যায়ের গল্পটা ঠিক সেখান থেকেই শুরু:

  • 4.1-এ আমরা শিখেছি কোথাও একটা population (সমগ্রক / জনসমষ্টি) আছে, যার ভেতরে একটা স্থির কিন্তু অজানা সংখ্যা লুকিয়ে — তার নাম parameter (প্যারামিটার / প্রাচল), প্রতীকে \(\theta\) ("থিটা")। আমরা পুরো population দেখি না; পাই কেবল একটা sample (নমুনা) — \(n\)টি পর্যবেক্ষণ \(X_1, X_2, \dots, X_n\)। data থেকে \(\theta\) আন্দাজ করার সূত্রকে বলি estimator (আনুমানক), প্রতীকে "টুপি" দিয়ে \(\hat\theta\)। যেহেতু \(\hat\theta\) random data-র উপর নির্ভর করে, \(\hat\theta\) নিজেও একটা random variable — নমুনা বদলালে এর মানও বদলায়, আর তার নিজস্ব একটা বণ্টন আছে, যাকে বলি sampling distribution (স্যাম্পলিং বণ্টন)।
  • 4.4-এ (Properties of Estimators) আমরা estimator-এর মান বিচার করার যন্ত্র গড়েছি — bias, variance, এবং সবচেয়ে কাজে লাগবে এখানে: standard error (\(\mathrm{SE}\)), যা estimator-এর standard deviation, অর্থাৎ "\(\hat\theta\) নমুনা-থেকে-নমুনায় গড়ে কতখানি ওঠানামা করে" তার মাপ। সবচেয়ে পরিচিত: \(\mathrm{SE}(\bar X) = \sigma/\sqrt n\)
  • 3.4-এ (CLT) আমরা পেয়েছি একটা শক্তিশালী সত্য: যথেষ্ট বড় \(n\)-এ নমুনা গড় \(\bar X\) প্রায় Normal\(\bar X \approx \mathcal{N}\!\big(\mu,\ \sigma^2/n\big)\) (\(\mathcal{N}\) = Normal বণ্টন)। এই Normal-আকৃতিই এই অধ্যায়ে আমাদের সব হিসাবের ভিত্তি হবে।

তাহলে এখন আমাদের হাতে কী আছে? অজানা \(\theta\) আর তার একটা best-guess সংখ্যা \(\hat\theta\)। কিন্তু একটা অস্বস্তি রয়ে গেছে, যা গত অধ্যায়গুলো সযত্নে এড়িয়ে গেছে — আর সেই অস্বস্তি থেকেই এই অধ্যায়ের প্রশ্ন জন্ম নেয়:

আমি যে একটিমাত্র সংখ্যা \(\hat\theta\) রিপোর্ট করলাম, সেটা তো প্রায় নিশ্চিতভাবেই সত্য \(\theta\)-র সমান নয়। তাহলে সেই অনিশ্চয়তাটা আমি কীভাবে সংখ্যায় প্রকাশ করব — যাতে পাঠক জানে আমার আন্দাজ কতটা ভরসাযোগ্য, আর সত্য মান কোন পরিসরে থাকার কথা?

লক্ষ করুন, এতদিন আমরা কেবল \(\hat\theta\) বানিয়ে এক সংখ্যা হাতে ধরিয়ে দিয়েছি — তার সাথে কোনো "অনিশ্চয়তার ছাপ" দিইনি। এই অধ্যায়ের কাজ ঠিক সেই ছাপ যোগ করা: একটা সংখ্যার বদলে একটা ব্যবধান (interval) দেওয়া, আর সেই ব্যবধানের সাথে একটা পরিমাপযোগ্য আস্থা (confidence) জুড়ে দেওয়া।

১.২ Hook — একটিমাত্র বিন্দু বনাম একটি জাল

একটা ছবি দিয়ে শুরু করি। কল্পনা করুন আপনি একটা অন্ধকার ঘরে দেয়ালের কোথাও একটা পেরেক (= সত্য \(\theta\)) আছে জেনে সেটায় ঢিল ছুঁড়ছেন। আপনার কাছে দুটো কৌশল:

  1. একটিমাত্র সুচালো তীর ছোঁড়া (= point estimate \(\hat\theta\))। সমস্যা: পেরেকটা ঠিক যেখানে, তীরের ডগা হুবহু সেখানে পড়ার সম্ভাবনা কার্যত শূন্য — continuous পরিমাপে কোনো একটা নির্দিষ্ট বিন্দুতে আঘাতের সম্ভাবনা \(0\)। তীর প্রায় সবসময়ই একটু এদিক-ওদিক পড়বে, আর আপনি জানবেনও না কতটা ফসকালো।
  2. একটা জাল বা চওড়া আঠালো পট্টি ছোঁড়া (= confidence interval)। এবার আপনি একটা বিন্দু নয়, একটা এলাকা ঢাকছেন। পট্টিটা যথেষ্ট চওড়া হলে পেরেক তার ভেতরে ধরা পড়ার একটা ভালো সম্ভাবনা থাকে — আর সেই সম্ভাবনাটা আপনি পট্টির চওড়াই দিয়ে নিয়ন্ত্রণ করতে পারেন।

পরিসংখ্যানে এই "জাল" বা "পট্টি"-ই হলো confidence interval — সত্য parameter \(\theta\)-কে ঘিরে রাখার জন্য data থেকে গড়া একটা ব্যবধান। আর "পট্টিটা কতটা চওড়া করলে কত শতাংশ বার পেরেক ধরা পড়বে" — সেই শতাংশটাই confidence level

একটা বাস্তব উদাহরণ যা সবাই কোথাও না কোথাও দেখেছে: কোনো জনমত-জরিপের রিপোর্টে লেখা থাকে —

"প্রার্থী A-র সমর্থন ৫২% ± ৩% (৯৫% confidence)।"

এখানে \(52\%\) হলো point estimate \(\hat p\), \(\pm 3\%\) হলো margin of error (ত্রুটির সীমা), আর গোটা ব্যবধান \([49\%,\ 55\%]\) হলো confidence interval — "৯৫% confidence" সহ। এই এক লাইনের বাক্যেই এই অধ্যায়ের সব উপাদান লুকিয়ে: একটা কেন্দ্র, একটা \(\pm\) চওড়াই, আর একটা শতাংশ-আস্থা। আমাদের কাজ এই প্রতিটি টুকরো from scratch বোঝা — এবং সবচেয়ে গুরুত্বপূর্ণ, সেই "৯৫%" আসলে কী মানে, তা নিখুঁতভাবে ধরা।

১.৩ "৯৫% confidence" আসলে কী মানে — আর কী মানে নয়

এই অধ্যায়ের সবচেয়ে সূক্ষ্ম, সবচেয়ে বেশি ভুল-বোঝা, এবং সবচেয়ে গুরুত্বপূর্ণ ধারণাটা এখানেই — তাই একদম গোড়াতেই স্বজ্ঞার স্তরে গেঁথে দিই (§২.৪-এ আনুষ্ঠানিকভাবে ফিরব)।

প্রায় সবাই প্রথমবার "৯৫% confidence interval \([49\%,\ 55\%]\)" শুনে ভাবে:

(ভুল ব্যাখ্যা) "সত্য সমর্থন \(p\) ৯৫% সম্ভাবনায় \(49\%\) আর \(55\%\)-এর মধ্যে আছে।"

শুনতে নিরীহ, কিন্তু এটা ভুল — এবং কেন ভুল, সেটাই এই অধ্যায়ের আসল শিক্ষা। সমস্যাটা একটা গভীর জায়গায়: এই বাক্য ধরে নিচ্ছে সত্য \(p\) একটা random জিনিস যা "৯৫% সময় এখানে, ৫% সময় ওখানে" থাকে। কিন্তু আমাদের পুরো কাঠামোয় (4.1 থেকে) —

সত্য parameter \(\theta\) (এখানে \(p\)) একটা স্থির সংখ্যা — random নয়, শুধু অজানা। সে একটাই নির্দিষ্ট মান, যেটা হয় ওই ব্যবধানের ভেতরে আছে, নয়তো নেই। কোনো "সম্ভাবনা" এখানে নেই — একটা স্থির সংখ্যা একটা স্থির ব্যবধানের ভেতরে থাকা বা না-থাকা একটা হ্যাঁ/না ব্যাপার, \(0\) বা \(1\), ৯৫% নয়।

তাহলে "৯৫%" কোথা থেকে আসে, আর সেটা কীসের সম্ভাবনা? উত্তর: randomness-টা parameter-এ নেই, আছে ব্যবধানটায়। ব্যবধানের দুই প্রান্ত (\(\hat\theta - m\) আর \(\hat\theta + m\)) data থেকে গণনা করা, তাই নমুনা বদলালে ব্যবধানটাই নড়ে — প্রতিবার নতুন নমুনায় একটা নতুন ব্যবধান। কাজেই সঠিক ব্যাখ্যাটা ব্যবধানের পদ্ধতি নিয়ে, কোনো একটা নির্দিষ্ট ব্যবধান নিয়ে নয়:

(সঠিক ব্যাখ্যা) "এই পদ্ধতি — অর্থাৎ এভাবে নমুনা নিয়ে এভাবে ব্যবধান বানানো — বারবার চালালে, তৈরি হওয়া ব্যবধানগুলোর ৯৫% সত্য \(p\)-কে নিজের ভেতরে ধরবে (আর ৫% ফসকাবে)। হাতে-পাওয়া এই একটা ব্যবধান সেই ৯৫%-এর একটা কি না, তা আমরা জানি না — শুধু জানি পদ্ধতিটা দীর্ঘমেয়াদে ৯৫% বার সফল।"

পার্থক্যটা সূক্ষ্ম কিন্তু আকাশ-পাতাল: ৯৫% হলো ব্যবধান-তৈরির পদ্ধতির সাফল্যের হার, কোনো নির্দিষ্ট ব্যবধানে সত্যের "থাকার সম্ভাবনা" নয়। parameter স্থির; ব্যবধানটা random — তাই "ধরা পড়া/না-পড়া" ঘটনাটার randomness ব্যবধানের দিক থেকে আসে, parameter-এর দিক থেকে নয়।

একটা রূপক দিয়ে গেঁথে নিন: ভাবুন পেরেকটা (সত্য \(\theta\)) দেয়ালে স্থির পেরেক-ই — সে নড়ে না। আপনি বারবার চোখ বুজে একটা নির্দিষ্ট-চওড়ার আংটা ছুঁড়ছেন। আংটাটাই প্রতিবার একটু আলাদা জায়গায় পড়ে (random)। "৯৫% confidence" মানে আপনার ছোঁড়ার কৌশলটা এমন যে ছোঁড়া আংটার ৯৫% পেরেককে ঘিরে ফেলে। একটা নির্দিষ্ট আংটা পেরেক ঘিরেছে কি না — সেটা ছোঁড়ার পর হ্যাঁ অথবা না, ৯৫% কিছু নয়। (Figure 4-6-ci-interpretation এই বহু-ব্যবধানের ছবিটা — কিছু সত্যকে ধরে, কিছু ফসকায় — চোখে দেখাবে।)

এক বাক্যে যা সারা জীবন মনে রাখবেন: confidence level সত্য parameter-এর গুণ নয়, পদ্ধতির গুণ। "৯৫%" বলে পদ্ধতিটা কত ভরসাযোগ্য, ওই একটা ব্যবধানে সত্য কতটা "সম্ভাব্য" তা নয়।

১.৪ এক লাইনের মানচিত্র — এই অধ্যায় কোথায় যাবে

পুরো অধ্যায়ের যুক্তি-শৃঙ্খলটা একবারে দেখে নিই, যাতে প্রতিটি অংশ কেন আসছে তা পরিষ্কার থাকে:

  1. §২ — CI-র শব্দভাণ্ডার from scratch: confidence level \(1-\alpha\), confidence interval, margin of error \(m=z_{\alpha/2}\cdot\mathrm{SE}\), pivot, critical value \(z_{\alpha/2}\) / \(t_{n-1,\alpha/2}\); pivot থেকে CI গড়ার সাধারণ রেসিপি; সঠিক বনাম ভুল interpretation (ব্যবধান random, parameter স্থির); এবং z বনাম t কখন। প্রতিটি প্রতীক খোলা হবে।
  2. §৩ — চারটি পূর্ণাঙ্গ উদাহরণ সংখ্যাসহ: E1 (Normal mean, σ জানা → z-interval), E2 (Normal mean, σ অজানা → t-interval), E3 (proportion-এর CI), E4 (MLE থেকে asymptotic CI, \(\mathrm{SE}=1/\sqrt{nI}\))।
  3. §৪–৫ — pivot-পদ্ধতির পূর্ণ যৌক্তিক ভিত্তি, coverage probability-র নিখুঁত গণনা, one-sided CI, sample-size নির্ধারণ (\(m\) থেকে \(n\)), এবং interpretation-এর গভীরতর আলোচনা ও Bayesian credible interval-এর সাথে পার্থক্য।
  4. §৬–৮ — চিত্র (coverage, interpretation, z-vs-t, width-vs-n), সাধারণ ভুল-ধারণা, কোড ও অনুশীলনী।

এক বাক্যে কেন এটি Part IV-এর গুরুত্বপূর্ণ ধাপ। 4.2–4.4 দিয়েছে একটা বিন্দু-আন্দাজ (\(\hat\theta\)) আর তার অনিশ্চয়তার মাপ (\(\mathrm{SE}\)); এই অধ্যায় সেই দুটোকে একত্র করে একটা ব্যবধান-আন্দাজে রূপ দেয় — point estimate \(+\) margin of error। আর ঠিক একই pivot-যুক্তি সামান্য ঘুরিয়ে দিলেই জন্ম নেয় পরের অধ্যায় 4.7-এর hypothesis testing — কাজেই CI আর hypothesis test একই মুদ্রার দুই পিঠ, যা পরে দেখব।


২ · মূল ধারণা ও সংজ্ঞা

এই বিভাগে §১-এর স্বজ্ঞাগুলোকে আনুষ্ঠানিক সংজ্ঞায় রূপ দেব। প্রতিটি প্রতীক প্রথমবার আসার সাথে সাথেই খুলে বলা হবে; কোথাও কিছু ধরে নেওয়া হবে না।

পুরো বিভাগ জুড়ে কাঠামোটা স্থির: আমাদের কাছে একটি i.i.d. নমুনা \(X_1, X_2, \dots, X_n\) আছে (independent and identically distributed — স্বাধীন ও একই বণ্টন থেকে আসা), একটি common distribution থেকে, যার ভেতরে একটি অজানা স্থির parameter \(\theta\) আছে। আমরা একটি point estimator \(\hat\theta = \hat\theta(X_1,\dots,X_n)\) বেছেছি (যেমন \(\bar X\)), এবং তার standard error \(\mathrm{SE}(\hat\theta)\) জানি (4.4)। প্রশ্ন: এই \(\hat\theta\)-কে ঘিরে কীভাবে একটা ব্যবধান বানাব যা সত্য \(\theta\)-কে নির্দিষ্ট আস্থায় ধরে?

২.১ Confidence level ও confidence interval — সংজ্ঞা

প্রথমে দুটো মূল বস্তু সংজ্ঞায়িত করি: কত আস্থা চাই (confidence level), আর সেই আস্থার ব্যবধানটা কী (confidence interval)।

সংজ্ঞা (Confidence level — আস্থার মাত্রা, \(1-\alpha\))। আমরা আগে থেকে একটা লক্ষ্য-আস্থা ঠিক করি, যাকে লিখি \(1-\alpha\) — একটা সংখ্যা \(0\) আর \(1\)-এর মধ্যে (সাধারণত \(0.90\), \(0.95\), বা \(0.99\))। এখানে —

  • \(\alpha\) ("আলফা") হলো significance level বা ব্যর্থতার অনুমোদিত হার — যত ভগ্নাংশ বার আমরা পদ্ধতিটিকে সত্য ফসকাতে দিতে রাজি। যেমন \(\alpha = 0.05\) মানে আমরা মেনে নিই পদ্ধতি ৫% বার ফসকাবে।
  • \(1-\alpha\) হলো confidence level — যত ভগ্নাংশ বার পদ্ধতি সত্যকে ধরবে। \(\alpha = 0.05 \Rightarrow 1-\alpha = 0.95\), অর্থাৎ ৯৫% আস্থা।

সংজ্ঞা (Confidence interval — আস্থা ব্যবধান, CI)। parameter \(\theta\)-র একটি \(1-\alpha\) স্তরের confidence interval হলো data থেকে গণনা করা দুটি প্রান্ত \(L = L(X_1,\dots,X_n)\) (lower, নিম্নসীমা) ও \(U = U(X_1,\dots,X_n)\) (upper, ঊর্ধ্বসীমা) দিয়ে গড়া একটি ব্যবধান \([L,\ U]\), যা এই শর্ত মেটায়:

\[ \boxed{\ P\big(L \le \theta \le U\big) \;=\; 1-\alpha\ } \]

এই সমীকরণটা মন দিয়ে পড়ুন, কারণ এর ভেতরেই §১.৩-এর পুরো সূক্ষ্মতা লুকিয়ে। প্রতিটি অংশ খুলি:

  • \(\theta\) — সত্য, স্থির, অজানা parameter (random নয়)।
  • \(L\)\(U\) — ব্যবধানের দুই প্রান্ত; এরা data-র function, তাই এরাই random (নমুনা বদলালে এদের মান বদলায়)।
  • \(P(L \le \theta \le U)\) — এই সম্ভাবনাটা \(L\)\(U\)-র randomness-এর উপর নেওয়া (অর্থাৎ "সব সম্ভাব্য নমুনার উপর"), \(\theta\)-র উপর নয়। কথায়: "এলোমেলো প্রান্তওয়ালা ব্যবধান \([L,U]\) স্থির \(\theta\)-কে ঢেকে ফেলার সম্ভাবনা \(1-\alpha\)।"

সবচেয়ে গুরুত্বপূর্ণ পঠন-নির্দেশ: উপরের ঘটনাটা "\(\theta\) এদিক-ওদিক যায়" নয় — \(\theta\) পেরেকের মতো স্থির। বরং \([L,U]\) ব্যবধানটাই random, আর সম্ভাবনাটা সেই random ব্যবধান স্থির \(\theta\)-কে ধরতে পারার। তাই \(P(\cdot) = 1-\alpha\)-কে পড়তে হবে "পদ্ধতি \(1-\alpha\) ভগ্নাংশ বার ধরে", "এই ব্যবধানে \(\theta\) \(1-\alpha\) সম্ভাবনায় আছে" নয়। (হাতে নমুনা এসে গেলে \(L,U\) নির্দিষ্ট সংখ্যা হয়ে যায়, তখন আর কোনো randomness নেই — তাই তখন "৯৫% সম্ভাবনা" বলা অর্থহীন।)

বেশিরভাগ পরিচিত CI প্রতিসম (symmetric) — point estimate \(\hat\theta\)-কে কেন্দ্রে রেখে দুই দিকে সমান দূরত্ব \(m\)। তখন \(L = \hat\theta - m\), \(U = \hat\theta + m\), আর ব্যবধান লেখা হয় সংক্ষেপে:

\[ [\,\hat\theta - m,\ \ \hat\theta + m\,] \qquad\text{বা}\qquad \hat\theta \pm m . \]

এই \(m\)-এরই একটা নাম আছে — margin of error, পরের উপবিভাগের বিষয়।

২.২ Margin of error — ব্যবধানের অর্ধ-চওড়াই

সংজ্ঞা (Margin of error — ত্রুটির সীমা, \(m\))। প্রতিসম CI \(\hat\theta \pm m\)-এ \(m\)-কে বলে margin of error — point estimate থেকে প্রতিটি প্রান্তের দূরত্ব, অর্থাৎ ব্যবধানের অর্ধ-চওড়াই (half-width)। বেশিরভাগ ক্ষেত্রে এর রূপ:

\[ \boxed{\ m \;=\; z_{\alpha/2}\cdot \mathrm{SE}(\hat\theta)\ } \]

প্রতিটি প্রতীক খুলি:

  • \(\mathrm{SE}(\hat\theta)\) — estimator-এর standard error (4.4), অর্থাৎ তার standard deviation; এটা বলে \(\hat\theta\) স্বভাবতই কতখানি ওঠানামা করে। যত বড় \(\mathrm{SE}\), তত চওড়া ব্যবধান লাগবে — স্বজ্ঞায় সরল: আন্দাজ যত অনিশ্চিত, জাল তত চওড়া।
  • \(z_{\alpha/2}\) — একটা critical value (সংকট-মান), যা confidence level-এর উপর নির্ভর করে; এটা ঠিক করে "কত-গুণ \(\mathrm{SE}\) দূরে গেলে আমরা \(1-\alpha\) ভগ্নাংশ ভর ঢেকে ফেলব"। (এর precise সংজ্ঞা §২.৩-এ।)

এই একটা সমীকরণেই margin of error-এর তিন নিয়ন্ত্রকের সম্পর্ক স্পষ্ট, যা গোটা অধ্যায়ে ফিরে আসবে:

  • বেশি আস্থা চাইলে (\(1-\alpha\) বাড়ালে, যেমন ৯৫% → ৯৯%) → \(z_{\alpha/2}\) বড় হয় → \(m\) বড় → চওড়া ব্যবধান। অর্থাৎ বেশি নিশ্চিত হতে চাইলে কম নির্দিষ্ট হতে হয় (চওড়া জাল)। এটা একটা মৌলিক আপস: precision বনাম confidence।
  • বেশি data নিলে (\(n\) বাড়ালে) → সাধারণত \(\mathrm{SE} \propto 1/\sqrt n\) কমে → \(m\) ছোট → সরু ব্যবধান। তাই \(n\) চারগুণ করলে ব্যবধান অর্ধেক সরু (\(\sqrt n\) নিয়ম)। (Figure 4-6-ci-width-vs-n এই সংকোচন দেখাবে।)
  • কম ছড়ানো data (ছোট \(\sigma\)) → ছোট \(\mathrm{SE}\) → সরু ব্যবধান।

মনে রাখুন: margin of error \(=\) critical value \(\times\) standard error। CI-র গোটা কাঠামোটা তাই দুই টুকরো — একটা কেন্দ্র (\(\hat\theta\), point estimate, 4.2–4.3 থেকে) আর একটা ব্যাসার্ধ (\(m = z_{\alpha/2}\,\mathrm{SE}\), এই অধ্যায়)। CI = point estimate \(\pm\) (critical value \(\times\) SE)।

২.৩ Pivot ও critical value — ব্যবধানটা কোথা থেকে আসে

§২.১-এ আমরা CI-র সংজ্ঞা দিয়েছি (\(P(L\le\theta\le U)=1-\alpha\)), কিন্তু এমন \(L,U\) আসলে কীভাবে খুঁজে পাব তা বলিনি। এখানেই pivot ধারণাটা — CI গড়ার সবচেয়ে সাধারণ ও সুন্দর কৌশল।

মূল ধারণা। আমরা এমন একটা পরিমাণ চাই যেটা (ক) data ও অজানা \(\theta\) — দুটোর উপরই নির্ভর করে, অথচ (খ) যার বণ্টন \(\theta\)-র উপর নির্ভর করে না — একটা সর্বজনবিদিত, ছকে-দেখা বণ্টন। তাহলে সেই জানা বণ্টন থেকে দুটো প্রান্ত বের করে, ভেতরের \(\theta\)-কে আলাদা করে নিলেই CI পেয়ে যাব।

সংজ্ঞা (Pivot / pivotal quantity — মুখ্যাবলম্ব)। একটি pivot হলো data ও parameter-এর একটা function \(Q = Q(X_1,\dots,X_n;\ \theta)\) যার probability distribution \(\theta\)-র উপর নির্ভর করে না (সব \(\theta\)-তে একই বণ্টন)।

সবচেয়ে গুরুত্বপূর্ণ উদাহরণ — যেটা E1-এ সরাসরি কাজে লাগবে। ধরুন \(X_i \sim \mathcal{N}(\mu,\sigma^2)\), \(\sigma\) জানা, \(\mu\) অজানা। তখন standardize-করা নমুনা গড়:

\[ Z \;=\; \frac{\bar X - \mu}{\sigma/\sqrt n} \]

একটা pivot — কারণ (\(\bar X\)-এর sampling distribution Normal হওয়ায়, 4.1) এটা সবসময় standard normal \(\mathcal{N}(0,1)\), \(\mu\) যা-ই হোক না কেন। প্রতীক খুলি: লব \(\bar X - \mu\) মাপে point estimate সত্য থেকে কত দূরে, আর হর \(\sigma/\sqrt n = \mathrm{SE}(\bar X)\) সেই দূরত্বকে "কত SE দূরে"-তে রূপ দেয়; ফল \(Z\) একক-হীন, বণ্টন স্থির। (যথেষ্ট বড় \(n\)-এ CLT-র জোরে এটা Normal না হলেও প্রায় Normal — তাই pivot-যুক্তি অ-Normal data-তেও আসন্নভাবে খাটে।)

সংজ্ঞা (Critical value — সংকট-মান, \(z_{\alpha/2}\))। standard normal বণ্টনের upper-\(\alpha/2\) quantile-কে বলি \(z_{\alpha/2}\) — অর্থাৎ সেই সংখ্যা যার ডানে standard normal-এর ঠিক \(\alpha/2\) ভর পড়ে:

\[ \boxed{\ P\big(Z > z_{\alpha/2}\big) = \frac{\alpha}{2}, \qquad Z\sim\mathcal{N}(0,1)\ } \]

প্রতীক ও স্বজ্ঞা খুলি:

  • নিচের সূচক \(\alpha/2\) মানে ভরটা দুই লেজে সমান ভাগে (\(\alpha/2\) বাঁয়ে, \(\alpha/2\) ডানে) ভাগ করা — কারণ আমরা দুই-পাশে সমান প্রতিসম ব্যবধান চাই। মাঝখানে তাই \(1-\alpha\) ভর থাকে।
  • সবচেয়ে চেনা মান: \(1-\alpha = 0.95 \Rightarrow \alpha/2 = 0.025 \Rightarrow z_{0.025} = 1.96\) (প্রায় \(2\))। তাই বিখ্যাত "\(\pm 2\) SE" নিয়ম আসলে ৯৫% CI।
  • অন্য পরিচিত মান: \(z_{0.05} = 1.645\) (৯০% CI), \(z_{0.005} = 2.576\) (৯৯% CI)।

এই দুই সংজ্ঞা মিলিয়ে এখন CI-র জন্ম দেখি। যেহেতু মাঝের \(1-\alpha\) ভর \([-z_{\alpha/2},\ z_{\alpha/2}]\)-এর মধ্যে:

\[ P\!\left(-z_{\alpha/2} \le \frac{\bar X - \mu}{\sigma/\sqrt n} \le z_{\alpha/2}\right) = 1-\alpha . \]

এবার ভেতরের অসমতা থেকে \(\mu\)-কে আলাদা করি (তিন অংশকে \(\sigma/\sqrt n\) দিয়ে গুণ করে, তারপর \(\bar X\) বিয়োগ করে চিহ্ন উল্টে সাজিয়ে):

\[ P\!\left(\bar X - z_{\alpha/2}\,\frac{\sigma}{\sqrt n} \;\le\; \mu \;\le\; \bar X + z_{\alpha/2}\,\frac{\sigma}{\sqrt n}\right) = 1-\alpha . \]

এটাই ঠিক §২.১-এর CI-সংজ্ঞার আকার (\(P(L\le\theta\le U)=1-\alpha\)), যেখানে \(L = \bar X - z_{\alpha/2}\sigma/\sqrt n\) আর \(U = \bar X + z_{\alpha/2}\sigma/\sqrt n\)। অর্থাৎ pivot \(Z\) থেকে আমরা CI গড়ে ফেললাম

CI গড়ার সাধারণ রেসিপি (যা E1–E4-এ বারবার লাগবে):

  1. একটা pivot \(Q(\text{data};\theta)\) বানাও যার বণ্টন জানা ও \(\theta\)-নিরপেক্ষ (যেমন \(Z\) বা পরে \(T\))।
  2. সেই জানা বণ্টন থেকে এমন দুই প্রান্ত নাও যাদের মাঝে \(1-\alpha\) ভর: \(P(-c \le Q \le c) = 1-\alpha\), যেখানে \(c\) = critical value।
  3. ভেতরের অসমতা থেকে \(\theta\) আলাদা করো (বীজগণিতে সাজিয়ে), যাতে \(\theta\) একা মাঝখানে আসে।
  4. বাকি দুই প্রান্তই হলো \(L\)\(U\) — তোমার confidence interval।

এক বাক্যে: pivot হলো সেই সেতু — একটা জানা, \(\theta\)-নিরপেক্ষ বণ্টনওয়ালা পরিমাণ — যাকে "উল্টে" দিলে অজানা \(\theta\)-র চারপাশে একটা ব্যবধান বেরিয়ে আসে। প্রায় সব CI-ই কোনো-না-কোনো pivot থেকে এভাবেই জন্মায়।

২.৪ সঠিক বনাম ভুল interpretation — আনুষ্ঠানিকভাবে

§১.৩-এর সতর্কবার্তাটা এবার §২.১-এর সংজ্ঞার আলোকে পাকা করি, কারণ এটাই এই অধ্যায়ের সবচেয়ে পরীক্ষায়-আসা এবং বাস্তবে-ভুল-করা বিন্দু।

সমীকরণ \(P(L \le \theta \le U) = 1-\alpha\)-এ randomness থাকে \(L\)\(U\)-তে (data-র function), \(\theta\)-তে নয় (\(\theta\) স্থির)। এর সরাসরি ফল দুটো ব্যাখ্যার পার্থক্য:

সঠিক ✅ ভুল ❌
randomness কোথায় ব্যবধান \([L,U]\)-তে (data থেকে আসা) (ভুলভাবে) parameter \(\theta\)-তে
"৯৫%" কীসের পদ্ধতির দীর্ঘমেয়াদি সাফল্য-হার এই ব্যবধানে \(\theta\)-র "থাকার সম্ভাবনা"
বাক্য "এভাবে বানানো ব্যবধানগুলোর ৯৫% সত্যকে ধরে" "সত্য \(\theta\) ৯৫% সম্ভাবনায় এই ব্যবধানে"
হাতে-পাওয়া ব্যবধানে হয় সত্যকে ধরেছে, নয় ধরেনি (জানি না কোনটা) (ভুলভাবে) ৯৫% সম্ভাবনা ধার্য করা

কেন ভুলটা সত্যিই ভুল, তা একটা চূড়ান্ত যুক্তিতে দেখি: ধরুন একটা নির্দিষ্ট নমুনায় আপনি CI পেলেন \([49,\ 55]\)। এখন এই দুই সংখ্যা (\(49\)\(55\)) আর সত্য \(p\) — তিনটেই স্থির (যদিও \(p\) অজানা)। একটা স্থির সংখ্যা (\(p\)) একটা স্থির ব্যবধান (\([49,55]\))-এর ভেতরে হয় আছে, নয় নেই — এটা একটা সত্য/মিথ্যা ব্যাপার, এর "সম্ভাবনা" \(0\) বা \(1\), কখনো \(0.95\) নয়। "\(0.95\)" কেবল তখনই অর্থপূর্ণ যখন ব্যবধানটা এখনও random — অর্থাৎ নমুনা টানার আগে, পদ্ধতির বর্ণনা হিসেবে। নমুনা এসে গেলে randomness শেষ, তাই "এই ব্যবধানে ৯৫% সম্ভাবনা" বলা অর্থহীন।

সঠিক মানসিক ছবি (Figure 4-6-ci-coverage): কল্পনা করুন একই পদ্ধতিতে ১০০টা আলাদা নমুনা থেকে ১০০টা CI আঁকা হলো — একটা উল্লম্ব রেখায় (সত্য \(\theta\)) বরাবর সাজানো অনুভূমিক দণ্ড। এদের মধ্যে গড়ে ৯৫টা দণ্ড সেই রেখা ছেদ করবে (সত্যকে ধরবে), ৫টা ধরবে না। "৯৫% confidence" = এই ৯৫/১০০ ধরা-পড়ার হার। কোন দণ্ডটা আপনার হাতে এসেছে, আর সেটা ধরেছে কি না — তা আপনি জানেন না।

একটা ব্যবহারিক ভাষা যা সঠিক ও নিরাপদ: "আমরা ৯৫% confident যে সত্য মান \([49,55]\)-এ" — যেখানে "confident" শব্দটাই পদ্ধতির আস্থা বোঝায়, "৯৫% probability" নয়। (পরে 5.x-এ Bayesian credible interval দেখব, যেখানে "parameter-এর উপর সম্ভাবনা" বৈধ — কিন্তু সেটা একটা ভিন্ন কাঠামো, ভিন্ন অনুমানসহ; frequentist CI-তে নয়।)

২.৫ z বনাম t — কখন কোনটা, আর কেন

এতক্ষণ pivot \(Z = (\bar X - \mu)/(\sigma/\sqrt n)\) ব্যবহার করেছি — কিন্তু সেখানে একটা লুকানো অনুমান ছিল: \(\sigma\) জানা। বাস্তবে \(\sigma\) প্রায় কখনোই জানা থাকে না (population-এর variance জানলে তো গড়ও জানতাম!)। তাহলে কী করব? — \(\sigma\)-র জায়গায় তার data-থেকে-গোনা অনুমান \(S\) বসাই, যেখানে

\[ S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar X)^2} \]

হলো sample standard deviation (\(S^2\) = sample variance, 4.4-এর সেই \(n-1\)-ভাজক unbiased estimator)। কিন্তু এই প্রতিস্থাপন একটা মূল্য চায়, আর সেখান থেকেই \(t\)-distribution আসে।

কেন σ-কে S দিয়ে বদলালে \(z\) আর খাটে না। যখন \(\sigma\) জানা, কেবল লব \(\bar X\) random; হর \(\sigma/\sqrt n\) একটা স্থির সংখ্যা — তাই অনুপাত পরিচ্ছন্ন Normal। কিন্তু \(S\) বসালে এখন লব ও হর দুটোই random (\(S\)-ও নমুনা থেকে গোনা, তাই ওঠানামা করে)। একটা random সংখ্যাকে আরেকটা random সংখ্যা দিয়ে ভাগ করায় অতিরিক্ত একটা অনিশ্চয়তা ঢোকে — ফলে অনুপাতটা Normal-এর চেয়ে একটু বেশি ছড়ানো, বিশেষত লেজে ভারী। এই নতুন বণ্টনের নাম Student's \(t\)-distribution

সংজ্ঞা (t-statistic ও \(t\)-distribution)। σ-র জায়গায় \(S\) বসানো standardize-করা গড়:

\[ \boxed{\ T \;=\; \frac{\bar X - \mu}{S/\sqrt n} \;\sim\; t_{n-1}\ } \]

(যখন \(X_i\) Normal)। এখানে —

  • \(t_{n-1}\)\(t\)-distribution with \(n-1\) degrees of freedom (স্বাধীনতার মাত্রা)। সূচক \(n-1\) আসে \(S\) গণনায় (যেহেতু \(\bar X\) অনুমান করতে একটা degree of freedom খরচ হয়, 4.4-এর সেই \(n-1\))।
  • \(T\)-ও একটা pivot — এর বণ্টন \(t_{n-1}\), যা \(\mu,\sigma\) কোনোটার উপরই নির্ভর করে না; তাই §২.৩-এর একই রেসিপিতে এটা থেকেও CI গড়া যায়, শুধু \(z_{\alpha/2}\)-র জায়গায় \(t\)-critical value নিয়ে।

\(t\)-এর critical value ও আকৃতি। \(t\)-interval-এর critical value হলো \(t_{n-1,\alpha/2}\)\(t_{n-1}\) বণ্টনের upper-\(\alpha/2\) quantile (\(P(T > t_{n-1,\alpha/2}) = \alpha/2\))। দুটো মূল বৈশিষ্ট্য:

  • \(t_{n-1,\alpha/2} > z_{\alpha/2}\) সবসময় — \(t\) ভারী-লেজ বলে একই মাঝের-ভর ঢাকতে একটু বেশি দূরে যেতে হয়; ফলে t-interval সর্বদা z-interval-এর চেয়ে সামান্য চওড়া। এই বাড়তি চওড়াই σ-না-জানার অতিরিক্ত অনিশ্চয়তার মাশুল। (Figure 4-6-z-vs-t-ci দুই বণ্টন ও তাদের critical value পাশাপাশি দেখাবে।)
  • \(n\) বড় হলে \(S \to \sigma\) (LLN), তাই \(t_{n-1}\) ক্রমে \(\mathcal{N}(0,1)\)-এ মিলিয়ে যায়: \(t_{n-1,\alpha/2} \to z_{\alpha/2}\)। যেমন \(n=2\)-এ \(t_{1,0.025}=12.71\) (বিশাল!), \(n=11\)-এ \(t_{10,0.025}=2.23\), \(n=31\)-এ \(t_{30,0.025}=2.04\), আর \(n\to\infty\)-এ \(\to 1.96\)। তাই বড় নমুনায় (\(n \gtrsim 30\)) দুটো প্রায় অভিন্ন।

সিদ্ধান্তের নিয়ম — কখন কোনটা:

পরিস্থিতি pivot critical value ব্যবহার
\(\sigma\) জানা, data Normal (বা বড় \(n\)) \(Z = \dfrac{\bar X - \mu}{\sigma/\sqrt n}\) \(z_{\alpha/2}\) z-interval (E1)
\(\sigma\) অজানা, \(S\) দিয়ে অনুমান, data ~Normal \(T = \dfrac{\bar X - \mu}{S/\sqrt n}\) \(t_{n-1,\alpha/2}\) t-interval (E2)
\(\sigma\) অজানা কিন্তু \(n\) বিশাল \(T \approx Z\) \(\approx z_{\alpha/2}\) দুটোই কাছাকাছি; প্রায়ই \(z\)

এক বাক্যে: σ জানা থাকলে \(z\); σ-কে \(S\) দিয়ে বদলালে সেই বাড়তি অনিশ্চয়তার জন্য \(t\) (একটু চওড়া) — আর বড় নমুনায় দুটো মিলে যায়, কারণ তখন \(S\) প্রায় \(\sigma\)


৩ · পূর্ণাঙ্গ উদাহরণ

§২-এর রেসিপি এবার চারটি বাস্তব পরিস্থিতিতে সংখ্যাসহ চালাব। প্রতিটিতে একই ছন্দ: pivot বাছো → critical value নাও → \(\hat\theta \pm (\text{critical value})\times\mathrm{SE}\) লিখে সংখ্যা বসাও → ব্যাখ্যা করো। চারটি উদাহরণ চারটি কেন্দ্রীয় কেস ধরে: E1 z-interval (σ জানা), E2 t-interval (σ অজানা), E3 proportion-এর CI, E4 MLE থেকে asymptotic CI।

E1 · Normal mean, σ known — z-interval

এই উদাহরণটা §২.৩-এ গড়া রেসিপির সরাসরি সংখ্যা-প্রয়োগ।

সেটআপ। একটা কারখানার যন্ত্র প্যাকেটে চিনি ভরে; প্যাকেট-ওজন আনুমানিক Normal, এবং দীর্ঘ ইতিহাস থেকে population standard deviation জানা: \(\sigma = 10\) গ্রাম। আজ \(n = 100\)টি প্যাকেট মেপে নমুনা গড় পাওয়া গেল \(\bar X = 50\) গ্রাম। সত্য গড় ওজন \(\mu\)-র একটি ৯৫% confidence interval চাই।

ধাপ ১–২ (pivot ও critical value)। \(\sigma\) জানা ও data Normal, তাই pivot \(Z = (\bar X - \mu)/(\sigma/\sqrt n) \sim \mathcal{N}(0,1)\), আর confidence level \(1-\alpha = 0.95 \Rightarrow \alpha/2 = 0.025 \Rightarrow z_{\alpha/2} = z_{0.025} = 1.96\)

ধাপ ৩ (margin of error)। প্রথমে standard error:

\[ \mathrm{SE}(\bar X) = \frac{\sigma}{\sqrt n} = \frac{10}{\sqrt{100}} = \frac{10}{10} = 1 \ \text{গ্রাম}. \]

তাই margin of error:

\[ m = z_{\alpha/2}\cdot\mathrm{SE} = 1.96 \times 1 = 1.96 \ \text{গ্রাম}. \]

ধাপ ৪ (CI)। point estimate \(\pm\) margin:

\[ \boxed{\ \bar X \pm z_{\alpha/2}\frac{\sigma}{\sqrt n} = 50 \pm 1.96 = [\,48.04,\ \ 51.96\,] \ \text{গ্রাম}\ } \]

সঠিক ব্যাখ্যা (§২.৪ মতে)। "এই পদ্ধতিতে বারবার ১০০-প্যাকেট নমুনা নিয়ে CI বানালে, ব্যবধানগুলোর ৯৫% সত্য গড় ওজন \(\mu\)-কে ধরবে। হাতে-পাওয়া এই \([48.04, 51.96]\) তাদের একটা — হয় সত্যকে ধরেছে, নয় ধরেনি।" ভুল হবে বলা "\(\mu\) ৯৫% সম্ভাবনায় \([48.04, 51.96]\)-এ" — \(\mu\) স্থির, ব্যবধানটা random।

একটু নাড়াচাড়া (নিয়ন্ত্রকের প্রভাব দেখা): যদি ৯৯% চাইতাম, \(z_{0.005}=2.576\), তখন \(m = 2.576\), CI \(= [47.42, 52.58]\)চওড়া (বেশি আস্থার মাশুল)। আর \(n=400\) হলে \(\mathrm{SE}=10/20=0.5\), ৯৫% CI \(= 50\pm0.98 = [49.02, 50.98]\)অর্ধেক সরু (\(n\) চারগুণ, \(\sqrt n\) দ্বিগুণ)।

E2 · Normal mean, σ unknown — t-interval

এবার বাস্তবসম্মত কেস: σ জানা নয়, data থেকে \(S\) অনুমান করতে হবে — তাই \(z\) নয়, \(t\)

সেটআপ। একটা নতুন ওষুধ রক্তচাপ কতটা কমায় তা মাপতে \(n = 16\) জন রোগীর উপর পরীক্ষা। নমুনা গড় হ্রাস \(\bar X = 8\) mmHg, sample standard deviation \(S = 4\) mmHg (population \(\sigma\) অজানা)। সত্য গড় হ্রাস \(\mu\)-র ৯৫% CI চাই। (ছোট নমুনা, σ অজানা — t-interval-এর আদর্শ ক্ষেত্র।)

ধাপ ১–২ (pivot ও critical value)। σ অজানা, \(S\) দিয়ে প্রতিস্থাপিত, তাই pivot \(T = (\bar X - \mu)/(S/\sqrt n) \sim t_{n-1} = t_{15}\)। degrees of freedom \(= n-1 = 15\)। ৯৫% মানে \(\alpha/2 = 0.025\), আর \(t\)-ছক থেকে \(t_{15,\,0.025} = 2.131\) (লক্ষ করুন: \(z_{0.025}=1.96\)-এর চেয়ে বড় — t চওড়া)।

ধাপ ৩ (margin of error)। standard error (এখন \(S\) দিয়ে অনুমিত):

\[ \widehat{\mathrm{SE}}(\bar X) = \frac{S}{\sqrt n} = \frac{4}{\sqrt{16}} = \frac{4}{4} = 1 \ \text{mmHg}, \]

তাই

\[ m = t_{n-1,\alpha/2}\cdot \frac{S}{\sqrt n} = 2.131 \times 1 = 2.131 \ \text{mmHg}. \]

ধাপ ৪ (CI)।

\[ \boxed{\ \bar X \pm t_{n-1,\alpha/2}\frac{S}{\sqrt n} = 8 \pm 2.131 = [\,5.87,\ \ 10.13\,] \ \text{mmHg}\ } \]

তুলনা — t বনাম z এখানে। যদি ভুল করে (σ জানা ভেবে) \(z_{0.025}=1.96\) ব্যবহার করতাম, CI হতো \(8 \pm 1.96 = [6.04, 9.96]\)সরু। t-interval \([5.87, 10.13]\) একটু চওড়া, আর এই বাড়তি চওড়াই সৎ: σ না-জানার অনিশ্চয়তা ধরা আছে। ছোট \(n\)-এ পার্থক্যটা গুরুত্বপূর্ণ; \(n\) বড় হলে (\(t_{n-1}\to z\)) মিলে যেত।

ব্যাখ্যা। "এই পদ্ধতিতে বানানো CI-গুলোর ৯৫% সত্য গড় রক্তচাপ-হ্রাস ধরবে।" যেহেতু পুরো ব্যবধান \([5.87, 10.13]\) শূন্যের ডানে, এটা ইঙ্গিত দেয় ওষুধটা সত্যিই রক্তচাপ কমায় (এই সংযোগ — CI ও "শূন্য ব্যবধানে আছে কি না" — 4.7-এ hypothesis test-এর সাথে গাঁটছড়া বাঁধবে)।

E3 · Proportion — \(\hat p \pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}\)

§১.২-এর সেই জরিপ-উদাহরণে ফিরি — একটা অনুপাত (proportion) \(p\)-র CI।

সেটআপ। একটা নির্বাচনী জরিপে \(n = 1000\) জনকে জিজ্ঞেস করা হলো; \(520\) জন প্রার্থী A-কে সমর্থন করল। সত্য সমর্থন-অনুপাত \(p\)-র ৯৫% CI চাই।

point estimate ও তার SE। point estimate হলো নমুনা-অনুপাত:

\[ \hat p = \frac{520}{1000} = 0.52 . \]

এখানে প্রতিটি উত্তর একটা Bernoulli\((p)\) (\(1\) = সমর্থন, \(0\) = না), তাই \(\hat p = \bar X\) আসলে একটা নমুনা গড়! 4.4 থেকে এর standard error:

\[ \mathrm{SE}(\hat p) = \sqrt{\frac{p(1-p)}{n}} . \]

কিন্তু এতে অজানা \(p\) আছে — তাই বাস্তবে \(p\)-র জায়গায় \(\hat p\) বসিয়ে estimated SE নিই (যা বড় \(n\)-এ বৈধ, কারণ \(\hat p \approx p\)):

\[ \widehat{\mathrm{SE}}(\hat p) = \sqrt{\frac{\hat p(1-\hat p)}{n}} = \sqrt{\frac{0.52 \times 0.48}{1000}} = \sqrt{\frac{0.2496}{1000}} = \sqrt{0.0002496} \approx 0.0158 . \]

critical value ও CI। এখানে কেন \(z\) (t নয়)? কারণ pivot-টা \(\hat p\)-র CLT-আশ্রিত Normal আসন্নায়নের উপর দাঁড়ায় (\(\hat p \approx \mathcal{N}(p,\ p(1-p)/n)\) বড় \(n\)-এ, 3.4) — কোনো \(t\)-গঠন এখানে নেই, তাই critical value \(z_{\alpha/2} = 1.96\)। margin:

\[ m = z_{\alpha/2}\cdot\widehat{\mathrm{SE}}(\hat p) = 1.96 \times 0.0158 \approx 0.031 . \]

তাই

\[ \boxed{\ \hat p \pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}} = 0.52 \pm 0.031 = [\,0.489,\ \ 0.551\,]\ } \]

— অর্থাৎ ৫২% ± ৩.১%, ঠিক §১.২-এর "৫২% ± ৩%" এর উৎস! সঠিক ব্যাখ্যা: "এই জরিপ-পদ্ধতি বারবার চালালে CI-গুলোর ৯৫% সত্য সমর্থন \(p\)-কে ধরবে।" (লক্ষণীয়: ব্যবধান \(50\%\)-এর দুপাশে ছড়ানো, তাই এই data থেকে "A নিশ্চিত জিতবে" বলা যায় না — সত্য \(p\) \(50\%\)-এর নিচেও হতে পারে।)

একটা ব্যবহারিক সতর্কতা। এই "\(\hat p \pm z\sqrt{\hat p(1-\hat p)/n}\)" সূত্র (Wald interval) বড় \(n\) ও মাঝারি \(\hat p\)-তে ভালো, কিন্তু \(\hat p\) যদি \(0\) বা \(1\)-এর খুব কাছে, বা \(n\) ছোট হয়, তখন এটা দুর্বল (এমনকি \([\,\cdot\,]\) প্রান্ত \(0\)\(1\) ছাড়িয়ে যেতে পারে)। তখন উন্নত সংস্করণ (Wilson বা Agresti–Coull interval) লাগে — §৪/অনুশীলনীতে আসবে।

E4 · MLE থেকে asymptotic CI — \(\mathrm{SE} = 1/\sqrt{nI}\)

শেষ উদাহরণ সবচেয়ে সাধারণ ও শক্তিশালী: যেকোনো MLE-র চারপাশে একটা CI, যা 4.3 (MLE) ও 4.4–4.5 (Fisher information) কে CI-র সাথে জোড়ে।

পটভূমি (4.3–4.5 থেকে এক লাইনে)। maximum likelihood estimator \(\hat\theta_{\text{MLE}}\)-র একটা চমৎকার বড়-নমুনা (asymptotic) ধর্ম আছে: যথেষ্ট নিয়মিত পরিস্থিতিতে, বড় \(n\)-এ এটা প্রায় Normal —

\[ \hat\theta_{\text{MLE}} \;\approx\; \mathcal{N}\!\left(\theta,\ \frac{1}{n\,I(\theta)}\right), \]

যেখানে \(I(\theta)\) হলো Fisher information (এক observation-এ data কতটা "তথ্য" বহন করে তার মাপ, 4.5)। অর্থাৎ MLE-ও asymptotically একটা point estimate যার standard error:

\[ \mathrm{SE}(\hat\theta_{\text{MLE}}) \;=\; \frac{1}{\sqrt{n\,I(\theta)}} \;\approx\; \frac{1}{\sqrt{n\,I(\hat\theta)}} \]

(বাস্তবে অজানা \(\theta\)-র জায়গায় \(\hat\theta\) বসাই)। যেহেতু আকৃতি Normal, এখানেও pivot \(\approx \mathcal{N}(0,1)\) — তাই z-interval-এর সেই একই রেসিপি খাটে।

সাধারণ সূত্র (asymptotic CI from MLE):

\[ \boxed{\ \hat\theta_{\text{MLE}} \pm z_{\alpha/2}\cdot\frac{1}{\sqrt{n\,I(\hat\theta)}}\ } \]

সংখ্যায় (Bernoulli/proportion আবার, MLE-চোখে)। ধরা যাক Bernoulli\((p)\) data — যেমন E3। 4.5-এ দেখানো হবে (বা যাচাইযোগ্য) Bernoulli-র Fisher information \(I(p) = \dfrac{1}{p(1-p)}\)। তাহলে MLE \(\hat p = \bar X\) (4.3-এর E1), আর তার asymptotic SE:

\[ \mathrm{SE}(\hat p) = \frac{1}{\sqrt{n\,I(\hat p)}} = \frac{1}{\sqrt{n\cdot \frac{1}{\hat p(1-\hat p)}}} = \sqrt{\frac{\hat p(1-\hat p)}{n}} . \]

লক্ষ করুন — এটা হুবহু E3-এর সেই SE! অর্থাৎ proportion-এর CI আসলে এই সাধারণ MLE-সূত্রের একটা বিশেষ ঘটনা। E3-এর সংখ্যা (\(n=1000,\ \hat p=0.52\)) বসালে সেই একই CI \([0.489,\ 0.551]\) পাই। এটাই দেখায় asymptotic-MLE পদ্ধতিটা কত একীভূত: z-interval, proportion-interval — সবই এর ছায়ায়।

আরেকটা ঝলক (Exponential)। \(X_i \sim \text{Exponential}(\lambda)\)-তে MLE \(\hat\lambda = 1/\bar X\) (4.3-এর E3), আর Fisher information \(I(\lambda) = 1/\lambda^2\), তাই \(\mathrm{SE}(\hat\lambda) = \frac{1}{\sqrt{n\cdot 1/\hat\lambda^2}} = \hat\lambda/\sqrt n\)। ধরা যাক \(n=100\) যন্ত্রের গড় আয়ু থেকে \(\hat\lambda = 0.25\)/ঘণ্টা; তখন \(\mathrm{SE} = 0.25/10 = 0.025\), আর ৯৫% CI \(= 0.25 \pm 1.96\times0.025 = 0.25 \pm 0.049 = [0.201,\ 0.299]\) প্রতি ঘণ্টা।

§৩-এর সার: চারটি উদাহরণই একই কঙ্কাল — point estimate \(\pm\) (critical value) \(\times\) SE — শুধু (ক) SE-র সূত্র আর (খ) critical value (\(z\) না \(t\)) পরিস্থিতি-ভেদে বদলায়। σ জানা → \(z\)\(\sigma/\sqrt n\) (E1); σ অজানা → \(t\)\(S/\sqrt n\) (E2); proportion → \(z\)\(\sqrt{\hat p(1-\hat p)/n}\) (E3); যেকোনো MLE → \(z\)\(1/\sqrt{nI}\) (E4)। আর প্রতিটিরই ব্যাখ্যা একই সাবধানতা মেনে: ব্যবধান random, parameter স্থির।


৪ · প্রমাণ ও উৎপাদন

§১–৩-এ আমরা confidence interval (CI, আস্থা-অন্তর) কী, কেন দরকার, আর তার তিনটে দৈনন্দিন রূপ — z-interval, t-interval, proportion interval — স্বজ্ঞাগতভাবে দেখেছি। এবার এই অংশে আমরা scratch থেকে সেই সূত্রগুলো উৎপাদন করব: কোথা থেকে \(z_{\alpha/2}\) আসে, কেন margin ঠিক \(z_{\alpha/2}\,\mathrm{SE}\), আর সবচেয়ে গুরুত্বপূর্ণ — "\(95\%\) confidence" বাক্যটার নিখুঁত অর্থ কী। কোনো ধাপ লুকানো হবে না; প্রতিটি সমান-চিহ্নের পেছনে বাংলায় কারণ থাকবে। কাজটা চারটে অংশে ভাগ করেছি, প্রতিটি কঠিনতা অনুযায়ী ট্যাগ করা (★ = সরাসরি · ★★ = কিছু বীজগণিত/কৌশল লাগে · ★★★ = পূর্ণ rigor এই পর্যায়ের বাইরে):

  • (a) মূল যন্ত্র — pivot (অক্ষদণ্ড) থেকে z-interval উৎপাদন: \(Z=\dfrac{\bar X-\mu}{\sigma/\sqrt n}\sim\mathcal N(0,1)\) ধরে \(P(-z_{\alpha/2}\le Z\le z_{\alpha/2})=1-\alpha\), তারপর ভেতরের অসমতা \(\mu\)-কে ঘিরে উল্টে এনে \([\bar X - z_{\alpha/2}\sigma/\sqrt n,\ \bar X + z_{\alpha/2}\sigma/\sqrt n]\) (E1)। ★★
  • (b) \(\sigma\) অজানা হলে কেন z নয়, t — pivot \(\dfrac{\bar X-\mu}{S/\sqrt n}\sim t_{n-1}\), আর কেন \(S\) বসানোয় বাড়তি অনিশ্চয়তা tail-কে মোটা করে (E2)। ★★
  • (c) proportion-এর CI CLT থেকে — \(\hat p\)-র approximate Normality ধরে \(\hat p \pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}\) (E3)। ★
  • (d) "coverage"-এর নিখুঁত ব্যাখ্যা — interval-টাই random, তাই \(P(\text{interval covers }\mu)=1-\alpha\) পুনঃপুন নমুনার উপর; এটা "এই নির্দিষ্ট interval-এ \(\mu\) আছে এমন সম্ভাবনা \(1-\alpha\)" নয় (E1–E4-এর ভিত্তি)। ★★

এক নজরে যা মনে রাখবেন। এই গোটা অংশের প্রাণ একটাই কৌশল — pivot: এমন একটা রাশি যা data ও অজানা parameter দুটো থেকেই বানানো, অথচ যার বণ্টন parameter-এর উপর নির্ভর করে না (z-এ \(\mathcal N(0,1)\), t-এ \(t_{n-1}\))। একবার pivot হাতে এলে বাকি সব যান্ত্রিক: pivot-এর জানা বণ্টন থেকে দুটো critical value নাও, মাঝে \(1-\alpha\) probability আটকাও, তারপর অসমতাটা \(\mu\)-কে ঘিরে উল্টে দাও — তাহলেই random দুই প্রান্ত \([\hat\theta - m,\ \hat\theta + m]\) বেরিয়ে আসে। তাই মূল মন্ত্র: "CI মানে point estimate-কে কেন্দ্র করে \(\pm\) একটা margin, আর সেই margin = critical value × standard error।"

পুরো অংশে নোটেশন এক রাখছি: \(\theta\) (এখানে প্রধানত \(\mu\) বা \(p\)) অজানা স্থির parameter — কোনো random variable নয়, তার কোনো বণ্টন নেই, সে শুধু একটা (আমাদের অজানা) সংখ্যা। \(\bar X,\ S,\ \hat p,\ \hat\theta\) সবই data-র function, তাই random\(1-\alpha\) হলো আমাদের চাওয়া confidence level (যেমন \(0.95\)), আর \(\alpha\) তার পরিপূরক (যেমন \(0.05\))। \(z_{\alpha/2}\) হলো standard Normal-এর সেই বিন্দু যার ডানদিকে ঠিক \(\alpha/2\) probability পড়ে; \(t_{n-1,\alpha/2}\) তেমনি \(t_{n-1}\) বণ্টনের জন্য। আর \(\mathrm{SE}\) (standard error) হলো estimator-এর standard deviation (4.4-এ সংজ্ঞায়িত)।


৪.১ · (a) Pivot থেকে z-interval — সূত্রটা কোথা থেকে আসে — ★★

এটাই গোটা অধ্যায়ের কেন্দ্রবিন্দু, তাই ধীরে, প্রতিটা ধাপের কারণসহ যাব। লক্ষ্য: E1-এর সূত্র

\[ \boxed{\;\Big[\ \bar X - z_{\alpha/2}\,\frac{\sigma}{\sqrt n},\quad \bar X + z_{\alpha/2}\,\frac{\sigma}{\sqrt n}\ \Big]\;} \]

আকাশ থেকে না পড়ে কীভাবে একটিমাত্র normal-table থেকে স্বাভাবিকভাবে গজায় তা দেখা।

প্রেক্ষাপট ও অনুমান। ধরা যাক \(X_1,\dots,X_n\) i.i.d., প্রত্যেকের mean \(\mu\) (অজানা — এটাই আমরা ধরতে চাই) আর variance \(\sigma^2\) জানা (এই subsection-এর কৃত্রিম কিন্তু শিক্ষণীয় ধরা; (b)-তে এটা শিথিল করব)। দুটো জিনিস আগের অধ্যায় থেকে হাতে আছে:

  1. 3.4 (CLT) / Normal হলে অবিকল: যদি প্রতিটি \(X_i\) ঠিক Normal হয়, তবে \(\bar X\sim\mathcal N\!\big(\mu,\ \sigma^2/n\big)\) অবিকল (exactly)। আর Normal না হলেও, \(n\) মাঝারি-বড় হলে CLT অনুযায়ী \(\bar X\) approximately Normal — সূত্রটা তখন approximate CI দেয়।
  2. Standardization (2.4): যেকোনো \(\mathcal N(a,b^2)\) থেকে \(a\) বিয়োগ করে \(b\) দিয়ে ভাগ করলে \(\mathcal N(0,1)\) পাওয়া যায়।

ধাপ ১ — pivot তৈরি করি। \(\bar X\)-কে standardize করি। যেহেতু \(\mathbb E[\bar X]=\mu\) আর \(\mathrm{Var}(\bar X)=\sigma^2/n\) (তাই \(\mathrm{sd}(\bar X)=\sigma/\sqrt n\)), সংজ্ঞা মেনে

\[ Z \;:=\; \frac{\bar X - \mu}{\sigma/\sqrt n} \;\sim\; \mathcal N(0,1). \]

এই \(Z\)-ই আমাদের pivot। কেন একে "pivot" বলি, তা এখানে চোখে দেখুন: \(Z\)-এর ভেতরে \(\mu\) (অজানা) আর \(\bar X\) (random) দুটোই আছে, অথচ \(Z\)-এর বণ্টন (\(\mathcal N(0,1)\)) \(\mu\)-র উপর মোটেই নির্ভর করে না\(\mu\) যা-ই হোক, \(Z\) সবসময় standard Normal। ঠিক এই ধর্মটাই আমাদের পরে \(\mu\)-কে "বের করে আনতে" দেবে।

ধাপ ২ — pivot-এর জন্য একটা central probability statement লিখি। \(\mathcal N(0,1)\)-এর জন্য \(z_{\alpha/2}\)-এর সংজ্ঞা: এটা সেই ধনাত্মক সংখ্যা যার ডানদিকে ঠিক \(\alpha/2\) ক্ষেত্রফল (probability) পড়ে, অর্থাৎ \(P(Z > z_{\alpha/2}) = \alpha/2\)। symmetry-র কারণে বাঁদিকেও তাই: \(P(Z < -z_{\alpha/2}) = \alpha/2\)। তাহলে দুই প্রান্তের মাঝে যা থাকে:

\[ P\big(-z_{\alpha/2} \le Z \le z_{\alpha/2}\big) \;=\; 1 - \underbrace{\tfrac{\alpha}{2}}_{\text{ডান প্রান্ত}} - \underbrace{\tfrac{\alpha}{2}}_{\text{বাঁ প্রান্ত}} \;=\; 1-\alpha . \]

(\(95\%\)-এর জন্য \(\alpha=0.05\), তাই \(z_{\alpha/2}=z_{0.025}\approx 1.96\) — এই সংখ্যাটাই §৫-এ যন্ত্র ছাপাবে।) লক্ষ করুন: এই লাইনটা নিশ্চিত সত্য, কারণ এটা শুধু \(\mathcal N(0,1)\)-এর একটা ধর্ম — এখনো \(\mu\) নিয়ে কিছু "দাবি" করিনি।

ধাপ ৩ — pivot-এর সংজ্ঞা বসাই। এবার \(Z\)-এর জায়গায় তার মান বসাই:

\[ P\!\left(-z_{\alpha/2} \;\le\; \frac{\bar X - \mu}{\sigma/\sqrt n} \;\le\; z_{\alpha/2}\right) \;=\; 1-\alpha . \]

ধাপ ৪ — ভেতরের অসমতাটা \(\mu\)-কে ঘিরে উল্টাই (এটাই মূল কৌশল)। আমরা চাই মাঝখানে \(\mu\) একা দাঁড়াক। তিন ধাপে বীজগণিত — মনে রাখবেন \(\sigma/\sqrt n > 0\), তাই গুণ-ভাগে অসমতার মুখ বদলায় না:

প্রথমে তিন দিকে \(\sigma/\sqrt n\) দিয়ে গুণ:

\[ -z_{\alpha/2}\,\frac{\sigma}{\sqrt n} \;\le\; \bar X - \mu \;\le\; z_{\alpha/2}\,\frac{\sigma}{\sqrt n}. \]

এবার তিন দিক থেকে \(\bar X\) বিয়োগ:

\[ -\bar X -z_{\alpha/2}\,\frac{\sigma}{\sqrt n} \;\le\; -\mu \;\le\; -\bar X + z_{\alpha/2}\,\frac{\sigma}{\sqrt n}. \]

শেষে \(-1\) দিয়ে গুণ — এখানে অসমতার দুই মুখ উল্টে যায় (ঋণাত্মক দিয়ে গুণের নিয়ম), আর দুই প্রান্ত জায়গা বদলায়:

\[ \bar X - z_{\alpha/2}\,\frac{\sigma}{\sqrt n} \;\le\; \mu \;\le\; \bar X + z_{\alpha/2}\,\frac{\sigma}{\sqrt n}. \]

এই তিনটে রূপান্তর প্রতিটা ধাপে একই ঘটনাকে (event) বর্ণনা করে — মানে probability অপরিবর্তিত। তাই:

\[ \boxed{\;P\!\left(\bar X - z_{\alpha/2}\,\frac{\sigma}{\sqrt n} \;\le\; \mu \;\le\; \bar X + z_{\alpha/2}\,\frac{\sigma}{\sqrt n}\right) \;=\; 1-\alpha\;}. \]

ধাপ ৫ — পড়ে নিই কী পেলাম। ডান-বাঁ প্রান্ত দুটো — \(\bar X \mp z_{\alpha/2}\sigma/\sqrt n\) — সম্পূর্ণভাবে data থেকে গণনাযোগ্য (কারণ এখানে \(\sigma\) জানা, আর \(\bar X\) নমুনা থেকে পাওয়া)। এদের আমরা নাম দিই random interval

\[ \big[\hat\theta - m,\ \hat\theta + m\big],\qquad \hat\theta=\bar X,\qquad m = z_{\alpha/2}\,\frac{\sigma}{\sqrt n} = z_{\alpha/2}\,\mathrm{SE}. \]

এখানে \(\mathrm{SE}=\sigma/\sqrt n\) হলো \(\bar X\)-এর standard error, আর \(m\) (margin of error, ত্রুটি-প্রান্ত) = critical value × SE। এটাই E1-এর z-interval, আর আমরা দেখলাম এটা কোনো জাদু নয় — কেবল একটা pivot-এর central probability statement-কে \(\mu\)-র চারপাশে উল্টে লেখা।

স্বজ্ঞা — দুই কেন্দ্রের নাচ। ধাপ ২-এর statement "\(\mu\) কেন্দ্রে, \(\bar X\) ঘোরে": \(P(\lvert \bar X - \mu\rvert \le z_{\alpha/2}\sigma/\sqrt n)=1-\alpha\) — অর্থাৎ random \(\bar X\) স্থির \(\mu\)-র \(m\)-দূরত্বের মধ্যে পড়ার সম্ভাবনা \(1-\alpha\)। ধাপ ৪-এ আমরা একই দূরত্ব-শর্তকে "\(\bar X\) কেন্দ্রে, \(\mu\) ঘেরা" দৃষ্টিতে লিখলাম: \(\mu\) যদি \(\bar X\)-এর \(m\)-দূরত্বে থাকে, তবে \(\bar X\)-ও \(\mu\)-র \(m\)-দূরত্বে — একই ঘটনা! কিন্তু সাবধান, "\(\mu\) ঘেরা" বলতে \(\mu\) নড়ছে না (সে স্থির), নড়ছে interval-টাই (কারণ তার দুই প্রান্ত random \(\bar X\) থেকে)। এই সূক্ষ্মতা (d)-তে নিখুঁত করব — এটাই CI-র সবচেয়ে ভুল-বোঝা বিন্দু।

সংখ্যায় যাচাই (§৫ PART 1)। \(\sigma=8,\ n=25\)-তে \(\mathrm{SE}=8/\sqrt{25}=1.6\), margin \(=1.96\times1.6=3.136\) — যন্ত্র ঠিক এই সংখ্যাই ছাপাবে, আর interval-টা সত্য \(\mu=50\)-কে ঘিরে রাখবে।


৪.২ · (b) σ অজানা হলে কেন t-interval — ★★

ধাপে-ধাপে z-interval পেলাম, কিন্তু সেখানে একটা অবাস্তব অনুমান ছিল — \(\sigma\) জানা। বাস্তবে \(\mu\) যদি অজানা হয়, \(\sigma\)-ও প্রায় সবসময় অজানা! তাহলে \(\mathrm{SE}=\sigma/\sqrt n\) আমরা গণনাই করতে পারি না। স্বাভাবিক সমাধান: \(\sigma\)-র জায়গায় তার estimate — sample standard deviation \(S=\sqrt{\frac{1}{n-1}\sum_i (X_i-\bar X)^2}\) (4.4-এ unbiased \(S^2\) দেখা) — বসিয়ে দাও।

ধাপ ১ — একটা নতুন pivot, আর তার অসুবিধা। \(\sigma\)-কে \(S\) দিয়ে বদলে দিলে আমাদের রাশি দাঁড়ায়

\[ T \;:=\; \frac{\bar X - \mu}{S/\sqrt n}. \]

প্রশ্ন: এটাও কি \(\mathcal N(0,1)\)? না — আর এই "না"-টাই গোটা t-গল্পের কারণ। কেন না, তা স্বজ্ঞায় ধরুন: \(Z\)-এ হর \(\sigma/\sqrt n\) একটা স্থির সংখ্যা (random নয়, কারণ \(\sigma\) জানা)। কিন্তু \(T\)-এ হর \(S/\sqrt n\) নিজেই random\(S\) নমুনা-থেকে-নমুনায় ওঠানামা করে। ফলে \(T\)-তে দুই উৎসের এলোমেলোতা: লব \(\bar X\) থেকে, আর হর \(S\) থেকে। বিশেষত ছোট নমুনায় কখনো \(S\) সত্য \(\sigma\)-র চেয়ে অনেক ছোট আসে — তখন হর ছোট হওয়ায় \(T\) অস্বাভাবিক বড় (দুই দিকেই) হয়ে যায়। তাই \(T\)-এর বণ্টন \(\mathcal N(0,1)\)-এর চেয়ে বেশি ছড়ানো, tail মোটা (heavier tails)।

ধাপ ২ — সঠিক বণ্টন: Student's t. এক চমৎকার ফল (Normal data-র জন্য অবিকল, 4.1-এ sampling distribution হিসেবে দেখা; এখানে statement হিসেবে ধরছি — পূর্ণ প্রমাণ \(\chi^2\) ও স্বাধীনতা লাগে, ★★★):

\[ \boxed{\;T \;=\; \frac{\bar X - \mu}{S/\sqrt n} \;\sim\; t_{n-1}\;}\qquad (X_i \text{ i.i.d. Normal হলে}). \]

এখানে \(t_{n-1}\) হলো \(n-1\) degrees of freedom-যুক্ত Student's t-distribution। তার আকৃতি \(\mathcal N(0,1)\)-এর মতোই — শূন্যে কেন্দ্রিত, প্রতিসম, ঘণ্টা-আকার — শুধু tail মোটা, ঠিক যেমন ধাপ ১-এ যুক্তি দিল। আর \(df=n-1\) কেন? কারণ \(S\) হিসাব করতে \(\bar X\) লেগেছে, যাতে একটা degree of freedom খরচ হয়েছে (4.4-এ "\(n-1\) কেন" প্রসঙ্গে দেখা একই হিসাব)।

ধাপ ৩ — একই pivot-কৌশল, শুধু critical value বদলে। \(T\)-ও একটা pivot (এর বণ্টন \(t_{n-1}\)\(\mu,\sigma\)-র উপর নির্ভর করে না)। তাই (a)-র গোটা ধাপ ২–৪ হুবহু পুনরাবৃত্তি, কেবল \(z_{\alpha/2}\)-র জায়গায় \(t_{n-1,\alpha/2}\) (= \(t_{n-1}\)-এর ডানদিকে \(\alpha/2\) রেখে যাওয়া বিন্দু):

\[ P\big(-t_{n-1,\alpha/2}\le T\le t_{n-1,\alpha/2}\big)=1-\alpha \;\xrightarrow[\ \mu\text{-কে উল্টে}\ ]{}\; \boxed{\;\Big[\ \bar X - t_{n-1,\alpha/2}\,\frac{S}{\sqrt n},\quad \bar X + t_{n-1,\alpha/2}\,\frac{S}{\sqrt n}\ \Big]\;}. \]

এটাই E2-এর t-interval: কাঠামো z-interval-এর সঙ্গে অভিন্ন — \(\hat\theta \pm (\text{critical})\times \mathrm{SE}\) — শুধু (i) \(\sigma\)-র জায়গায় \(S\) (তাই \(\mathrm{SE}\) এখন estimated, \(S/\sqrt n\)), আর (ii) \(z_{\alpha/2}\)-র জায়গায় বড় critical value \(t_{n-1,\alpha/2}\)

কেন t সবসময় চওড়া, আর কখন z-এ মিশে যায়। যেহেতু \(t_{n-1}\)-এর tail মোটা, মাঝের \(1-\alpha\) probability ধরতে আমাদের আরও দূরে যেতে হয় — তাই সবসময় \(t_{n-1,\alpha/2} > z_{\alpha/2}\), অর্থাৎ t-interval সবসময় z-interval-এর চেয়ে চওড়া। এটা ন্যায্য মূল্য: \(\sigma\) না-জানার বাড়তি অনিশ্চয়তার জন্য আমরা একটু বেশি প্রশস্ত interval দিয়ে "সততা" রক্ষা করি। আর \(n\) বড় হলে \(S\) ক্রমে \(\sigma\)-র কাছাকাছি স্থির হয়, হরের এলোমেলোতা কমে — তাই \(t_{n-1}\to\mathcal N(0,1)\), এবং \(t_{n-1,\alpha/2}\to z_{\alpha/2}\)। (\(df=1000\)-এ \(t\approx1.962\), প্রায় \(1.96\) — §৫ PART 3 ঠিক এই অভিসরণ ছাপাবে।) এজন্যই বড় নমুনায় z আর t কার্যত এক, কিন্তু ছোট নমুনায় t বাধ্যতামূলক।

সতর্কতা ★★। \(T\sim t_{n-1}\) ফলটা অবিকল কেবল data Normal হলে। Normal না হলেও \(n\) বড় হলে CLT + \(S\xrightarrow{P}\sigma\) মিলে \(T\) approximately Normal থাকে, তাই t-interval তখনো approximate কাজ চালায় — কিন্তু খুব ছোট, খুব skewed নমুনায় coverage নড়তে পারে (§৬-এর ভুল-ধারণায় ছোঁয়া হবে)।


৪.৩ · (c) Proportion-এর CI — CLT থেকে — ★

তৃতীয় দৈনন্দিন রূপ: একটা অজানা অনুপাত \(p\) (যেমন ভোটে সমর্থনের হার, ক্লিকের হার)। data হলো \(n\)টা স্বাধীন হ্যাঁ/না — \(X_1,\dots,X_n\) i.i.d. \(\mathrm{Bernoulli}(p)\), যেখানে \(X_i=1\) মানে "সফল"। স্বাভাবিক estimator হলো নমুনা-অনুপাত \(\hat p = \frac1n\sum_i X_i\) (সফলতার ভগ্নাংশ)।

ধাপ ১ — \(\hat p\)-এর mean ও variance। Bernoulli-র জন্য \(\mathbb E[X_i]=p\)\(\mathrm{Var}(X_i)=p(1-p)\) (2.3-এ দেখা)। তাই i.i.d. গড়ের নিয়মে:

\[ \mathbb E[\hat p] = p \quad(\text{unbiased}),\qquad \mathrm{Var}(\hat p)=\frac{p(1-p)}{n}\quad\Longrightarrow\quad \mathrm{SE}(\hat p)=\sqrt{\frac{p(1-p)}{n}}. \]

ধাপ ২ — CLT প্রয়োগ (এখানেই 3.4-এর E3 ফিরে আসে)। \(\hat p\) তো \(n\)টা i.i.d. Bernoulli-র গড়, তাই CLT অনুযায়ী \(n\) মাঝারি-বড় হলে \(\hat p\) approximately Normal:

\[ \frac{\hat p - p}{\sqrt{p(1-p)/n}} \;\xrightarrow{d}\; \mathcal N(0,1). \]

ধাপ ৩ — একটা ছোট সমস্যা, আর তার সমাধান (plug-in)। এটা প্রায়-pivot, কিন্তু একটা কাঁটা: হরে \(\sqrt{p(1-p)/n}\)-তে অজানা \(p\) বসে আছে! z-interval-এ হর জানা ছিল; এখানে নয়। সমাধান — হরের \(p\)-কে তার estimate \(\hat p\) দিয়ে বদলাই (plug-in / Wald পদ্ধতি)। \(n\) বড় হলে \(\hat p\xrightarrow{P}p\) (LLN), তাই এই বদল approximately বণ্টন নষ্ট করে না (Slutsky-র যুক্তি, 3.2):

\[ \frac{\hat p - p}{\sqrt{\hat p(1-\hat p)/n}} \;\approx\; \mathcal N(0,1). \]

এই রাশির হর এখন পুরোটাই data থেকে গণনাযোগ্য — তাই একে approximate pivot ধরে (a)-র যন্ত্র চালাই:

\[ \boxed{\;\Big[\ \hat p - z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}},\quad \hat p + z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}\ \Big]\;}. \]

এটাই E3-এর proportion CI — আবার সেই একই অবয়ব \(\hat\theta \pm z_{\alpha/2}\,\widehat{\mathrm{SE}}\), যেখানে এবার \(\hat\theta=\hat p\) আর \(\widehat{\mathrm{SE}}=\sqrt{\hat p(1-\hat p)/n}\)

মনে রাখার বিন্দু। তিনটে interval-ই (z, t, proportion) একই টেমপ্লেটের তিন রূপ: estimate \(\pm\) critical-value \(\times\) SE। পার্থক্য শুধু — SE কী, আর critical value কোন বণ্টন থেকে (\(z\) না \(t\))। proportion-এ critical value \(z\) (CLT-ভিত্তিক বলে), SE-তে plug-in \(\hat p\)। (একটা সতর্কতা ★★: এই "Wald" interval \(p\) চরম-কাছাকাছি \(0\) বা \(1\) হলে বা \(n\) ছোট হলে দুর্বল — তখন Wilson বা Agresti–Coull interval ভালো; এটা §৬/পরের অধ্যায়ে।)


৪.৪ · (d) "Coverage" বলতে ঠিক কী — interval random, μ নয় — ★★

এখন অধ্যায়ের সবচেয়ে গুরুত্বপূর্ণ — এবং সবচেয়ে বেশি ভুল-বোঝা — ধারণাটা নিখুঁত করি। আমরা বারবার লিখেছি "\(95\%\) confidence interval"। প্রশ্ন: এই "\(95\%\)" সংখ্যাটা ঠিক কীসের probability?

ভুল ব্যাখ্যা (যা প্রায় সবাই প্রথমে ভাবে)। "আমার হাতে-পাওয়া interval \([44.40,\ 50.67]\)-এর ভেতরে সত্য \(\mu\) থাকার সম্ভাবনা \(95\%\)।" — এই বাক্যটা frequentist কাঠামোয় অর্থহীন, এবং তা বোঝা জরুরি। কেন? কারণ এই বাক্যে দুটোই স্থির সংখ্যা: (i) \(\mu\) একটা নির্দিষ্ট অজানা ধ্রুবক, আর (ii) একবার নমুনা টেনে ফেলার পর \([44.40,\ 50.67]\)-ও দুটো নির্দিষ্ট সংখ্যা — random কিছু নেই! দুটো স্থির সংখ্যার মধ্যে একটা স্থির সংখ্যা হয় আছে (probability \(1\)) নয় নেই (probability \(0\)) — মাঝের "\(0.95\)" বলে কিছু নেই। (\(\mu=50\) সত্যিই \([44.40,50.67]\)-এ আছে, তাই এখানে উত্তর \(1\); কিন্তু আমরা \(\mu\) জানি না বলে কোনটা — \(0\) না \(1\) — তা বলতে পারি না, তবু "\(0.95\)" কখনোই নয়।)

সঠিক ব্যাখ্যা — randomness কোথায় তা ঠিকভাবে চিহ্নিত করা। \(\mu\) স্থির; random জিনিসটা হলো interval-টাই। ধাপ (a)-র দুই প্রান্ত \(\bar X \mp z_{\alpha/2}\sigma/\sqrt n\) random \(\bar X\)-এর function, তাই নতুন নমুনা = নতুন (ভিন্ন) interval। কল্পনা করুন একই population থেকে বারবার (ধরা যাক \(1000\) বার) নতুন নমুনা টানছেন, প্রতিবার সূত্রটা চালিয়ে একটা interval বানাচ্ছেন — পাবেন \(1000\)টা ভিন্ন interval, এদিক-ওদিক ছড়ানো, এক একটার দুই প্রান্ত এক এক জায়গায়। সত্য \(\mu\) একটা স্থির উল্লম্ব রেখা; কিছু interval সেই রেখাকে ঢেকে ফেলে (cover করে), কিছু মিস করে। ধাপ (a)-র boxed সমীকরণ ঠিক এটাই বলে:

\[ \boxed{\;P\big(\text{random interval }[\bar X - m,\ \bar X + m]\ \text{ঢাকে স্থির }\mu\big)\;=\;1-\alpha\;} \]

যেখানে probability-টা পুনঃপুন-নমুনার (interval-এর randomness-এর) উপর, \(\mu\)-র উপর নয়। অর্থাৎ:

"\(95\%\) confidence" মানে: এই পদ্ধতিতে বানানো interval-গুলোর দীর্ঘমেয়াদে প্রায় \(95\%\) সত্য \(\mu\)-কে ঢেকে ফেলবে। এটা পদ্ধতির (procedure-এর) একটা ধর্ম — কোনো একক interval-এর নয়।

কেন এই পার্থক্য তুচ্ছ নয়। "\(95\%\)" কথাটা একটা নির্ভরযোগ্যতার রেটিং — যেমন "এই ছাতা \(95\%\) বৃষ্টিতে টেকে"। একবার বৃষ্টিতে নেমে গেলে হয় ভিজলেন, নয় ভিজলেন না; কিন্তু ছাতার রেটিং তবু "\(95\%\)" — সেটা বহু-বৃষ্টির গড় পারফরম্যান্স। তেমনি, আপনার হাতের নির্দিষ্ট interval হয় \(\mu\)-কে ঢেকেছে নয় ঢাকেনি (আপনি জানেন না কোনটা), কিন্তু যে পদ্ধতিতে এটা বানালেন তার coverage \(95\%\)

এটাই E1–E4-এর সাধারণ মেরুদণ্ড, আর §৫-এ চোখে দেখব। §৫ PART 2-তে আমরা ঠিক এই "\(1000\) বার নমুনা" কাজটা \(100{,}000\) বার করব, প্রতিবার \(95\%\) interval বানাব, আর গুনব কত ভাগ সত্য \(\mu\)-কে ঢাকল — উত্তর আসবে \(\approx 0.949\), ঠিক \(0.95\)-এর গায়ে। এটাই coverage-এর সংজ্ঞার সরাসরি সংখ্যা-প্রমাণ। (Figure 4-6-ci-coverage4-6-ci-interpretation এই বহু-interval ছবিটা — কোনগুলো \(\mu\)-রেখা ঢাকে, কোনগুলো মিস করে — চোখে দেখাবে।)

শেষ সতর্কতা — coverage বনাম confidence level। আমরা যা চাই তা \(1-\alpha\) (nominal coverage, যেমন \(0.95\)); পদ্ধতি যা আসলে অর্জন করে তা actual coverage। সঠিক pivot ব্যবহার করলে এ-দুই মেলে (PART 2-এর (a),(b) দেখাবে coverage \(\approx0.95\))। কিন্তু ভুল pivot — যেমন \(\sigma\) অজানা হলেও z-interval চালানো — actual coverage-কে \(0.95\)-এর নিচে নামিয়ে দেয় (PART 2-এর (c) দেখাবে \(\approx 0.917\), ছোট \(n\)-এ)। এই under-coverage ঠিক কেন (b)-র t-interval (চওড়া বলে) দরকার তার সংখ্যাগত প্রমাণ — তাত্ত্বিক যুক্তি (b)-তে, সংখ্যা §৫-এ।


৫ · কোড ল্যাব (Python)

এই ল্যাবে §৪-এর চারটে ফলকে আমরা সিমুলেশনে যাচাই করব — যাতে confidence interval-এর ধর্মগুলো কাগজে নয় শুধু, সংখ্যাতেও বিশ্বাসযোগ্য হয়। সবচেয়ে গুরুত্বপূর্ণ যাচাইটা হলো coverage (§৪.৪): আমরা একই population থেকে হাজার-হাজার বার নতুন নমুনা টেনে প্রতিবার একটা \(95\%\) CI বানাব, তারপর গুনব কত ভাগ interval সত্য \(\mu\)-কে ঢাকল — উত্তর আসবে \(\approx 0.95\), যা "\(95\%\) confidence"-এর সংজ্ঞারই সরাসরি সংখ্যা-প্রমাণ। সব এলোমেলোতা আসে numpy-র আধুনিক generator default_rng থেকে, একটা স্থির seed (20260619) বসিয়ে — তাই ফলাফল পুনরুৎপাদনযোগ্য (reproducible): যে যতবার চালাবে হুবহু একই সংখ্যা পাবে। critical value (z, t) আসে scipy.stats থেকে। (নিচে ছাপানো সব সংখ্যা স্ক্রিপ্টটা সত্যিই চালিয়ে পাওয়া।)

আমরা চারটে জিনিস মাপব, ঠিক §৪-এর চার অংশ অনুসরণ করে:

  1. PART 1 — তিনটে CI একটা নমুনা থেকে (§৪.১–৪.৩)। একটা নমুনা টেনে E1 (z-interval, \(\sigma\) জানা), E2 (t-interval, \(\sigma\) অজানা → \(S\)), E3 (proportion CI) — তিনটে গড়ে তুলব, প্রতিটায় \(\mathrm{SE}\), margin ও interval ছাপাব, আর সত্য parameter ভেতরে কি না দেখাব।
  2. PART 2 — Monte Carlo coverage (§৪.৪)। \(100{,}000\) বার নমুনা টেনে দেখাব (a) সঠিক z-interval ও (b) সঠিক t-interval-এর coverage \(\approx 0.95\), কিন্তু (c) ভুল pivot (\(\sigma\) অজানা হলেও z) coverage-কে \(0.95\)-এর নিচে নামায়। সাথে দেখাব REP বাড়লে coverage কীভাবে \(0.95\)-এ থিতু হয়।
  3. PART 3 — z বনাম t প্রস্থ (§৪.২)। বিভিন্ন \(n\)-এ \(z_{\alpha/2}\) vs \(t_{n-1,\alpha/2}\) ছাপিয়ে দেখাব t সবসময় বড় (interval চওড়া), আর তাদের অনুপাত \(n\) বাড়লে \(1\)-এর দিকে যায়।
  4. PART 4 — CI প্রস্থ বনাম \(n\) (§৪.১)। margin \(m=z_{\alpha/2}\sigma/\sqrt n\) কীভাবে \(1/\sqrt n\) হারে কমে — \(n\) চারগুণ করলে প্রস্থ ঠিক অর্ধেক — তা সংখ্যায় দেখাব।

৫.১ · সম্পূর্ণ স্ক্রিপ্ট

# Chapter 4.6 — Confidence Intervals : Code Lab
# Numerically illustrates:
#   PART 1 — Build z / t / proportion CIs from ONE sample.
#   PART 2 — Monte Carlo COVERAGE: ~95% of 95%-CIs contain the true mu
#            (z and t correct; wrong z-with-S under-covers at small n).
#   PART 3 — z vs t WIDTH: t is always wider; gap shrinks as n grows.
#   PART 4 — CI WIDTH vs n: margin m = z*sigma/sqrt(n) shrinks like 1/sqrt(n).
import numpy as np
from scipy import stats

SEED = 20260619
rng  = np.random.default_rng(SEED)          # fixed seed => fully reproducible
np.set_printoptions(precision=4, suppress=True)

# -----------------------------------------------------------------
# PART 1 — Build z / t / proportion CIs from a single sample.
# -----------------------------------------------------------------
print("=" * 72)
print("PART 1 — Three confidence intervals from ONE sample (1-alpha = 0.95)")
print("=" * 72)

alpha   = 0.05
z_crit  = stats.norm.ppf(1 - alpha/2)        # z_{alpha/2} = 1.96 for 95%
print(f"\n  z_(alpha/2)  = {z_crit:.4f}   (alpha = {alpha},  1-alpha = {1-alpha})")

# --- E1 : z-interval (sigma KNOWN) ---
mu_true, sigma_known = 50.0, 8.0
n1 = 25
x1 = rng.normal(mu_true, sigma_known, size=n1)
xbar1 = x1.mean()
se_z  = sigma_known / np.sqrt(n1)            # SE = sigma/sqrt(n)  (sigma known)
m_z   = z_crit * se_z                        # margin = z * SE
ci_z  = (xbar1 - m_z, xbar1 + m_z)
print("\n  E1  z-interval  (sigma known = 8):")
print(f"      n={n1}, xbar={xbar1:.4f}, SE={se_z:.4f}, margin={m_z:.4f}")
print(f"      95% CI = [{ci_z[0]:.4f}, {ci_z[1]:.4f}]   (true mu={mu_true} inside: {ci_z[0] <= mu_true <= ci_z[1]})")

# --- E2 : t-interval (sigma UNKNOWN, use S) ---
n2 = 25
x2 = rng.normal(mu_true, sigma_known, size=n2)   # same DGP, but pretend sigma unknown
xbar2 = x2.mean()
S2    = x2.std(ddof=1)                        # sample SD with (n-1) divisor
t_crit = stats.t.ppf(1 - alpha/2, df=n2 - 1)  # t_{n-1, alpha/2}
se_t  = S2 / np.sqrt(n2)
m_t   = t_crit * se_t
ci_t  = (xbar2 - m_t, xbar2 + m_t)
print("\n  E2  t-interval  (sigma unknown, use S):")
print(f"      n={n2}, xbar={xbar2:.4f}, S={S2:.4f}, t_(n-1,a/2)={t_crit:.4f}, margin={m_t:.4f}")
print(f"      95% CI = [{ci_t[0]:.4f}, {ci_t[1]:.4f}]   (true mu={mu_true} inside: {ci_t[0] <= mu_true <= ci_t[1]})")

# --- E3 : proportion CI (Wald, via CLT) ---
p_true = 0.40
n3 = 200
x3 = rng.binomial(1, p_true, size=n3)        # n3 Bernoulli(p) trials
phat = x3.mean()
se_p = np.sqrt(phat * (1 - phat) / n3)       # plug-in SE
m_p  = z_crit * se_p
ci_p = (phat - m_p, phat + m_p)
print("\n  E3  proportion CI  (Wald / CLT):")
print(f"      n={n3}, phat={phat:.4f}, SE={se_p:.4f}, margin={m_p:.4f}")
print(f"      95% CI = [{ci_p[0]:.4f}, {ci_p[1]:.4f}]   (true p={p_true} inside: {ci_p[0] <= p_true <= ci_p[1]})")

# -----------------------------------------------------------------
# PART 2 — Monte Carlo COVERAGE: fraction of 95%-CIs covering true mu.
#   Key teaching point: the INTERVAL is random; coverage ~ 0.95 over
#   repeated samples is the meaning of "95% confidence".
# -----------------------------------------------------------------
print("\n" + "=" * 72)
print("PART 2 — Monte Carlo coverage of 95% CIs (true mu fixed; intervals random)")
print("=" * 72)
REP = 100_000
n   = 10                                      # SMALL n so z-vs-t difference shows

# vectorised: REP samples, each of size n, from Normal(mu_true, sigma_known^2)
samp = rng.normal(mu_true, sigma_known, size=(REP, n))
xbar = samp.mean(axis=1)
Sn   = samp.std(axis=1, ddof=1)               # sample SD per row

# (a) z-interval with KNOWN sigma  -> should cover ~0.95 (it is exact here)
m_zc   = z_crit * sigma_known / np.sqrt(n)
covz   = np.mean((xbar - m_zc <= mu_true) & (mu_true <= xbar + m_zc))

# (b) t-interval with sigma UNKNOWN (S) -> should cover ~0.95 (correct pivot)
tcn    = stats.t.ppf(1 - alpha/2, df=n - 1)
m_tc   = tcn * Sn / np.sqrt(n)
covt   = np.mean((xbar - m_tc <= mu_true) & (mu_true <= xbar + m_tc))

# (c) WRONG: z-interval but sigma UNKNOWN (use S with z crit) -> UNDER-covers
m_wrong = z_crit * Sn / np.sqrt(n)
covw    = np.mean((xbar - m_wrong <= mu_true) & (mu_true <= xbar + m_wrong))

print(f"\n  REP={REP}, n={n}, nominal coverage = {1-alpha:.2f}")
print(f"    (a) z-interval, sigma KNOWN     : coverage = {covz:.4f}   (correct -> ~0.95)")
print(f"    (b) t-interval, sigma unknown(S): coverage = {covt:.4f}   (correct -> ~0.95)")
print(f"    (c) z-interval BUT sigma unknown: coverage = {covw:.4f}   (WRONG -> under 0.95)")
print("\n  Read-off: (a),(b) sit on 0.95; (c) the z-with-S shortcut under-covers at small n,")
print("  which is exactly WHY the t-interval (wider) is needed when sigma is unknown.")

# show coverage converging to 0.95 as REP grows (the frequentist meaning)
print("\n  Coverage of the t-interval as REP grows (converges to 0.95):")
print(f"    {'REP':>8} {'coverage':>10}")
hits_t = (xbar - m_tc <= mu_true) & (mu_true <= xbar + m_tc)
for r in [100, 1000, 10_000, 100_000]:
    print(f"    {r:>8} {hits_t[:r].mean():>10.4f}")

# -----------------------------------------------------------------
# PART 3 — z vs t WIDTH comparison (full width = 2*margin), same data scale.
#   t_crit > z_crit always; the ratio -> 1 as n grows (t_{n-1} -> Normal).
# -----------------------------------------------------------------
print("\n" + "=" * 72)
print("PART 3 — z vs t critical values and CI half-width (per unit SE)")
print("=" * 72)
print(f"\n  {'n':>5} {'z_crit':>8} {'t_(n-1)':>9} {'t/z ratio':>11}")
print("  " + "-" * 38)
for nn in [3, 5, 10, 30, 100, 1000]:
    tc = stats.t.ppf(1 - alpha/2, df=nn - 1)
    print(f"  {nn:>5} {z_crit:>8.4f} {tc:>9.4f} {tc/z_crit:>11.4f}")
print("\n  Read-off: t_crit always exceeds z_crit=1.96 (heavier tails), so the t-interval is")
print("  always WIDER; the t/z ratio falls toward 1 as n grows (t_{n-1} -> N(0,1)).")

# -----------------------------------------------------------------
# PART 4 — CI WIDTH vs n: margin m = z*sigma/sqrt(n)  ~  1/sqrt(n).
#   Quadrupling n halves the width.  (Diminishing returns of more data.)
# -----------------------------------------------------------------
print("\n" + "=" * 72)
print("PART 4 — z-interval half-width  m = z*sigma/sqrt(n)  shrinks like 1/sqrt(n)")
print(f"         sigma = {sigma_known}, 1-alpha = {1-alpha}")
print("=" * 72)
print(f"\n  {'n':>6} {'margin m':>10} {'full width 2m':>14} {'m(n)/m(4n)':>12}")
print("  " + "-" * 46)
ns = [25, 100, 400, 1600, 6400]
margins = [z_crit * sigma_known / np.sqrt(nn) for nn in ns]
for i, nn in enumerate(ns):
    ratio = (margins[i] / margins[i+1]) if i + 1 < len(ns) else float('nan')
    rtxt  = f"{ratio:.4f}" if i + 1 < len(ns) else "  --  "
    print(f"  {nn:>6} {margins[i]:>10.4f} {2*margins[i]:>14.4f} {rtxt:>12}")
print("\n  Read-off: each 4x in n halves the margin (ratio ~ 2.0), i.e. width ~ 1/sqrt(n).")
print("  To shrink the interval 10x you need 100x the data -> precision is expensive.")
print("\n[done] all parts ran.")

৫.২ · প্রকৃত আউটপুট (স্ক্রিপ্ট চালিয়ে পাওয়া)

========================================================================
PART 1 — Three confidence intervals from ONE sample (1-alpha = 0.95)
========================================================================

  z_(alpha/2)  = 1.9600   (alpha = 0.05,  1-alpha = 0.95)

  E1  z-interval  (sigma known = 8):
      n=25, xbar=47.5335, SE=1.6000, margin=3.1359
      95% CI = [44.3975, 50.6694]   (true mu=50.0 inside: True)

  E2  t-interval  (sigma unknown, use S):
      n=25, xbar=47.8655, S=8.5981, t_(n-1,a/2)=2.0639, margin=3.5491
      95% CI = [44.3164, 51.4146]   (true mu=50.0 inside: True)

  E3  proportion CI  (Wald / CLT):
      n=200, phat=0.4200, SE=0.0349, margin=0.0684
      95% CI = [0.3516, 0.4884]   (true p=0.4 inside: True)

========================================================================
PART 2 — Monte Carlo coverage of 95% CIs (true mu fixed; intervals random)
========================================================================

  REP=100000, n=10, nominal coverage = 0.95
    (a) z-interval, sigma KNOWN     : coverage = 0.9488   (correct -> ~0.95)
    (b) t-interval, sigma unknown(S): coverage = 0.9490   (correct -> ~0.95)
    (c) z-interval BUT sigma unknown: coverage = 0.9173   (WRONG -> under 0.95)

  Read-off: (a),(b) sit on 0.95; (c) the z-with-S shortcut under-covers at small n,
  which is exactly WHY the t-interval (wider) is needed when sigma is unknown.

  Coverage of the t-interval as REP grows (converges to 0.95):
         REP   coverage
         100     0.9900
        1000     0.9580
       10000     0.9500
      100000     0.9490

========================================================================
PART 3 — z vs t critical values and CI half-width (per unit SE)
========================================================================

      n   z_crit   t_(n-1)   t/z ratio
  --------------------------------------
      3   1.9600    4.3027      2.1953
      5   1.9600    2.7764      1.4166
     10   1.9600    2.2622      1.1542
     30   1.9600    2.0452      1.0435
    100   1.9600    1.9842      1.0124
   1000   1.9600    1.9623      1.0012

  Read-off: t_crit always exceeds z_crit=1.96 (heavier tails), so the t-interval is
  always WIDER; the t/z ratio falls toward 1 as n grows (t_{n-1} -> N(0,1)).

========================================================================
PART 4 — z-interval half-width  m = z*sigma/sqrt(n)  shrinks like 1/sqrt(n)
         sigma = 8.0, 1-alpha = 0.95
========================================================================

       n   margin m  full width 2m   m(n)/m(4n)
  ----------------------------------------------
      25     3.1359         6.2719       2.0000
     100     1.5680         3.1359       2.0000
     400     0.7840         1.5680       2.0000
    1600     0.3920         0.7840       2.0000
    6400     0.1960         0.3920         --  

  Read-off: each 4x in n halves the margin (ratio ~ 2.0), i.e. width ~ 1/sqrt(n).
  To shrink the interval 10x you need 100x the data -> precision is expensive.

[done] all parts ran.

৫.৩ · আউটপুট কীভাবে পড়বেন — §৪-এর সঙ্গে মিলিয়ে

প্রতিটি PART সরাসরি §৪-এর একটা ফল সংখ্যায় প্রমাণ করল। সংক্ষেপে মিলিয়ে নিই:

  • PART 1 — তিনটে interval, একটাই টেমপ্লেট (§৪.১–৪.৩)। তিনটে CI-ই estimate \(\pm\) critical \(\times\) SE অবয়বে। E1-এ \(\mathrm{SE}=\sigma/\sqrt n=8/5=1.6\), margin \(=1.96\times1.6=3.136\) — ঠিক §৪.১-এর হিসাব। E2-তে একই data-স্কেলে \(S=8.60\) (\(\sigma=8\)-এর কাছাকাছি, কিন্তু random), আর critical value \(t_{24,0.025}=2.064 > 1.96\) — তাই margin একটু বড় (\(3.55\)); এটাই §৪.২-এর "t সবসময় চওড়া"-র এক-নমুনা দৃষ্টান্ত। E3-এ \(\hat p=0.42\), \(\widehat{\mathrm{SE}}=\sqrt{0.42\cdot0.58/200}=0.0349\) — §৪.৩-এর CLT-ভিত্তিক proportion CI। তিনটে interval-ই এই নির্দিষ্ট নমুনায় সত্য parameter-কে ঢাকল (inside: True) — তবে মনে রাখুন (§৪.৪), এটা এই নমুনার ভাগ্য, পদ্ধতির গ্যারান্টি নয়।
  • PART 2 — coverage = "\(95\%\)"-এর আসল অর্থ (§৪.৪)। এটাই ল্যাবের মূল ফল। \(100{,}000\) বার নতুন নমুনা টেনে: সঠিক z-interval coverage \(0.9488\), সঠিক t-interval \(0.9490\) — দুটোই nominal \(0.95\)-এর গায়ে। অর্থাৎ random interval সত্য (স্থির) \(\mu\)-কে দীর্ঘমেয়াদে \(\approx95\%\) সময় ঢাকে — §৪.৪-এর boxed সংজ্ঞার সরাসরি সংখ্যা-প্রমাণ। REP-টেবিল দেখাচ্ছে এই \(0.95\) ধীরে ধীরে স্থির হয় (\(100\) বারে \(0.99\), কিন্তু \(10{,}000\)+ বারে \(0.95\)) — frequentist "দীর্ঘমেয়াদি হার"-এর চেহারা। আর (c): \(\sigma\) অজানা হলেও জোর করে z চালালে coverage \(0.9173\)\(0.95\)-এর স্পষ্ট নিচে (under-coverage)। এই একটা সংখ্যাই §৪.২-এর গোটা যুক্তির প্রমাণ: \(\sigma\) না-জানার অনিশ্চয়তা উপেক্ষা করলে interval বড্ড সরু হয়, তাই সত্য \(\mu\) বেশি বার ফসকে যায় — আর সেই ফাঁক পোষাতেই চওড়া t-interval দরকার।
  • PART 3 — z বনাম t প্রস্থ (§৪.২)। \(t_{n-1,0.025}\) সবসময় \(1.96\)-এর বড় (\(n=3\)-এ বিশাল \(4.30\), অর্থাৎ interval দ্বিগুণেরও বেশি চওড়া!), আর \(n\) বাড়লে \(t/z\) অনুপাত \(1\)-এর দিকে নামে (\(n=1000\)-এ \(1.001\))। এটাই §৪.২-এর "t-interval সবসময় চওড়া, কিন্তু বড় \(n\)-এ z-এ মিশে যায়" — সংখ্যায়।
  • PART 4 — প্রস্থ বনাম \(n\) (§৪.১)। margin \(m=z_{\alpha/2}\sigma/\sqrt n\) ঠিক \(1/\sqrt n\) হারে কমে: \(n\) চারগুণ করলে \(m\) ঠিক অর্ধেক (অনুপাত কলামে নিখুঁত \(2.0000\))। ব্যবহারিক বার্তা: interval \(10\) গুণ সরু করতে চাইলে \(100\) গুণ data লাগে — precision ব্যয়বহুল, আর এটাই sample-size পরিকল্পনার (পরের অধ্যায় 4.7) মূল সমীকরণ। (Figure 4-6-ci-width-vs-n4-6-z-vs-t-ci PART 3–4-এর এই দুই প্রবণতা চোখে দেখাবে।)

এক বাক্যে ল্যাবের শিক্ষা। CI মানে point estimate-কে ঘিরে \(\pm\) margin; margin = critical × SE; "\(95\%\)" interval-টার ধর্ম নয়, পদ্ধতির ধর্ম (coverage \(\approx0.95\) — PART 2 দেখাল); সঠিক pivot (σ অজানা হলে t) না নিলে coverage ভেঙে পড়ে; আর interval সরু করার একমাত্র সৎ পথ — বেশি data, কিন্তু কেবল \(1/\sqrt n\) হারে।

৬ · ভিজ্যুয়ালাইজেশন

চারটি ছবি একটি স্ক্রিপ্ট _code/figs_4-6.py-তে তৈরি; PNG _assets/-এ (prefix 4-6, dpi=150)। in-figure লেখা সব ইংরেজিতে (Bengali-font সমস্যা এড়াতে), আর প্রতিটি ছবির ক্যাপশনে কী লক্ষ করতে হবে আলাদা করে বলা — beginner-এর জন্য এটাই আসল শেখার সূত্র। চলমান উদাহরণ: E1 z-interval; E2 t-interval; E3 proportion CI; E4 MLE-based CI।

confidence interval-এর গোটা গল্পটা চারটা প্রশ্নে ধরা যায়, আর প্রতিটার একটা ছবি আছে। (১) "৯৫% confidence" কথাটার আসল মানে কী — অর্থাৎ একটা CI কাকে cover করে, আর "৯৫%" সংখ্যাটা ঠিক কীসের ওপর প্রতিশ্রুতি (Figure 1)? (২) এই ৯৫% নিয়ে যে সবচেয়ে সাধারণ ভুলটা সবাই করে — "আমার এই interval-এ \(\mu\) থাকার ৯৫% সম্ভাবনা" — সেটা কেন ভুল, আর সঠিক ব্যাখ্যাটা দেখতে কেমন (Figure 2)? (৩) ছোট নমুনায় \(\sigma\) অজানা থাকলে z-interval-এর বদলে কেন t-interval (চওড়া) লাগে, আর \(n\) বাড়লে দুটো কীভাবে মিলে যায় (Figure 3)? (৪) interval-টা কত সরু করা যায়, আর সরু করতে গেলে কত data লাগে — half-width-এর সাথে \(n\)-এর সম্পর্ক (Figure 4)? প্রথম দুটো ছবি ব্যাখ্যা (cover-এর মানে আর তার ভুল-পাঠ), তৃতীয়টা কোন critical value (\(z\) না \(t\)), আর চতুর্থটা interval কত চওড়া (\(1/\sqrt n\) নিয়ম)।

Figure 1 — coverage: "৯৫%" আসলে কীসের প্রতিশ্রুতি

এই অধ্যায়ের কেন্দ্রীয় অন্তর্দৃষ্টি একটাই ছবিতে: "৯৫% confidence" মানে interval-টা নয়, পদ্ধতিটা ৯৫% সময় ঠিক হয়। এখানে সত্যি \(\mu=50\) (কালো খাড়া রেখা) স্থির, আর আমরা একই population থেকে ১০০ বার আলাদা নমুনা (\(n=25\), \(\sigma=10\) জানা) নিয়ে প্রতিবার একটা ৯৫% z-interval \(\bar x\pm z_{\alpha/2}\,\mathrm{SE}\) বানিয়েছি — প্রতিটা অনুভূমিক দণ্ড একেকটা interval, মাঝের বিন্দু সেই নমুনার \(\bar x\)। যে interval সত্যি \(\mu=50\)-কে ধরে (cover করে) তা নীল; যেগুলো ফসকে যায় (একদম ডানে বা বাঁয়ে সরে গিয়ে রেখাটা ছোঁয় না) তা লাল। এখানে \(100\)-র মধ্যে \(96\)টা ধরেছে, \(4\)টা ফসকেছে।

যা লক্ষ করতে হবে: (ক) দণ্ডগুলো এদিক-ওদিক লাফাচ্ছে কারণ প্রতিটা নতুন নমুনায় \(\bar x\) বদলায় — অর্থাৎ interval-টাই random, \(\mu\) নয় (কালো রেখা স্থির)। এটাই পরের ছবির মূল কথা। (খ) লাল দণ্ডগুলো ফসকেছে কারণ সেই নমুনায় \(\bar x\) ঘটনাক্রমে \(\mu\) থেকে \(z_{\alpha/2}\mathrm{SE}\)-এর বেশি দূরে পড়েছে — এটা "ভুল" নয়, পদ্ধতির অনিবার্য \(5\%\) ব্যর্থতা। (গ) cover-হার এখানে \(96/100=96\%\), প্রতিশ্রুত \(95\%\)-এর কাছাকাছি; অসীম সংখ্যক নমুনায় এটা ঠিক \(95\%\)-এ গিয়ে দাঁড়াবে (এটাই confidence level-এর সংজ্ঞা)। শিক্ষা: "৯৫%" হলো long-run coverage — বহু interval-এর মধ্যে কত ভাগ সত্যি প্যারামিটারকে ধরে, কোনো একটা নির্দিষ্ট interval-এর সম্পর্কে নয়।

A plot of 100 simulated 95% confidence intervals for a mean, drawn as horizontal bars stacked vertically, illustrating coverage. The true mean mu = 50 is marked by a solid vertical black line. Each horizontal bar is one confidence interval computed from a fresh random sample (n = 25, sigma = 10 known), with a small dot at its center marking that sample's mean x-bar. Bars that contain the true mu = 50 are drawn in blue and labelled "CI covers true mu"; the four bars that fail to reach the vertical line are drawn in thicker red and labelled "CI misses true mu". The title states that 96 of the 100 intervals cover the true mu and 4 miss it, close to the promised 95%. An annotation box reads "coverage here = 96/100 = 96% (would converge to exactly 95% over infinitely many samples)". The viewer should notice that the bars jitter left and right from sample to sample because x-bar is random while the black mu line stays fixed (so the interval is the random thing, not mu), that the red misses are the procedure's unavoidable 5% failures rather than mistakes, and that the 95% is a long-run coverage rate over many intervals, not a statement about any single interval.

Figure 2 — সঠিক বনাম ভুল ব্যাখ্যা: ৯৫% কীসের সম্ভাবনা?

Figure 1 দেখাল interval-টাই random; এই ছবি সেই সূত্র থেকে সবচেয়ে সাধারণ ভুল ব্যাখ্যাটা সরাসরি খণ্ডন করে। বাঁ দিক (সঠিক, সবুজ): ঠিক Figure 1-এর মতো বহু interval; \(\mu\) একটা স্থির খাড়া রেখা, আর প্রায় \(95\%\) interval (\(20\)-র মধ্যে \(19\)টা সবুজ) তাকে ধরে, \(1\)টা লাল ফসকায়। এখানে "৯৫%" বলতে বোঝায় পদ্ধতিটা ৯৫% সময় সফল — random জিনিসটা intervalডান দিক (ভুল, লাল ✗): এখানে শুধু একটা computed interval (নীল দণ্ড) আর তার ওপর একটা লোভনীয় কিন্তু ভুল ছবি — যেন \(\mu\) নিজে একটা সম্ভাবনার "মেঘ" (লাল ছায়া) যার \(95\%\) এই interval-এর ভেতরে পড়ে। বড় লাল ✗ মনে করিয়ে দেয়: \(\mu\) random নয়, এটা একটা স্থির (অজানা) সংখ্যা।

যা লক্ষ করতে হবে: (ক) বাঁয়ে অনেক interval, ডানে একটা — এই পার্থক্যটাই আসল। confidence-এর বিবৃতি (probability statement) interval বানানোর আগে সত্য: "যে interval আমি বানাব, তা ৯৫% সম্ভাবনায় \(\mu\)-কে ধরবে।" (খ) কিন্তু একবার data দেখে নির্দিষ্ট সংখ্যা বসিয়ে ফেললে (ডান দিকের নীল দণ্ড, যেমন \([\,0.10,\,0.46\,]\)), interval-টা হয় \(\mu\)-কে ধরেছে নয়তো ধরেনি — এখানে আর কোনো "৯৫% সম্ভাবনা" বাস করে না (তাই ডানে লাল ✗)। (গ) সঠিক ভাষা: "৯৫% confident" = "এই পদ্ধতি ৯৫% interval-এ সঠিক"; ভুল ভাষা: "\(\mu\) এই নির্দিষ্ট interval-এ থাকার সম্ভাবনা ৯৫%"। frequentist কাঠামোয় \(\mu\)-কে কোনো probability দেওয়া যায় না — সেটা করতে গেলে Bayesian credible interval লাগবে (4.x-এ আলাদা ধারণা)। এই একটাই ভুল CI-শিক্ষার সবচেয়ে বড় ফাঁদ, তাই ছবিটা মন দিয়ে দেখুন।

A two-panel figure contrasting the correct and incorrect interpretation of a 95% confidence interval. LEFT panel, titled "CORRECT: 95% of intervals cover mu (the random thing is the interval)", shows twenty horizontal confidence-interval bars stacked vertically against a fixed vertical black line marking mu; nineteen bars are green (they cross the line and cover mu) and one is red (it misses), with a caption noting mu is fixed and the procedure produces many intervals about 95% of which catch mu, 19 of 20 shown. RIGHT panel, titled "WRONG: 95% chance mu is in THIS interval (mu is not random - no probability lives here)", shows a single blue interval bar labelled "the ONE interval you computed", with a faint red bell-shaped probability cloud drawn over the region as the tempting-but-wrong mental picture that mu is randomly distributed, a fixed vertical black line for the true mu labelled "already fixed, either in or out", and a large red X struck over the wrong idea; its caption reads "Once computed, the interval either contains mu or not. The 95% is a property of the METHOD, not of this one interval." The viewer should notice that the correct reading involves many intervals with a fixed mu and a random interval, while the wrong reading wrongly treats a single computed interval as if mu had a 95% probability of lying inside it.

Figure 3 — z-interval বনাম t-interval: \(\sigma\) অজানা হলে দাম দিতে হয়

এবার E1 বনাম E2-র পার্থক্য একছবিতে: \(\sigma\) জানা থাকলে multiplier \(z_{\alpha/2}\) (z-interval), কিন্তু \(\sigma\) অজানা হয়ে \(s\) দিয়ে অনুমান করলে multiplier \(t_{n-1,\alpha/2}\) (t-interval) — আর এই \(t\) সবসময় \(z\)-এর চেয়ে বড়, বিশেষত ছোট \(n\)-এ, যা interval-কে চওড়া করে। প্যানেল (a): অনুভূমিক অক্ষ \(n\); নীল রেখা স্থির \(z_{0.025}=1.96\), কমলা রেখা \(t_{n-1,\,0.025}\) — যা \(n=2\)-তে বিশাল (\(12.7\), চার্টের ওপরে কাটা) থেকে নেমে \(n=5\)-এ \(2.78\), \(n=10\)-এ \(2.26\), হয়ে \(n\) বড় হলে \(1.96\)-এর গায়ে মিশে যায়। প্যানেল (b): একই \(\sigma\)-তে কয়েকটা \(n\)-এর জন্য জোড়া-দণ্ড — উপরে নীল z-interval, নিচে কমলা t-interval (চওড়া); \(n=3\)-এ কমলা দণ্ড অনেক লম্বা, \(n=30\)-এ প্রায় সমান।

যা লক্ষ করতে হবে: (ক) t সবসময় z-এর ওপরে (প্যানেল a) — কারণ \(\sigma\)-কে একই ছোট নমুনা থেকে আঁচ করার বাড়তি অনিশ্চয়তা পুষিয়ে দিতে interval-কে চওড়া করতে হয়; এই বাড়তি চওড়াই "\(\sigma\) অজানা থাকার দাম।" (খ) \(n\to\infty\)-এ কমলা নীলে মিশে যায় — কারণ বড় নমুনায় \(s\to\sigma\), তখন t-distribution normal-এ রূপ নেয় (Student-t-এর লেজ মোটা, কিন্তু df বাড়লে পাতলা হয়)। তাই practical নিয়ম: \(n\gtrsim 30\) হলে z আর t-এর ফারাক নগণ্য, কিন্তু ছোট \(n\)-এ অবশ্যই t ব্যবহার করুন, নইলে interval ভুলভাবে সরু হবে ও coverage ৯৫%-এর নিচে নামবে। (গ) প্যানেল (b)-তে দণ্ডগুলো \(\bar x\) ঘিরে symmetric; \(n=3\)-এ t-দণ্ড নীল-দণ্ডের চেয়ে স্পষ্ট লম্বা — এই অতিরিক্ত দৈর্ঘ্যই Figure 4-এর width-আলোচনার সাথে জোড়া (t হলে half-width একটু বেশি)।

A two-panel figure comparing the z-interval and the t-interval. LEFT panel (a), titled "t-multiplier > z-multiplier, but they converge as n grows", plots critical value (the multiplier on the standard error) against sample size n: a flat blue horizontal line at z = 1.96 for the normal, and an orange descending curve for the Student-t critical value t_{n-1,0.025}, which is huge for very small n (about 12.7 at n=2, off the top of the chart), 2.78 at n=5, 2.26 at n=10, and gradually approaches the blue z line as n grows; an annotation notes the extra width of the t-interval is the price of estimating sigma from the same small sample. RIGHT panel (b), titled "same data, two intervals: t (orange) is wider, gap shrinks with n", shows paired horizontal interval bars centered at x-bar for sample sizes n = 3, 5, 10, 30, with the blue z-interval on top and the wider orange t-interval below in each pair; at n=3 the orange t-bar is much longer than the blue z-bar, and by n=30 they nearly coincide. The viewer should notice that the t-multiplier is always above the z-multiplier because estimating sigma adds uncertainty that widens the interval, that the two converge as n grows because the sample standard deviation approaches sigma and the t-distribution approaches the normal, and that for small n one must use the t-interval or coverage will fall below 95%.

Figure 4 — CI half-width \(\propto 1/\sqrt n\): সরু করতে চাইলে data চারগুণ

শেষ ছবি practical প্রশ্নের উত্তর দেয়: margin of error \(m=z_{\alpha/2}\,\sigma/\sqrt n\) — অর্থাৎ interval-এর অর্ধ-প্রস্থ \(n\)-এর বর্গমূলের বিপরীত আনুপাতিক (\(m\propto 1/\sqrt n\))। প্যানেল (a): অনুভূমিক অক্ষ \(n\), উল্লম্ব অক্ষ half-width \(m\); নীল curve দ্রুত নামে তারপর সমতল হয় (diminishing returns)। তিনটা লাল বিন্দু \(n=10,40,160\)-এ: \(m=0.620,\,0.310,\,0.155\) — প্রতিবার \(n\) চারগুণ হলে \(m\) ঠিক অর্ধেক (বাঁকা ধূসর তীর দেখাচ্ছে)। প্যানেল (b): একই জিনিস log-log অক্ষে — সরলরেখা, ঢাল \(-1/2\), যা power law \(m\propto n^{-1/2}\) নিশ্চিত করে।

যা লক্ষ করতে হবে: (ক) curve-টা প্রথমে খাড়া নামে, তারপর চ্যাপ্টা হয়ে যায় — অর্থাৎ ছোট \(n\)-এ নমুনা একটু বাড়ালেই interval অনেক সরু হয়, কিন্তু \(n\) আগে থেকেই বড় হলে আরও সরু করতে বিশাল data লাগে (diminishing returns)। (খ) মূল নিয়ম: interval অর্ধেক সরু করতে \(n\) চারগুণ করতে হয় (\(n\to 4n \Rightarrow \sqrt n \to 2\sqrt n \Rightarrow m\to m/2\)); \(0.620\to0.310\to0.155\) এই সংখ্যাগুলোই তা দেখায়। তাই কেউ যদি বলে "precision দ্বিগুণ চাই", বুঝতে হবে খরচ (নমুনা-আকার) চারগুণ। (গ) log-log-এ সরলরেখা ও ঢাল \(-1/2\) — এটা power law-এর স্বাক্ষর: \(\log m = \log(z\sigma) - \tfrac12\log n\), তাই ঢাল ঠিক \(-\tfrac12\)। (এই \(1/\sqrt n\) হার সরাসরি Part III-এর CLT/standard-error থেকে আসে, আর sample-size planning-এ ব্যবহৃত হয়: চাহিদা-মাফিক \(m\) পেতে দরকারি \(n\ge (z_{\alpha/2}\sigma/m)^2\)।)

A two-panel figure showing that the confidence-interval half-width m = z * sigma / sqrt(n) is proportional to 1 over the square root of n. The overall title reads "To halve a confidence interval you must quadruple the data". LEFT panel (a), titled "width shrinks like 1/sqrt(n) (diminishing returns)", plots the CI half-width m against sample size n as a thick blue curve that falls steeply at first and then flattens out; three red dots mark n = 10 (m = 0.620), n = 40 (m = 0.310), and n = 160 (m = 0.155), with curved grey arrows connecting them and an annotation "x4 the sample size -> half the width". RIGHT panel (b), titled "on log-log axes it is a straight line of slope -1/2", plots the same half-width against n on logarithmic axes, giving a straight blue line that matches a dashed reference line of slope minus one half, with an annotation that the straight line confirms the exact power law m proportional to n to the minus one half. The viewer should notice that the width drops fast for small n but then yields diminishing returns, that halving the interval requires quadrupling the sample size because m depends on 1 over root n, and that the log-log straight line of slope -1/2 is the signature of this power law.


৭ · অনুশীলনী

প্রতিটি প্রশ্নে difficulty tag (★ সহজ · ★★ মাঝারি · ★★★ চ্যালেঞ্জিং) ও একটি hint। পূর্ণ সমাধান _solutions/04-06-confidence-intervals-solutions.md-এ। চেষ্টা না করে সমাধান দেখবেন না — হোঁচট খাওয়াটাই শেখার অংশ। (স্মারক: confidence level \(1-\alpha\); margin of error \(m=z_{\alpha/2}\,\mathrm{SE}\); z-interval \(\bar x\pm z_{\alpha/2}\,\sigma/\sqrt n\) (\(\sigma\) জানা); t-interval \(\bar x\pm t_{n-1,\alpha/2}\,s/\sqrt n\) (\(\sigma\) অজানা); proportion CI \(\hat p\pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}\); pivot = এমন quantity যার distribution \(\theta\)-নিরপেক্ষ। চলমান উদাহরণ: E1 z-interval; E2 t-interval; E3 proportion CI; E4 MLE-based CI।)

ক · ধারণাগত (conceptual)

প্রশ্ন ১ (★). নিজের ভাষায় বলুন confidence level \(1-\alpha\), margin of error \(m\), আর critical value \(z_{\alpha/2}\) — এই তিনটা কী। একটা \(95\%\) CI-তে \(\alpha\) কত, আর \(z_{\alpha/2}\)-এর আনুমানিক মান কত? Hint: \(1-\alpha\) = পদ্ধতির long-run coverage; \(m=z_{\alpha/2}\mathrm{SE}\) = কেন্দ্র থেকে দুই প্রান্তের দূরত্ব; \(z_{\alpha/2}\) = standard normal-এর সেই বিন্দু যার ডানে \(\alpha/2\) ভর। \(95\%\Rightarrow\alpha=0.05,\ \alpha/2=0.025,\ z_{0.025}\approx1.96\)

প্রশ্ন ২ (★★) — [CI-এর সঠিক ব্যাখ্যা যাচাই]. একজন গবেষক একটা নমুনা থেকে গড়ের \(95\%\) CI পেলেন \([\,12.1,\,15.9\,]\) এবং লিখলেন: "সত্যি \(\mu\) এই interval-এ থাকার সম্ভাবনা \(95\%\)।" এই বাক্যটা কেন ভুল? সঠিক ব্যাখ্যাটা এক-দুই বাক্যে লিখুন। Figure 1 ও Figure 2 থেকে যুক্তি টানুন। (frequentist কাঠামোয় \(\mu\)-কে কি কোনো probability দেওয়া যায়?) Hint: \(\mu\) স্থির (random নয়); একবার interval বসানো হলে তা হয় \(\mu\)-কে ধরেছে নয় ধরেনি — কোনো \(0.95\) সম্ভাবনা থাকে না। "৯৫%" হলো পদ্ধতির long-run coverage (random জিনিস = interval, Figure 1-এর লাফানো দণ্ড)। সঠিক: "যদি বহুবার নমুনা নিয়ে এভাবে interval বানাই, ~৯৫% তাদের সত্যি \(\mu\)-কে ধরবে।"

প্রশ্ন ৩ (★★). কখন z-interval ব্যবহার করবেন আর কখন t-interval? Figure 3 থেকে ব্যাখ্যা করুন কেন একই নমুনায় t-interval z-interval-এর চেয়ে চওড়া, এবং \(n\) বড় হলে কী ঘটে। Hint: \(\sigma\) জানা (বা \(n\) খুব বড়) ⇒ z; \(\sigma\) অজানা, \(s\) দিয়ে আঁচ ⇒ t। \(t_{n-1,\alpha/2}>z_{\alpha/2}\) কারণ \(\sigma\) আঁচের বাড়তি অনিশ্চয়তা; \(n\to\infty\)-এ \(s\to\sigma\), \(t\to z\), দুই interval মেলে।

প্রশ্ন ৪ (★★). একটা \(95\%\) CI আর একটা \(99\%\) CI একই data থেকে বানালে কোনটা চওড়া হবে, এবং কেন? "বেশি confidence" আর "বেশি precision (সরু interval)"-এর মধ্যে কী tradeoff আছে? কীভাবে এই tradeoff না ভেঙে দুটোই উন্নত করা যায়? Hint: \(99\%\) চওড়া (\(z_{0.005}=2.576>z_{0.025}=1.96\), তাই \(m\) বড়)। একই \(n\)-এ confidence ↑ ⇒ width ↑ — সরাসরি tradeoff। দুটো একসাথে পেতে চাইলে \(n\) বাড়াতে হবে (Figure 4: \(m\propto1/\sqrt n\))।

খ · গাণনিক (computational)

প্রশ্ন ৫ (★) — E1 (z-interval). একটা মেশিন-ভরা প্যাকেটের ওজন \(\mathcal{N}(\mu,\sigma^2)\), \(\sigma=4\) গ্রাম জানা\(n=16\) প্যাকেটে \(\bar x=502\) গ্রাম। \(\mu\)-এর একটা \(95\%\) z-interval বের করুন। (ব্যবহার করুন \(z_{0.025}=1.96\)।) Hint: \(\mathrm{SE}=\sigma/\sqrt n=4/4=1\); \(m=1.96\times1=1.96\); CI \(=502\pm1.96=[\,500.04,\,503.96\,]\)

প্রশ্ন ৬ (★★) — E2 (t-interval). এক ব্যাচ ব্যাটারির আয়ু (ঘণ্টা) থেকে \(n=10\) নমুনায় \(\bar x=210\), \(s=15\) (\(\sigma\) অজানা)। \(\mu\)-এর \(95\%\) t-interval বের করুন। (\(t_{9,\,0.025}=2.262\)।) এই interval একটা \(z\)-interval-এর চেয়ে চওড়া না সরু হতো, এবং কেন? Hint: \(\mathrm{SE}=s/\sqrt n=15/\sqrt{10}=4.743\); \(m=2.262\times4.743=10.73\); CI \(=210\pm10.73=[\,199.27,\,220.73\,]\)। z হলে \(1.96\) ব্যবহার করত — সরু হতো, কিন্তু \(\sigma\) অজানা বলে coverage কমে যেত; তাই t সঠিক।

প্রশ্ন ৭ (★★) — E3 (proportion CI). একটা A/B-টেস্টে \(n=400\) ব্যবহারকারীর \(\hat p=0.30\) ক্লিক করল। click-rate \(p\)-এর \(95\%\) (Wald) CI বের করুন: \(\hat p\pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}\)। margin of error কত শতাংশ-বিন্দু? Hint: \(\sqrt{0.30\times0.70/400}=\sqrt{0.000525}=0.02291\); \(m=1.96\times0.02291=0.0449\); CI \(=0.30\pm0.045=[\,0.255,\,0.345\,]\), অর্থাৎ \(\pm4.5\) শতাংশ-বিন্দু।

প্রশ্ন ৮ (★★) — sample size planning। প্রশ্ন ৭-এর A/B টেস্টে margin of error \(\pm2\) শতাংশ-বিন্দু (\(m=0.02\)) চাই \(95\%\) confidence-এ। কমপক্ষে কত \(n\) লাগবে? (\(\hat p\) অজানা হলে worst-case \(\hat p=0.5\) ধরুন।) Hint: \(n\ge\big(z_{\alpha/2}/m\big)^2\,\hat p(1-\hat p)\)। worst case \(\hat p(1-\hat p)=0.25\): \(n\ge(1.96/0.02)^2\times0.25=9604\times0.25=2401\)

গ · প্রমাণভিত্তিক (proof-based)

প্রশ্ন ৯ (★★) — pivot পদ্ধতি। \(X_1,\dots,X_n\overset{iid}{\sim}\mathcal{N}(\mu,\sigma^2)\), \(\sigma\) জানা। দেখান যে \(Z=\dfrac{\bar X-\mu}{\sigma/\sqrt n}\sim\mathcal{N}(0,1)\) একটা pivot (এর distribution \(\mu\)-নিরপেক্ষ)। এরপর \(P(-z_{\alpha/2}\le Z\le z_{\alpha/2})=1-\alpha\) থেকে শুরু করে বীজগণিতে \(\mu\)-কে মাঝে এনে z-interval \(\bar X\pm z_{\alpha/2}\,\sigma/\sqrt n\)-টি derive করুন। Hint: \(\bar X\sim\mathcal{N}(\mu,\sigma^2/n)\) standardize করলে \(Z\) — এর distribution \(\mu,\sigma\)-এর ওপর নির্ভর করে না, তাই pivot। অসমতার ভেতরে \(-z_{\alpha/2}\le\frac{\bar X-\mu}{\sigma/\sqrt n}\le z_{\alpha/2}\) থেকে \(\mu\) isolate: \(\bar X-z_{\alpha/2}\frac{\sigma}{\sqrt n}\le\mu\le\bar X+z_{\alpha/2}\frac{\sigma}{\sqrt n}\)

প্রশ্ন ১০ (★★). confidence level-এর frequentist সংজ্ঞা আনুষ্ঠানিকভাবে লিখুন: একটা interval \(C_n=[\,L(X),\,U(X)\,]\)-এর coverage probability কী, এবং "\(C_n\) একটা \((1-\alpha)\) CI" বলতে ঠিক কী বোঝায়? এরপর ব্যাখ্যা করুন কেন এই সংজ্ঞায় probability-টা interval-এর ওপর (data-র randomness), \(\theta\)-এর ওপর নয় — Figure 2-র সাথে মেলান। Hint: coverage \(=P_\theta\big(L(X)\le\theta\le U(X)\big)\); এটি \(\ge1-\alpha\) সব \(\theta\)-এর জন্য হলে \(C_n\) একটা \((1-\alpha)\) CI। randomness আসে \(X\) থেকে (\(L,U\) random), \(\theta\) স্থির — তাই "interval ধরবে কি না" প্রশ্নটাই random (Figure 2-এর বাঁ দিক)।

প্রশ্ন ১১ (★★★) — E4 (MLE-based / large-sample CI). ধরুন \(\hat\theta\) একটা MLE যার asymptotic বণ্টন \(\hat\theta\approx\mathcal{N}\!\big(\theta,\ \widehat{\mathrm{se}}^2\,\big)\) যেখানে \(\widehat{\mathrm{se}}=1/\sqrt{n\,I(\hat\theta)}\) (\(I\) = Fisher information)। (ক) এই normal approximation থেকে \(\theta\)-এর একটা \((1-\alpha)\) Wald CI লিখুন। (খ) এখন \(\psi=g(\theta)\) একটা মসৃণ রূপান্তর; delta method ব্যবহার করে \(\psi\)-এর জন্য approximate CI লিখুন (এর se = \(\lvert g'(\hat\theta)\rvert\,\widehat{\mathrm{se}}\))। (গ) এই গোটা পদ্ধতিটা §৭ Q9-এর pivot-যুক্তির সাথে কীভাবে মেলে? Hint: (ক) \(\hat\theta\pm z_{\alpha/2}\,\widehat{\mathrm{se}}\)। (খ) \(g(\hat\theta)\pm z_{\alpha/2}\,\lvert g'(\hat\theta)\rvert\,\widehat{\mathrm{se}}\)। (গ) এখানে approximate pivot \(\frac{\hat\theta-\theta}{\widehat{\mathrm{se}}}\xrightarrow{d}\mathcal{N}(0,1)\) — বড় নমুনায় Q9-এর exact normal pivot-এরই asymptotic সংস্করণ। (4.5-এর Fisher information ও asymptotic normality এখানে সরাসরি কাজে লাগছে।)

ঘ · কোডিং (coding)

প্রশ্ন ১২ (★★) — coverage simulation (Figure 1 পুনর্নির্মাণ)। \(\mathcal{N}(\mu=50,\sigma^2=100)\) থেকে \(n=25\)-এর নমুনা \(10{,}000\) বার টেনে প্রতিবার \(95\%\) z-interval বানান, এবং কত ভাগ interval সত্যি \(\mu=50\)-কে ধরে তা গুনুন। empirical coverage কি \(\approx0.95\)? তারপর \(n=25\)-এর বদলে \(n=5\)-এ পুনরাবৃত্তি করুন — coverage কি বদলায় (z-interval, \(\sigma\) জানা)? Hint:

import numpy as np
from scipy import stats
rng = np.random.default_rng(0)
mu, sigma, n, R = 50.0, 10.0, 25, 10000
z = stats.norm.ppf(0.975)
X = rng.normal(mu, sigma, size=(R, n))
xbar = X.mean(1); m = z * sigma / np.sqrt(n)
cover = (xbar - m <= mu) & (mu <= xbar + m)
print("coverage:", cover.mean())   # ~0.95
\(\sigma\) জানা থাকলে coverage \(n\)-নিরপেক্ষ (\(\approx0.95\) যেকোনো \(n\)-এ); শুধু interval চওড়া হয় ছোট \(n\)-এ।

প্রশ্ন ১৩ (★★) — z বনাম t, \(\sigma\) অজানা হলে coverage। এখন \(\sigma\) অজানা ধরে (\(s\) দিয়ে অনুমান) \(n=5\)-এ \(10{,}000\) বার (ক) z-interval (\(1.96\,s/\sqrt n\)) ও (খ) t-interval (\(t_{4,0.025}\,s/\sqrt n\)) বানিয়ে দুটোর empirical coverage তুলনা করুন। দেখান z-interval-এর coverage \(0.95\)-এর নিচে নামে, কিন্তু t-interval \(\approx0.95\) ফিরিয়ে দেয়। Hint: s = X.std(axis=1, ddof=1); z-interval m_z = 1.96*s/np.sqrt(n), t-interval m_t = stats.t.ppf(0.975, df=n-1)*s/np.sqrt(n)। ছোট \(n\)-এ z-coverage \(\approx0.88\)\(0.90\) (under-coverage), t-coverage \(\approx0.95\) — এটাই কেন t লাগে।

প্রশ্ন ১৪ (★★★) — proportion CI (E3) ও MLE-CI (E4)। Bernoulli\((p=0.3)\) থেকে \(n=400\)-এর নমুনা \(5{,}000\) বার টেনে প্রতিবার \(95\%\) Wald proportion-CI বানান; empirical coverage ছাপান (Wald CI ছোট/চরম \(p\)-তে under-cover করে — এখানে \(p=0.3\)-এ কেমন?)। তারপর একই data-কে MLE-কাঠামোয় দেখুন: \(\hat p\) হলো \(p\)-এর MLE, \(\widehat{\mathrm{se}}=\sqrt{\hat p(1-\hat p)/n}\), তাই Wald CI = MLE-based CI — দুটো যে একই, তা যাচাই করুন। Hint:

phat = rng.binomial(n, 0.3, size=5000) / n
se = np.sqrt(phat*(1-phat)/n)
lo, hi = phat - 1.96*se, phat + 1.96*se
print("coverage:", ((lo <= 0.3) & (0.3 <= hi)).mean())
\(p=0.3\), \(n=400\)-এ coverage \(\approx0.94\)\(0.95\)। লক্ষ করুন proportion-CI আসলে Bernoulli-র MLE \(\hat p\)-এর Wald (asymptotic normal) CI — E3 আর E4 এক জায়গায় মেলে।


৮ · সারসংক্ষেপ ও সংযোগ

মূল পয়েন্ট (recap):

  • CI কী। point estimate একটা সংখ্যা; confidence interval একটা পরিসর \([\,L(X),\,U(X)\,]\) যা estimate-এর সাথে তার অনিশ্চয়তাও বহন করে। গঠন প্রায় সবসময় estimate \(\pm\) margin of error: \(\hat\theta\pm m\), যেখানে \(m=z_{\alpha/2}\,\mathrm{SE}\) (বা ছোট-নমুনায় \(t_{n-1,\alpha/2}\,\mathrm{SE}\))।
  • "৯৫%" মানে coverage, interval নয় (Figure 1, 2)। confidence level \(1-\alpha\) হলো পদ্ধতির long-run coverage: বহুবার নমুনা নিয়ে interval বানালে ~\((1-\alpha)\) ভাগ সত্যি \(\theta\)-কে ধরবে। random জিনিসটা interval (\(\theta\) স্থির)। তাই "\(\theta\) এই নির্দিষ্ট interval-এ থাকার সম্ভাবনা ৯৫%" — ভুল: একবার সংখ্যা বসলে interval হয় ধরেছে নয় ধরেনি, কোনো probability বাকি থাকে না (§৭ Q2, Q10)।
  • pivot পদ্ধতি (§৭ Q9)। CI বানানোর মূল কৌশল: এমন একটা pivot quantity খোঁজা যার distribution \(\theta\)-নিরপেক্ষ (যেমন \(Z=\frac{\bar X-\mu}{\sigma/\sqrt n}\sim\mathcal{N}(0,1)\)), তারপর \(P(-z_{\alpha/2}\le Z\le z_{\alpha/2})=1-\alpha\) থেকে \(\theta\)-কে isolate করা।
  • z বনাম t (Figure 3)। \(\sigma\) জানা (বা \(n\) বড়) ⇒ z-interval \(\bar x\pm z_{\alpha/2}\sigma/\sqrt n\) (E1)। \(\sigma\) অজানা, \(s\) দিয়ে আঁচ ⇒ t-interval \(\bar x\pm t_{n-1,\alpha/2}\,s/\sqrt n\) (E2) — সবসময় চওড়া (\(t>z\)), কারণ \(\sigma\) আঁচের বাড়তি অনিশ্চয়তা; \(n\to\infty\)-এ দুই মিলে যায়। ছোট \(n\)-এ z ব্যবহার করলে coverage ৯৫%-এর নিচে নামে (§৭ Q13)।
  • প্রস্থ ও সংখ্যা-নির্ধারণ (Figure 4)। half-width \(m\propto 1/\sqrt n\) — interval অর্ধেক সরু করতে \(n\) চারগুণ (diminishing returns)। তাই sample-size planning: চাহিদা-মাফিক \(m\) পেতে \(n\ge(z_{\alpha/2}\sigma/m)^2\) (§৭ Q8)। confidence ↑ ⇒ width ↑ (একই \(n\)-এ), একটা সরাসরি tradeoff (§৭ Q4)।
  • চলমান উদাহরণে সারাংশ। E1 (z): \(\sigma\) জানা, \(\bar x\pm z_{\alpha/2}\sigma/\sqrt n\)। E2 (t): \(\sigma\) অজানা, \(\bar x\pm t_{n-1,\alpha/2}s/\sqrt n\)। E3 (proportion): \(\hat p\pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}\) — যা আসলে Bernoulli-র MLE \(\hat p\)-এর Wald CI। E4 (MLE-based): বড় নমুনায় \(\hat\theta\pm z_{\alpha/2}\,\widehat{\mathrm{se}}\) (\(\widehat{\mathrm{se}}=1/\sqrt{n I(\hat\theta)}\)), আর delta method দিয়ে \(g(\theta)\)-এর CI (§৭ Q11) — E3 এই কাঠামোরই বিশেষ ঘটনা।

পূর্ববর্তী সংযোগ (← 4.5 Fisher Information ও Cramér–Rao, এবং 4.1, 4.4, 3.4): 4.1-এ point estimation আর standard error, 4.4-এ sampling distribution ও MSE, আর 4.5-এ Fisher information \(I(\theta)\) ও asymptotic normality of the MLE — এই অধ্যায় সেই সব উপাদানকে এক করে অনিশ্চয়তাকে একটা পরিসরে প্রকাশ করল। 4.5-এ আমরা জেনেছি MLE বড় নমুনায় \(\mathcal{N}\big(\theta,\,1/[nI(\theta)]\big)\)-এর কাছাকাছি; সেই asymptotic normality-ই E4-এর Wald CI-র সরাসরি ভিত্তি (\(\widehat{\mathrm{se}}=1/\sqrt{nI(\hat\theta)}\))। আর pivot \(\frac{\bar X-\mu}{\sigma/\sqrt n}\sim\mathcal{N}(0,1)\)-এর পেছনে আছে 3.4-এর CLT ও standard-error ধারণা — যেখান থেকে \(1/\sqrt n\) হারটাও আসে (Figure 4)। অর্থাৎ 4.4–4.5 ছিল "estimator কত ভালো ও কত নিখুঁত" মাপা; 4.6 হলো সেই নিখুঁততাকে একটা interval-এ অনুবাদ করা।

পরবর্তী সংযোগ (→ 4.7 — Hypothesis Testing; CI ও test-এর দ্বৈততা): এই অধ্যায়ে আমরা data থেকে \(\theta\)-এর একটা সম্ভাব্য পরিসর বানালাম। পরের অধ্যায় উল্টো প্রশ্ন করবে: "\(\theta\)-এর একটা নির্দিষ্ট মান (যেমন \(\theta=\theta_0\)) কি data-র সাথে সঙ্গতিপূর্ণ?" — এটাই hypothesis testing (null \(H_0:\theta=\theta_0\), p-value, power, Neyman–Pearson)। দুটো গভীরভাবে দ্বৈত (dual): একটা \((1-\alpha)\) CI আসলে সেই সব \(\theta_0\)-এর সংগ্রহ যাদের level-\(\alpha\) test প্রত্যাখ্যান করে না — অর্থাৎ "\(\theta_0\) কি \(95\%\) CI-তে আছে?" আর "\(H_0:\theta=\theta_0\) কি \(5\%\) level-এ প্রত্যাখ্যাত নয়?" — এক প্রশ্নের দুই রূপ। তাই এই অধ্যায়ের pivot-যুক্তি (§৭ Q9) সরাসরি test-statistic-এ রূপ নেবে, আর \(z_{\alpha/2}/t_{n-1,\alpha/2}\) critical value-গুলোই test-এর rejection boundary হবে। CI "কতটা অনিশ্চয়তা" বলে; test "একটা নির্দিষ্ট দাবি টেকে কি না" বলে — 4.7-এ এই দুই দৃষ্টিভঙ্গি একসূত্রে বাঁধা পড়বে।

সূত্র (sources): L. Wasserman, All of Statistics, Ch. 6 (§6.3.2 Confidence Sets — coverage, pivot, normal-based interval; §6.3.1 ব্যাখ্যা ও সাধারণ ভুল) ও Ch. 9 (parametric/Wald CI, delta method); J. A. Rice, Mathematical Statistics and Data Analysis, Ch. 7 (§7.3–7.4 Survey Sampling ও confidence intervals, sample-size; normal ও large-sample interval); P. Bruce, A. Bruce & P. Gedeck, Practical Statistics for Data Scientists, Ch. 2 ("Confidence Intervals", bootstrap ও margin-of-error-এর ব্যবহারিক দিক)।