সমাধান — অধ্যায় ৮.৪ · Where Next: Research Readiness (এরপর কোথায় — গবেষণার পথ)¶

অধ্যায় ফাইল: part-8-capstone/08-04-where-next.md (§৭ অনুশীলনী ও পরবর্তী প্রকল্প)।

একটা জরুরি টীকা। এ অধ্যায়ের অনুশীলনী গণিত-সমস্যা নয় — এগুলো পরবর্তী-প্রকল্পের প্রম্পট, একজন শুরুয়াতি গবেষকের প্রথম বাস্তব কাজ। তাই এখানে \"সমাধান\" মানে একটা সংখ্যাগত উত্তর নয়, বরং একটা কাঠামো, ধাপে-ধাপে দিকনির্দেশনা, ও সতর্কতা — কীভাবে শুরু করা, কী কী পদক্ষেপ, কোথায় হোঁচট খাওয়ার আশঙ্কা, ও সাফল্যের মাপকাঠি কী। কোনো একক \"সঠিক\" পথ নেই; নিচেরগুলো নির্ভরযোগ্য সূচনা-রোডম্যাপ।

সংযোগ-সূত্র। প্রতিটি প্রকল্পের সাথে §৪-এর reproducibility-অভ্যাস (version control git, স্থির master seed, environment-pinning requirements.txt, চালানো-যায় কোড, canonical সংখ্যা-যাচাই) সঙ্গে নিন; এবং §২-এর ক্ষেত্র-মানচিত্র ও §৩-এর পড়ার-তালিকা প্রতিটি প্রকল্পের কাঁচামাল। Part VIII-এর আগের তিন অধ্যায় (8.1 end-to-end, 8.2 simulation-study, 8.3 paper-reproduction) হুবহু এই প্রকল্পগুলোর কার্যকর নমুনা — বারবার সেগুলোকে টেমপ্লেট হিসেবে ধরুন।

ক · পুনরুৎপাদন ও যাচাই¶

সমাধান ১ (★) — একটা সাম্প্রতিক paper পুনরুৎপাদন¶

লক্ষ্য। একটা প্রকাশিত দাবিকে (একটা theorem-এর empirical পরিণতি, বা একটা মূল চিত্র/টেবিল) নিজে কোড লিখে ফিরে পাওয়া — একজন গবেষকের সবচেয়ে মৌলিক দক্ষতা।

রোডম্যাপ।

(ক) সঠিক paper ও দাবি বাছা। শুরুতে একটা সরল, সু-নথিভুক্ত, স্বয়ংসম্পূর্ণ ফল নিন — সম্পূর্ণ deep-learning paper নয় (যেখানে হার্ডওয়্যার, ডেটা ও hyperparameter পুনরুৎপাদন কঠিন)। ভালো প্রার্থী: lasso-র support-recovery একটা toy sparse setting-এ (§২.৩); bootstrap-CI-এর coverage (Part IV); বা 8.3-এর James–Stein dominance (ইতিমধ্যে করা — একটা মডেল)। paper থেকে একটা সুনির্দিষ্ট, সংখ্যায়-নামানো-যায় দাবি বেছে নিন (\"চিত্র ৩-এর coverage \(\approx0.95\)\", \"টেবিল ১-এর MSE-হ্রাস \(\approx\) X%\")।
(খ) reproducible স্ক্রিপ্ট লেখা। একটা git-repo খুলুন; একটা master seed স্থির করুন (np.random.default_rng(<seed>)); সিমুলেশন/বিশ্লেষণ এক স্ক্রিপ্টে লিখুন; নির্ভরতা-সংস্করণ requirements.txt-এ লক করুন। কোডটা যেন এক কমান্ডে চলে ও চিত্র/সংখ্যা লেখে (ঠিক এই curriculum-এর lab_*.py-এর মতো)।
(গ) reproduction report। একটা ছোট নথিতে লিখুন: paper-এর মান বনাম আপনার মান (একটা টেবিল), কী মিলল, কী মিলল না, ও কেন (seed-ভিন্নতা? একটা অনির্দিষ্ট hyperparameter? একটা library-সংস্করণ?)। \"মিলল না\"-ও একটা বৈধ, মূল্যবান ফল — অনেক reproduction-ব্যর্থতা ঠিক এভাবেই ধরা পড়ে।

সতর্কতা ও সাফল্যের মাপকাঠি। মূল ফাঁদ — একটা \"বিশাল\" দাবি বেছে ফেলা যা এক সপ্তাহে যাচাই-অযোগ্য; বরং একটা ছোট, নির্দিষ্ট সংখ্যায় নামুন। সাফল্য = আপনার সংখ্যা paper-এর সংখ্যার (যুক্তিসঙ্গত Monte-Carlo-ত্রুটির মধ্যে) কাছাকাছি, এবং পার্থক্য থাকলে তার একটা সৎ ব্যাখ্যা। (এটি একটা প্রকল্প — কোনো canonical সংখ্যা নেই; মাপকাঠি হলো একটা সম্পূর্ণ, reproducible, সৎ report।)

সমাধান ২ (★★) — একটা reproducibility-audit¶

লক্ষ্য। §৪-এর মানদণ্ডকে একটা বাস্তব ফলের উপর প্রয়োগ করে reproducibility-র ফাঁক চেনা ও ঠিক করা।

রোডম্যাপ।

(ক) checklist দিয়ে যাচাই। §৪.১-এর ছয়টি সরঞ্জাম আপনার checklist: (১) কোড উপলব্ধ? (২) ডেটা উপলব্ধ (বা তার উৎস স্পষ্ট)? (৩) random seed স্থির? (৪) environment/নির্ভরতা-সংস্করণ pinned? (৫) একটা literate/README-নথি আছে? (৬) বিশ্লেষণ preregistered বা অন্তত পূর্ব-নির্দিষ্ট? প্রতিটির জন্য হ্যাঁ/না ও প্রমাণ লিখুন।
(খ) \"fresh-environment\" পরীক্ষা। সবচেয়ে কঠোর test — কোডটা একটা নতুন, পরিষ্কার virtual environment-এ (বা অন্য মেশিনে) চালান। হুবহু একই সংখ্যা আসে? না এলে, ঠিক কোথায় ভাঙল তা নথিভুক্ত করুন (library-সংস্করণ? পথ? অ-স্থির seed? OS-নির্ভর floating-point?)।
(গ) ঠিক করার checklist। কী কী পরিবর্তন ফলটিকে সম্পূর্ণ reproducible করত — একটা git-repo, একটা স্থির seed, একটা requirements.txt, একটা README (কীভাবে চালাতে হয়), ও চিত্রগুলোকে চালানো-যায় কোডে বাঁধা। এই curriculum নিজেই (§৪.৩) এই তালিকার একটা কার্যকর উদাহরণ।

সতর্কতা। একটা সাধারণ ভুল ধারণা — \"কোড আছে মানেই reproducible\"। বাস্তবে অ-স্থির seed বা un-pinned নির্ভরতা প্রায়ই ফল বদলে দেয়; তাই fresh-environment পরীক্ষাই আসল প্রমাণ। (প্রকল্প — মাপকাঠি একটা সম্পূর্ণ, সৎ audit-নথি; কোনো একক সংখ্যা নয়।)

খ · নকশা ও পরিকল্পনা¶

সমাধান ৩ (★★) — একটা simulation-study নকশা¶

লক্ষ্য। একটা পরিসংখ্যানিক প্রশ্নকে একটা পূর্ণ, reproducible সিমুলেশন-পরীক্ষায় নামানো — Part VIII 8.2-এর ঠিক-অনুকরণে।

রোডম্যাপ (8.2-এর কাঠামো)।

(ক) প্রশ্ন, estimand ও factor। একটা সুনির্দিষ্ট প্রশ্ন বলুন (\"lasso কোন \((n,p,s)\)-এ সঠিক support পুনরুদ্ধার করে?\" বা \"এই দুই estimator-এর মধ্যে ছোট নমুনায় কোনটার MSE কম?\")। কোন factor পরিবর্তন করবেন তা একটা factorial grid হিসেবে লিখুন — যেমন \(n\in\{50,100,200\}\), \(p\in\{20,100,500\}\), sparsity \(s\in\{3,10\}\), noise-level কয়েকটা মান। এটাই আপনার পরীক্ষার \"নকশা-ম্যাট্রিক্স\"।
(খ) metric ও replication। প্রতিটি cell-এ কী মাপবেন — bias, variance, MSE, coverage, support-recovery-হার (সঠিক-চেনা অ-শূন্য coefficient-এর ভগ্নাংশ)? কতগুলো replication (যেমন \(B=1000\)–\(5000\), Monte-Carlo-ত্রুটি যথেষ্ট ছোট রাখতে)? প্রতিটি metric-এর একটা লক্ষ্য-নির্ভুলতা ঠিক করুন।
(গ) reproducibility-পরিকল্পনা। একটা master seed (np.random.default_rng(<seed>)), draw-এর একটা নির্দিষ্ট ক্রম (default_rng-এর ফল ক্রম-নির্ভর — 8.2 ও 8.3-এর মতো ক্রম নথিভুক্ত করুন), চিত্র (যেমন MSE-vs-\(p\), coverage-vs-\(n\)), ও canonical সংখ্যা-তালিকা। চালানোর আগে কী মাপবেন তা লিখে ফেলুন — একটা mini-preregistration (§৪.১), যাতে ফল-দেখে-গল্প এড়ানো যায়।

সতর্কতা। সবচেয়ে বড় ভুল — grid এত বড় করা যে চালানোই অসম্ভব, বা metric ফল-দেখে বদলে ফেলা। বরং একটা ছোট, কেন্দ্রীভূত grid ও আগে-নির্দিষ্ট metric দিয়ে শুরু করুন। 8.2-এর অধ্যায় ও তার solutions হুবহু এই শৃঙ্খলার নমুনা। (প্রকল্প — মাপকাঠি একটা সম্পূর্ণ, চালানো-যায়, reproducible নকশা-নথি।)

সমাধান ৪ (★★★) — একটা research proposal লেখা¶

লক্ষ্য। একটা সুনির্দিষ্ট, উত্তরযোগ্য গবেষণা-প্রশ্ন প্রণয়ন ও তার একটা যাচাই-পরিকল্পনা — একজন গবেষকের কেন্দ্রীয় দক্ষতা।

রোডম্যাপ (২–৩ পাতা)।

(ক) একটা সরু, উত্তরযোগ্য প্রশ্ন। §২-এর যে ক্ষেত্র আপনাকে সবচেয়ে টানে তা দিয়ে শুরু করুন, তারপর একটা সংকীর্ণ কোণ খুঁজুন — \"সব শেখা\" নয়, একটা নির্দিষ্ট ফাটল (\"এই setting-এ এই estimator-এর minimax-হার কী?\", \"এই fairness-metric দুটি কি এই শর্তে সঙ্গতিপূর্ণ?\")। একটা ভালো proposal-এর ৮০% কাজ = প্রশ্নটা যথেষ্ট সরু করা।
(খ) প্রেক্ষাপট ও গুরুত্ব। কেন এটি গুরুত্বপূর্ণ (এক অনুচ্ছেদ) ও কী কী ইতিমধ্যে জানা — §৩-এর একটা venue (Annals, JMLR, ইত্যাদি) থেকে ২–৩টি প্রাসঙ্গিক রেফারেন্স, এবং কোথায় ফাঁকটা। এটি দেখায় প্রশ্নটা নতুন ও ভিত্তিসম্পন্ন।
(গ) পদ্ধতি, যাচাই ও সীমাবদ্ধতা। একটা পথ প্রস্তাব করুন — তত্ত্ব (একটা theorem প্রমাণের চেষ্টা?), simulation (একটা 8.2-ধাঁচের study?), নাকি বাস্তব-ডেটা? — এবং কীভাবে যাচাই করবেন সফল হয়েছেন। সবশেষে সৎভাবে সম্ভাব্য বাধা ও সীমাবদ্ধতা (কী ভুল হতে পারে, কোন অনুমান দুর্বল)।

সতর্কতা। নবীন গবেষকের প্রধান ফাঁদ — প্রশ্ন অতি-বিস্তৃত রাখা (\"deep learning বুঝব\")। একটা proposal তত শক্তিশালী যত তার প্রশ্ন সংকীর্ণ ও পরীক্ষণযোগ্য। (প্রকল্প — মাপকাঠি একটা সুনির্দিষ্ট প্রশ্ন, ভিত্তিসম্পন্ন প্রেক্ষাপট, ও একটা বিশ্বাসযোগ্য যাচাই-পরিকল্পনাসহ ২–৩ পাতা।)

গ · প্রতিফলন¶

সমাধান ৫ (★) — নিজের যাত্রার মানচিত্র¶

লক্ষ্য। মানচিত্রটা (§৬) নিজের করে নেওয়া — কোন দরজা দিয়ে ঢুকবেন তা ঠিক করা।

রোডম্যাপ। এটি একটা ব্যক্তিগত প্রতিফলন, কোনো \"ভুল উত্তর\" নেই — কিন্তু একটা সৎ ও সুনির্দিষ্ট হিসাব সবচেয়ে মূল্যবান:

(ক) কঠিনতম ও সুন্দরতম। Part 0→VIII-এর মধ্যে কোনটা সবচেয়ে কঠিন লেগেছিল (অনেকের কাছে Part VII-এর measure theory) ও কোনটা সবচেয়ে সুন্দর/আলোকিত — এবং কেন। এই আত্ম-পর্যবেক্ষণ পরের-ধাপ বেছে নিতে সাহায্য করে (কী আপনাকে টানে বনাম কী আপনার শক্তি)।
(খ) দুটি আকর্ষণ। §২-এর আটটি ক্ষেত্রের মধ্যে কোন দুটি সবচেয়ে টানে, ও কোন অধ্যায় সেই বীজ বুনেছিল (যেমন 7.8 martingale → SDE-র প্রতি টান; 6.2 regularization → high-dimensional-এর প্রতি)। দুটিতে সীমাবদ্ধ রাখা ইচ্ছাকৃত — মনোযোগ সংকীর্ণ করা একজন গবেষকের প্রথম শৃঙ্খলা।
(গ) তিন-মাসের পরিকল্পনা। একটা সৎ, বাস্তবসম্মত পরের-ধাপ — পরের তিন মাসে একটা বই (§৩ থেকে, যেমন Hernán–Robins বা Øksendal) বা একটা প্রকল্প (অনুশীলন ১–৪)। একটাই, সম্পূর্ণভাবে — একসাথে দশটা নয়।

সতর্কতা। প্রতিফলনের ফাঁদ — অস্পষ্ট, সাধারণ কথা (\"আরও শিখব\")। বরং সুনির্দিষ্ট হোন: কোন বই, কোন অধ্যায় থেকে, কোন প্রকল্প, কোন সময়সীমায়। §৮-এর মহাসমাপ্তি এই প্রতিফলনের একটা সঙ্গী — পুরো চাপ ফিরে দেখে সামনের পা ঠিক করা।

সংক্ষিপ্ত সংযোগ-মানচিত্র (সব প্রকল্পের সাধারণ সুতো)¶

প্রতিটি প্রকল্পে reproducibility (§৪): git, স্থির seed, requirements.txt, চালানো-যায় কোড, canonical সংখ্যা — একজন গবেষকের অভ্যাস প্রথম প্রকল্প থেকেই।
টেমপ্লেট Part VIII-এর ভেতরেই: 8.1 (end-to-end বিশ্লেষণ) → অনুশীলন ১-এর বিশ্লেষণ-কাঠামো; 8.2 (simulation study) → অনুশীলন ৩-এর নকশা; 8.3 (paper reproduction) → অনুশীলন ১-এর যাচাই-চক্র।
কাঁচামাল §২ ও §৩: ক্ষেত্র বাছতে §২-এর মানচিত্র, রেফারেন্স ও পরের-ধাপ পড়তে §৩-এর তালিকা।
মূল মানসিকতা: প্রশ্ন সংকীর্ণ করা, ফলের কঠোর সমালোচক নিজে হওয়া, ও প্রতিটি দাবি একটা যাচাইযোগ্য সংখ্যা বা প্রমাণে নামানো — যা গোটা curriculum জুড়ে অনুশীলিত।