গেম থিওরি: বুদ্ধিদীপ্ত সিদ্ধান্ত গ্রহণের বিজ্ঞান

 অর্থনীতি 

গেম থিওরি: বুদ্ধিদীপ্ত সিদ্ধান্ত গ্রহণের বিজ্ঞান

Abid Hasan (Roar Bangla) 

‘অ্যা বিউটিফুল মাইন্ড’ সিনেমার কথা মনে আছে? যেখানে একজন তুখোড় মেধাবী গণিতবিদের সিজোফ্রেনিয়ার সাথে যুদ্ধ করে এগিয়ে চলার গল্প বলা হয়েছে। সিনেমাটি মুক্তির পরে জন ফোর্বস ন্যাশ নামক এই গণিতবিদ রাতারাতি সাধারণ মানুষের মধ্যে প্রচুর জনপ্রিয়তা লাভ করেন। মাত্র ২১ বছর বয়সে তিনি যে পিএইচডি থিসিসটি জমা দিয়েছিলেন, সেটির উপর ভিত্তি করে আবিষ্কৃত তত্ত্বের জন্যে পরবর্তীতে তিনি নোবেল পুরষ্কার লাভ করেছিলেন। থিসিসটির শিরোনাম ছিল ‘Non Cooperative Game’। অনেকে ভাবতে পারেন, গণিতের মাঝে ‘গেম’ কেন এলো? সত্যি বলতে, গেম থিওরি নামে একটি বিশাল তত্ত্ব রয়েছে, যেটি এখন আর শুধু গণিত কিংবা বিজ্ঞানের মাঝেই সীমাবদ্ধ নয়। অর্থনীতি, সামাজিক বিজ্ঞান, রাজনীতি, বাণিজ্য, আন্তর্জাতিক সম্পর্কসহ অনেক জায়গাতেই রয়েছে এর ব্যবহার।

প্রতিযোগিতাপূর্ণ সম্পর্কে লিপ্ত এরকম একাধিক এজেন্টের বুদ্ধিদীপ্ত আচরণ কেমন হওয়া উচিত, গেম থিওরি সে সম্পর্কে একটি তাত্ত্বিক ফ্রেমওয়ার্ক তৈরি করে দেয়। অনেক জায়গায় একে ‘কৌশলের বিজ্ঞান’ বলা হয়। প্রতিযোগিতায় লিপ্ত এজেন্টদেরকে এখানে ‘প্লেয়ার’ হিসেবে পর্যালোচনা করা হয়। প্লেয়ারদের মধ্যেকার এই প্রতিযোগিতাটিকে ‘গেম’ বলা হয়। প্লেয়ারদের কার্যক্রমের উপরে নির্ভর করে পুরো গেমের একটি ফলাফল পাওয়া যায়। গেম থিওরি ব্যবহার করে বাস্তব পৃথিবীতে এ ধরনের সম্পর্কগুলোর ভবিষ্যৎ অনুমান করা যায়। তবে, গেম থিওরি কাজ করবে শুধুমাত্র যখন মানুষ যুক্তিসঙ্গত সিদ্ধান্ত নেবে। 

গেম থিওরির প্রথম গাণিতিক ফর্মুলা দিয়েছিলেন জন ভন নিউম্যান এবং অস্কার মরগেনস্টার্ন। তাদের এই ফ্রেমওয়ার্কের বিভিন্ন সীমাবদ্ধতার কারণে প্রথম দিকে এই থিওরি শুধুমাত্র নির্দিষ্ট ও সীমিত শর্তের মধ্যে ব্যবহার করতে হতো। তবে, গত সাত দশক ধরে এই অবস্থাটির পরিবর্তন হয়েছে। নিউম্যান ও মরগেনস্টার্নের পরে এই থিওরিতে জন ন্যাশই প্রথম কোনো তাৎপর্যপূর্ণ অবদান রাখেন। ফলে, গেম থিওরির একটি জেনারেলাইজড ফ্রেমওয়ার্ক তৈরি হয়েছে যেটা অর্থনীতি, সামাজিক বিজ্ঞান, বাণিজ্য, আন্তর্জাতিক সম্পর্ক, কম্পিউটার বিজ্ঞান, জীববিজ্ঞানসহ আরো অনেক ক্ষেত্রেই ব্যবহার করা যায়। সত্তরের দশকের পর থেকেই যেকোনো বিশ্লেষকের জন্যে গেম থিওরি সবচেয়ে গুরুত্বপূর্ণ টুল হয়ে দাঁড়িয়েছে, যেখানে তাকে বুদ্ধিমান অন্য প্রতিপক্ষের সিদ্ধান্তের মুখোমুখি হতে হয়।

এই লেখায় আমরা গেম থিওরির তাত্ত্বিক অংশটি আলোচনা করব না। বরং, বিভিন্নরকম উদাহরণ ব্যবহার করে যুক্তিসঙ্গত সিদ্ধান্ত নেওয়ার প্যাটার্ন বুঝার চেষ্টা করব। এরকম একটি আলোচনার জায়গা হচ্ছে বাণিজ্য।

তীব্র প্রতিযোগিতায় লিপ্ত রয়েছে এমন অনেকগুলো ব্যবসা প্রতিষ্ঠানের উদাহরণ দেওয়া যাবে। এ রকম একটি উদাহরণ হচ্ছে পেপসি ও কোকাকোলার প্রতিদ্বন্দ্বিতা। মনে করা যাক, কোকাকোলা সিদ্ধান্ত নিল তাদের পণ্যের মূল্য কমিয়ে দেবে। ফলে, পেপসির তুলনায় তাদের বিক্রি বেশি হবে। এভাবে, তারা বেশি মুনাফা অর্জন করতে পারবে।

অন্যদিকে, পেপসি নিশ্চয়ই চাইবে না ক্রেতা হারাতে। তাই তারাও মূল্য কমিয়ে দিতে বাধ্য হবে। এভাবে তারা একটি সমতার অবস্থানে আসবে যেখানে দুইটি পণ্যেরই মূল্য সমান। যেহেতু মূল্য কমানোর ফলে আদতে কোকাকোলা বেশি ক্রেতা আকর্ষণ করতে পারছে না, কোকাকোলা তাই মূল্য কমানোর কথা ভাববে না। এভাবে, কোম্পানিগুলোর মধ্যে একটি অলিখিত চুক্তি থাকে, তারা মূল্য বেশি রাখবে এবং তাতে লাভও বেশি হবে।

গেম থিওরি ব্যবহার করে আরেকটি প্রশ্নের উত্তর দেওয়া যায়। সেটি হচ্ছে, বেশিরভাগ দোকান কেন গুচ্ছাকারে থাকে। অনেক সময়েই কয়েক মাইল জুড়ে কোনো রেস্টুরেন্ট পাওয়া যায় না। কিন্তু দেখা যায়, এক জায়গায় অনেক কোম্পানির রেস্টুরেন্ট একত্রিত হয়ে আছে। মনে করা যাক, আপনি সিদ্ধান্ত নিলেন সমুদ্র সৈকতে আইসক্রিম বিক্রি করবেন। সৈকতটি এক মাইল লম্বা। তাহলে কোন জায়গাটি আপনার দোকানের জন্যে বেছে নিলে সবচেয়ে বেশি লাভ করতে পারবেন? অবশ্যই মাঝখানে, তাই তো? ধরা যাক, আপনি সেখানেই দোকান বসালেন। 


জন ফোর্বস ন্যাশ; Image Source: Peter Badge

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু আরেকটি আইসক্রিম দোকান দিয়েছে। আপনারা সিদ্ধান্ত নিলেন যে, সৈকত নিজেদের মধ্যে ভাগাভাগি করে নেবেন। তাই, আপনার দোকানটি সৈকতের মাঝ থেকে এক চতুর্থাংশ ডানে সরালেন। আর আপনার বন্ধুটির দোকান নিয়ে গেল মাঝ থেকে এক চতুর্থাংশ বামে। এর ফলে, সৈকতের ডানে যারা ঘুরতে গেল, তারা সবাই আপনার থেকেই আইসক্রিম কিনল। আর বামপাশে যারা এসেছিল, তারা আইসক্রিম কিনল আপনার বন্ধুর দোকান থেকে। ক্রেতাদের জন্যে এটা সবচেয়ে ভালো অবস্থান হলো।

পরদিন সৈকতে গিয়ে দেখলেন, আপনার বন্ধু বেশি ক্রেতা পাওয়ার জন্যে তার দোকানটি মাঝখানে নিয়ে এসেছে। অর্থাৎ, বামের সব ক্রেতা তো সে পাচ্ছেই, আবার আপনার ক্রেতার একটা অংশও তার দোকানে যাচ্ছে। আইসক্রিম যুদ্ধে জেতার জন্যে পরদিন আপনি আপনার বন্ধুর অঞ্চলে গিয়ে দোকান বসালেন। আপনার বন্ধুও কম যা য়না, সে আপনার দোকান থেকে একশ মিটার ডানে দোকান বসাল। ফলে, ডানের বড় অঞ্চলের ক্রেতা তার ভাগে চলে এলো। আপনি সে ভাগ পাওয়ার জন্যে তার একশ মিটার ডানে বসালেন। সে আবারো তার দোকান সরালো, আপনি আপনার দোকান সরালেন। এভাবে, সারাদিন ধরে আপনি আর আপনার বন্ধু দোকান সরানোর যুদ্ধে লিপ্ত হলেন। শেষে, দুজনই সৈকতের মাঝে গিয়ে স্থির হলেন, যেখানে দুজনই অর্ধেক ক্রেতা পাচ্ছিলেন।

আপনারা এমন অবস্থানে এলেন, যেটাকে বলা হয় ‘ন্যাশ ইকুইলিব্রিয়াম’। এই অবস্থান থেকে সরে কেউই নিজেদের উন্নতি করতে পারবেন না। আপনি দোকান সরালে আপনার বন্ধু বেশি ক্রেতা পাবে আবার আপনার বন্ধু তার দোকান সরালে আপনি বেশি ক্রেতা পাবেন। আপনাদের প্রথম যে কৌশলটি ছিল, সেটি টেকেনি কারণ সেটি ন্যাশ ইকুইলিব্রিয়ামের সংজ্ঞায়িত কোনো সাম্যাবস্থায় ছিল না। তাই, আপনার বন্ধু দোকান সরিয়ে নিজের অবস্থানের উন্নতি করতে পেরেছিল। সত্যিকার পৃথিবীতে এ কারণেই কোম্পানিগুলো তাদের দোকান পাশাপাশি রাখে। কারণ ন্যাশ ইকুইলিব্রিয়াম অর্জন না করতে পারলে তারা প্রতিপক্ষের তুমুল প্রতিযোগিতার শিকার হবে। আর সেখানে ক্রেতারা সব জায়গা থেকেই হাজির হতে পারে।


গাণিতিক ও যৌক্তিকভাবে গেম থিওরির ফ্রেমওয়ার্ক ১৯৪৪ সালে এলেও, অনেক প্রাচীন সময় থেকেই এরকম যুক্তিসঙ্গত চিন্তাভাবনার উদাহরণ পাওয়া যায়। সক্রেটিস ব্যাটল অব ডেলিয়ামের এ রকম একটি গল্প বলেছেন: একজন সৈন্য তার কমরেডের সাথে সম্মুখ শিবিরে শত্রুর আক্রমণ প্রতিরোধের জন্যে অপেক্ষা করছে। যদি তাদের প্রতিরোধ সফল হয়, তাহলে তার ব্যক্তিগত অবদান এক্ষেত্রে অপরিহার্য নয়। সে যদি যুদ্ধে অবস্থান করে, তাহলে তার আহত বা নিহত হওয়ার একটি ঝুঁকি থেকে যায়। যেহেতু তার অবদান অপরিহার্য নয়, তাই এই ঝুঁকি নেওয়ার কোনো যৌক্তিকতা নেই। অন্যদিকে, শত্রুপক্ষ যদি যুদ্ধে জিতে যায়, তার মৃত্যুঝুঁকি তখন আরো বেশি। আর এক্ষেত্রে এই ঝুঁকিটি একদমই অর্থহীন। কারণ, সে যুদ্ধে অংশগ্রহণ করলেও তাদের প্রতিরক্ষা ভেঙে পড়বে। ফলে, যুদ্ধের ফলাফল যাই হোক না কেন যুদ্ধক্ষেত্র থেকে পালিয়ে যাওয়াই সৈন্যটির জন্যে সবচেয়ে ভালো সিদ্ধান্ত।

এখানে সৈন্যদলের সবাই একইরকম পরিস্থিতিতে রয়েছে। তাই, তারা সবাই যদি একইরকম চিন্তা করে, তাহলে অবশ্যই সেই পরিস্থিতিরই উদ্ভব হবে যেখানে যুদ্ধটি তারা হেরে গেছে। অর্থাৎ, তারা কেউই যুদ্ধে অংশগ্রহণ করতে চাইবে না। ব্যক্তিগতভাবে সবার আলাদা আলাদা সিদ্ধান্ত এখানে এমন একটি পরিস্থিতি তৈরি করেছে, যেটা সবার জন্যেই অনাকাঙ্ক্ষিত ছিল। প্রশ্ন হচ্ছে, বাস্তবে যুদ্ধক্ষেত্রে কি সৈন্যরা এভাবে চিন্তা করে? বরং সেখানে উল্টোটা দেখা যায়। যে সৈন্যের মাঝে যুদ্ধ হেরে যাওয়ার ভয় যতো বেশি, তাকে তত বেশি উদ্দীপ্ত দেখা যায়। অন্যদিকে, যে সৈন্যদলের বিশ্বাস বেশি থাকে যে, তারা জিতবে, তত বেশি তাদেরকে ব্যক্তিগত অবদানের ক্ষেত্রে অমনোযোগী হতে দেখা যায়।

গেম থিওরি আসার বহু আগেই এ ধরনের পরিস্থিতি এড়ানোর জন্যে সামরিক নেতাদের বিভিন্ন পদক্ষেপ নিতে দেখা গেছে। এ রকম একজন সামরিক নেতা ছিলেন স্প্যানিশ বীর হারন্যান করটেজ। মেক্সিকোতে তিনি যখন ছোট একটি বাহিনী নিয়ে গিয়েছিলেন, তার সৈন্যদের নিজেদের সামর্থ্যে সন্দেহ করার বিশাল একটি কারণ ছিল। কারণ সেখানে অ্যাজটেক বাহিনীর সংখ্যা ছিল বিশাল। তার সৈন্যরা ভয়ার্ত অবস্থায় পালিয়ে যেতে পারে, এই ধারণা করটেজের চিন্তায় ছিল। তাই তিনি নিজেদের সমস্ত জাহাজ পুড়িয়ে দিয়েছিলেন। তাতে নিজের বাহিনীর পালানোর আর কোনো উপায় ছিল না। পালিয়ে যাওয়া যখন অসম্ভব হয়ে উঠল, তখন স্প্যানিশ সৈন্যদের বেঁচে থাকার জন্যে প্রাণপণে যুদ্ধ করাই একমাত্র উপায় হয়ে ওঠে। 

করটেজ তার জাহাজগুলো এমনভাবে পুড়িয়েছিল যেন তা সবাই দেখতে পায়। এই কাজটি শত্রুদের অর্থাৎ অ্যাজটেকদের মধ্যে একটি নিরুৎসাহ তৈরি করে। তারা ভেবেছিল, কোনো কম্যান্ডার যদি তার পালানোর একমাত্র রাস্তা নষ্ট করে ফেলার সাহস রাখে, তার পেছনে অবশ্যই কোনো কারণ রয়েছে। যে কারণটা তার ছোট বাহিনী হওয়া সত্ত্বেও এতবড় আত্মবিশ্বাস জুগিয়েছে। যে কম্যান্ডারের না হারার জন্যে এরকম কারণ রয়েছে তার বিপক্ষে যুদ্ধ করা অ্যাজটেক সৈন্যরা সমীচীন মনে করেনি। ফলে, করটেজ সহজ একটি জয় পেয়েছিলেন। 

এরকম যুক্তি প্রয়োগের আরেকটি ক্ল্যাসিক উৎস হলো শেকসপিয়ারের হেনরি ফাইভ। এজিনকোর্টের যুদ্ধের সময়ে হেনরি সিদ্ধান্ত নিয়েছিল, শত্রুদের সামনে সে তার ফরাসি কয়েদীদের হত্যা করবে। অবশ্য হেনরির যুক্তি ছিল, বন্দিরা নিজেদের মুক্ত করে হেনরিকে ঝুঁকির মধ্যে ফেলে দেবে। কিন্তু গেম থিওরির আলোকে ব্যাপারটিকে ভিন্নভাবে ব্যাখ্যা করা যায়। হেনরির সৈন্যরা দেখেছে যে, বন্দিরা নিহত হয়েছে। তারা এটাও জানে যে, শত্রুপক্ষও এই হত্যাগুলো প্রত্যক্ষ করেছে। তাই, হেনরির সৈন্যরা জানে, তারা যদি যুদ্ধে হেরে শত্রুপক্ষের জেলে বন্দি হয়, শত্রুরা এই হত্যার প্রতিশোধ নেবে। অর্থাৎ, তাদের পরিণতি ভয়াবহ হবে। করটেজের সৈন্যদের মতোই, কিন্তু রূপকভাবে তাদের জাহাজগুলো এক্ষেত্রে পোড়ানো হয়ে গেছে। অর্থাৎ, পালানোর আর রাস্তা নেই। 

থমাস হবসের বই লেভিয়্যাথানকে আধুনিক রাজনৈতিক দর্শনের একটি ভিত্তি ধরা হয়। এই বইয়ে নাগরিকের উপরে রাষ্ট্রের আইন প্রয়োগের ন্যায্যতার পক্ষে যুক্তি দেখানো হয়। এখানেও, গেম থিওরির কৌশল দেখা যায়। হবস দাবি করেছেন, সব মানুষের জন্যে সবচেয়ে ভালো অবস্থা হচ্ছে যেখানে তারা যে যার ইচ্ছামতো যেকোনো কিছু করতে পারে। তবে, অনেক সময়েই একজনের ইচ্ছা প্রয়োগ করতে আরেকজনের সহযোগিতার প্রয়োজন হয়। এসবক্ষেত্রে অনেকেরই অনৈতিক অবস্থান নেওয়ার গাঢ় সম্ভাবনা থাকে। উদাহরণ দেওয়া যাক।

তাহমিদের একটি বাড়ি বানানো দরকার এবং অয়ন তাকে সাহায্য করতে সম্মত হয়েছে। তবে, অয়নের শর্ত ছিল, তাহমিদের বাড়ি বানানো হয়ে গেলে তাকে অয়নের বাড়ি বানানোর জন্যে সাহায্য করতে হবে। বাড়ি সম্পূর্ণ হওয়ার পরে তাহমিদ ভাবল, সে যদি চুক্তি অস্বীকার করে, তাহলে তার বাড়তি কাজ করতে হচ্ছে না। অর্থাৎ, চুক্তিরক্ষা করতে গেলে তাকে অতিরিক্ত একটি মূল্য দিতে হচ্ছে। চুক্তি ভঙ্গ করলে সেই দায়টি আর থাকছে না। তাই সে চুক্তিটি অস্বীকার করলো।

অয়নের কোনো বাড়ি নেই এবং তাহমিদ তাকে সাহায্যও করবে না। গেম থিওরিতে সব এজেন্টকেই বুদ্ধিমান হিসেবে চিন্তা করা হয়। এক্ষেত্রে, অয়নের ভালো সম্ভাবনা রয়েছে, সে তাহমিদের বাড়ি ডাকাতি করে দখল করার। তাহমিদ এই ভয়টি আগে থেকেই পেয়েছিল। তাই সে পাহারাদার নিয়োগ দিয়েছে। এতে অনির্দিষ্টকাল ধরে তার অর্থ খরচ হচ্ছে। এই খরচ থেকে বাঁচতে তাহমিদ প্রথমেই অয়নকে হত্যার পরিকল্পনা করতে পারে। অয়নও যেহেতু সমান বুদ্ধিমান, সে চাইবে হত্যাটি সে আগে করতে। এভাবে একজন আরেকজনের পরিকল্পনা আগেই জেনে যাওয়ার একটি চেইন চলতে থাকবে। অনেকগুলো এজেন্ট একে অপরের সাথে যদি এরকম একটি বিপজ্জনক সম্পর্ক তৈরি করে সমাজে একটি চরম বিশৃঙ্খলা তৈরি হবে। হবস এই পরিস্থিতির নাম দিয়েছেন, ‘war of all against all’। এরকম পরিস্থিতিতে মানবজীবন হয়ে উঠবে দুর্বিষহ।

হবসের প্রস্তাবিত সমাধান ছিল একজন শাসক। মানুষ এমন একজন এজেন্টকে নিয়োগ দেবে, যে চুক্তিভঙ্গকারীকে প্রথমেই শাস্তি প্রদান করবে। যতক্ষণ এই শাস্তির ভূমিকা কাজ করবে, ততক্ষণই চুক্তি ভাঙার মূল্য চুক্তি রক্ষার তুলনায় বেশি হবে। তাই যেকোনো যৌক্তিক ও বুদ্ধিমান মানুষই তখন চুক্তি রক্ষা করতে চাইবে। এই যুক্তিটি অনেকটা পলাতক সৈন্যদের মৃত্যুদণ্ড দেওয়ার মতো। সবাই যদি এভাবে চুক্তি রক্ষা করে চলে, সেটাই তখন সমাজের সাধারণ অবস্থা হয়ে উঠবে।

গেম থিওরি আরো অনেক প্রশ্নের উত্তর দেয়। কার্বন ডাইঅক্সাইড অপসারণ করতে পৃথিবীব্যাপী রাষ্ট্রপ্রধানরা এখনো কাজ করছেন না কেন? সমগ্র পৃথিবীর স্বার্থেই জলবায়ু পরিবর্তন বন্ধের জন্যে কাজ করা উচিত। কিন্তু শিল্পজাত উৎপাদনের জন্যে সব দেশেরই কার্বন ডাইঅক্সাইডের জন্য ব্যক্তিগত স্বার্থ রয়েছে, এ কারণেই এই ব্যাপারে পৃথিবীব্যাপী এখনো সচেতনতা দেখা যাচ্ছে না। যারা কার্বন অপসারণে কাজ করবে, তারাই অন্য দেশের তুলনায় প্রতিযোগিতায় পিছিয়ে পড়বে। 

ন্যাশ ইকুইলিব্রিয়ামের ধারণাটি আমাদেরকে বুঝতে সাহায্য করে, আকাঙ্ক্ষিত ফলাফলে পৌঁছাতে হলে কেন সমাজকে আমাদের জীবনযাপনের নির্দিষ্ট জায়গাগুলোতে হস্তক্ষেপ করতে হয়। আইনগত বাধ্যবাধকতা থাকলে ব্যক্তিগত স্বার্থের বাইরে মানুষকে সিদ্ধান্ত নিতে বাধ্য করা যায়। জলবায়ু পরিবর্তনও এরকমই একটি সমস্যা যেখানে ব্যক্তিগত স্বার্থের বাইরে সিদ্ধান্ত নিতে সবাইকে বাধ্য করা প্রয়োজন। তবে, সামগ্রিক পরিসরে এমন একটি অবস্থানে পৌঁছানো কঠিন, যেখানে সবাই একে অপরের সাথে প্রতিযোগিতায় লিপ্ত রয়েছে। কারণ, কার্বন অপসারণ কমানোর মানে হচ্ছে, অর্থনৈতিক মুনাফা কমিয়ে ফেলা। কিন্তু, আত্মকেন্দ্রিক চিন্তার মাধ্যমে নেওয়া সবচেয়ে ভালো সিদ্ধান্তটিও সামগ্রিকভাবে আমাদেরকে একটি অনাকাঙ্ক্ষিত পরিস্থিতিতে ফেলতে পারে। এই ব্যাপারটি আমাদের সবার উপলদ্ধি করা উচিত।

No comments

Powered by Blogger.