जशास तसे

दोन माणसे भागीदारीत काही व्यवहार करतात—-व्यापार म्हणा, हवे तर. जर दोघेही सचोटीने वागले, तर प्रत्येकाला तीन-तीन रुपये मिळतात—-एकूण सहा. जर एक जण सचोटीने वागला, पण दुसऱ्याने पहिल्याला फसवले, तर फसवणारा पाच रुपये कमावतो आणि फसणारा हात हलवत बसतो. नीटशा न जुळलेल्या भागीदारीत सचोटीच्या भागीपेक्षा कमी, म्हणजे पाचच रुपये एकूण कमाई होणे, हे व्यवहारात योग्यच आहे. आणि जर दोघांनीही एकमेकांना फसवायचा प्रयत्न केला तर दोघांनाही एकेकच रुपया मिळतो—-एकूण दोन रुपये. हेही आपण स्वतःच ‘उदाहरणे’ घडवून, तपासून मान्य करू शकतो. आता ‘मी’ आणि ‘तो’ अशा भागीचे ‘गणित’ आपण कोष्टकरूपात मांडू —-
‘तो’ सचोटीने ‘त्याने’ धोका
वागला तर दिला तर
रु. 0
1. ‘मी’ सचोटीने वागलो तर मला मिळतात
2. ‘मी’ धोका दिला तर मला मिळतात रु.3 रु.5 रु.
1.इथे एक लक्षात ठेवायला हवे की थेट नुकसान कधीच होत नाही, आणि एकाने कमाई केल्याने दुसरा खड्यात जात नाही. या बाबतीत हा व्यवहार बुद्धिबळाच्या खेळापेक्षा वेगळा आहे. तिथे एकाने जिंकायला दुसऱ्याने हरावेच लागते. पण हा व्यवहार प्रत्यक्ष व्यापार-व्यवहाराच्या जवळ आहे (आणि बुद्धिबळे प्रत्यक्षाशी फटकून आहेत!). आता आपण असे समजू की दोन्ही व्यक्ती विवेकी, हिशेबी, स्वतःचा स्वार्थ उत्तमपणे जाणणाऱ्या आहेत—-‘मी’ ही तसा आहे आणि ‘तो’ ही. आता मी विचार करतो की मी सचोटीने वागलो तर दोन गोष्टी घडू शकतात. तोही सचोटीने वागला तर मला तीन रुपये मिळतील आणि त्याने गद्दारी केली तर मी उपाशी राहीन. मी बदमाशी केली तर पुन्हा दोन शक्यता आहेत. त्यानेही धोका दिला तर मला एक रुपया मिळेल, आणि तो भोळसट असला तर मला पाच रुपये मिळतील. म्हणजे एकूण विचार करता मी बदमाशीने वागणेच फायद्याचे!
जर एकच व्यवहार करायचा असेल, तर माझे हे ‘तर्कशास्त्र’ योग्य आहे. पण जर आम्हा दोघांना वारंवार असे व्यवहार एकत्रपणे करायचे असले, तर काय करावे? मी नेहेमीच धोका देणार असे वाटून त्यानेही तसेच वागायचे ठरवले तर आम्ही दोघेही व्यापारामागे एक रुपया प्रत्येकी, अशा ‘दरिद्री’ मर्यादेत अडकून पडू. म्हणजे मला काहीतरी असे धोरण ठरवावे लागणार की त्याचा स्वभाव कसाही असला तरी माझे उत्पन्न सुधारायला हवे. मी त्याच्यापेक्षा जास्तच कमवायला हवे, अशी मला आस नाही. मी त्या एक रुपयाच्या अडथळ्यापेक्षा पुढे जायला हवे— -आणि यावर त्याच्या स्वभावाने फार परिणाम व्हायला नको.
ते धोरण कसेही असू शकेल. नेहेमी सचोटी, नेहेमी गद्दारी, एकाआड एक सचोटी–धोका, नाणे उडवून छापकाट्याप्रमाणे सचोटी बदमाशी . . . वाटेल ते धोरण ठरवायला मी मोकळा आहे. पण माझे असे धोरण इतर धोरणांसोबत वारंवार भागीदारी करत असताना माझी कमाई वाढवत नेणारे हवे. ‘गेम थिअरी’ (स्पर्धाशास्त्र?) या विषयाच्या तज्ञांमध्ये सर्वात यशस्वी धोरण कोणते असेल यावर बरीच वर्षे चर्चा झाली.
अखेर 1979 साली रॉबर्ट अॅक्झेलरॉड (Axelrod) या राज्यशास्त्राच्या प्राध्यापकाने एक स्पर्धा आयोजित केली. स्पर्धकांनी आपापली धोरणे स्पष्टपणे लिहून कळवायची, आणि अशा धोरणांना एका संगणकाच्या मदतीने एकमेकांशी ‘खेळवायचे’, असा हा प्रयोग होता. संगणकाच्या वापरामुळे दोन धोरणांना अनेकवार ‘भिडवून’ नफा-नुकसान तपासण्याची सोय होती.
अॅनातोल रॅपापोर्ट याने एक धोरण सुचवले —- ‘जशास तसे’. पहिली खेळी सचोटीने खेळायची आणि मग मात्र दुसरा जसे खेळेल तसे आपण पुढच्या खेळीला खेळायचे. एक उदाहरण पाहा —-
‘राऊंड’
माझे धोरण त्याचे धोरण माझे उत्पन्न त्याचे उत्पन्न
सचोटी सचोटी धोका सचोटी सचोटी धोका धोका सचोटी सचोटी सचोटी
सचोटी धोका सचोटी सचोटी धोका धोका सचोटी
N l iwwer I i wer i w
ur wwi l uw i urw
सचोटी
सचोटी धोका
8
एकूण

मी ‘जशास तसे’ खेळतो आहे, तर तो नाणे उडवून (म्हणजे स्वैरपणे) खेळतो आहे.
या उदाहरणातून अनेक गंमती दिसतात. एक म्हणजे त्याने काहीही केले तरी मी त्याच्यापेक्षा फारतर पाच रुपयेच मागे पडू शकतो. त्याला ‘आघाडी’ वाढवता येत नाही. दुसरे म्हणजे मी मागेच राहू शकतो, किंवा फारतर बरोबरी गाठू शकतो. मला त्याच्यापुढे कधीच जाता येत नाही. तिसरे म्हणजे ‘सरासरी’ उत्पन्नाची जवळपास अंतिम मर्यादा आहे ‘तीन रुपये प्रति व्यवहार’ ही. ती जवळपास कधीच मोडली जात नाही. म्हणजे दोघांचीही सचोटी, ही जवळपास ‘उच्चतम’ स्थिती आहे. (वरच्या वाक्यांमध्ये ‘जवळपास’ हा शब्द का वापरला ते पुढे पाहू.)
तर रॅपापोर्टचा ‘जशास तसे’ हा कार्यक्रम अॅक्झेलरॉडने लढवलेल्या पंधरा धोरणांमध्ये सर्वश्रेष्ठ ठरला. दुसऱ्या वेळी ही स्पर्धा घेतली तेव्हा साठेक स्पर्धक धोरणे सुचवली गेली —- पण ‘विजेता’ धोरण होते ‘जशास तसे’ हेच. कोणाला शंका येईल की उदाहरणात तर ‘जशास तसे’ प्रतिस्पर्ध्याच्या मागे आहे, मग ते जिंकले कसे? इथे हे लक्षात घ्यावे की प्रत्येक धोरणाला अनेकवार इतर सर्व धोरणांशी भिडवून मग निष्कर्ष काढला जात आहे. एकेक सुटी लढत, असा विचार नाही.
अॅक्झेलरॉड एवढ्यावर थांबला नाही. त्याने साठेक स्पर्धक धोरणांना लढवून त्यांच्यापैकी हरणारी धोरणे बाद केली, आणि जिंकणाऱ्या धोरणांचे ‘सदस्य’ वाढवले. आता आपण सुट्या धोरण वापरणाऱ्याचा विचार सोडून वेगळा विचार करतो आहोत. आता एकेक धोरण वापरणाऱ्यांची संख्या एकाहून जास्त आहे. यशस्वी धोरणे तगताहेत आणि वाढताहेत. अयशस्वी धोरणे घटताहेत आणि बाद होताहेत. थोडक्यात म्हणजे, कमावायची क्षमता हा गुण निवडणारी एक यंत्रणा आहे, जी धोरणांमध्ये उत्क्रांती घडवते आहे! आणि अशा उत्क्रांतीत एक अशी यंत्रणा तगताना दिसते आहे, जी ना ठामपणे सच्ची आहे, ना अट्टल बदमाष आहे. ती फक्त ‘पुढच्याच्या’ वागणुकीचे प्रतिबिंब दाखवणारी, दीर्घद्वेष आणि भोळसटपणामधून वाट चालणारी ‘जशास तसे’ यंत्रणा आहे.
इतर धोरणांचे काय झाले तेही ओझरते नोंदू या. चांगुलपणाची धोरणे एक-मेकांपुढे आली तर तगली. पण दीर्घद्वेषी धोरणे कुठेच ‘वर’ आली नाहीत. जर एखादे ‘चांगले’ धोरण एखाद्या ‘बदमाश’ धोरणापुढे उभे ठाकले, तर चांगले धोरण हरले—-अगदी ‘जशास तसे’चा मर्यादित चांगुलपणाही थेट धोकादायक धोरणांच्या पाच रुपयेच का होईना, मागे राहिला. पण जेमतेम पाच-सहा टक्के प्रजा जर ‘जशास तसे’ वागली, तर मात्र ती बदमाशांनाही हटवत प्रजेत आपले प्रमाण वाढवतच गेली! एकूण प्रजेत टिकून राहायला, तगायला, वाढायला, ‘जशास तसे’ हे धोरण काही प्रमाणात तरी मान्य असायला हवे. एखाददुसरा ‘जशास तसे’वाला बदमाशांच्या प्रजेत वाचणार नाही.
थेट बदमाश मात्र प्रजेत काही कमीत कमी प्रमाणात असले तरी तगून वाढू शकत नाहीत! म्हणजे दूरदृष्टीचा स्वार्थ साधायला ‘जशास तसे’ हेच उपयुक्त आहे. तिथे ना सचोटी एके सचोटी चालत, ना हरहमेशाची गद्दारी चालत. रॅपापोर्ट हा अमेरिकन सरकारच्या रशियाशी चाललेल्या शस्त्रस्पर्धा-शस्त्रसंधीच्या चक्रांचा अभ्यासक आणि स्वतः शांततावादी आहे. त्याला ‘जशास तसे’ सुचले यात आ चर्य नाही. पण मूठभर ‘जशास तसे’वादी इतर कोणत्याही ‘पंथा’पेक्षा टिकाऊ ठरतात, आणि या मूठभरांच्या वागण्यात नेहेमीच आपसातली सचोटी असते, हे लक्षणीय आहे.
या साऱ्याचे वर्णन कार्ल सिगमंडच्या ‘गेम्स ऑफ लाइफ’ (पेंग्विन 1993) या पुस्तकात आहे. सिगमंड म्हणतो, “इथे नीतिमत्तेचे विचार ‘झाडायचा’ मोह टाळणे अवघड आहे. सगळ्या मानवी व्यवहारांना या खेळात बसवता येत नाही, किंवा सुसंस्कृत समाजांमधल्या उच्चशासनाचे महत्त्वही नाकारता येत नाही. तसे करणे मूर्खपणाचे ठरेल. पण हे निबंध मान्य करूनही ‘जशास तसे’ सारखे राकट आणि सोपे धोरण लोकांमध्ये सहकार्य उत्पन्न करते, तर ‘चांगले वागा’चे ‘उच्चाधिकारी’ आदेश सहकार्याला मारक ठरताना दिसतात, हे सांगायलाच हवे.”
[वरील लेख हा कार्ल सिगमंडच्या पुस्तकातील “रेसिप्रोसिटी अँड द इव्होल्यूशन ऑफ कोऑपरेशन” या प्रकरणाच्या काही भागाचा सारांश आहे. उत्क्रांतीतून सहकार्य उद्भवते, हे अनेकांना शंकास्पद वाटते. त्या विषयावर काही लेख आ.सु.त आधीही ‘नैतिक प्राणी’ नावाने प्रकाशित झाले आहेत. हे त्याचे जरासे जास्त तांत्रिक रूप आहे.]