استراتيجيات نظرية اللعبة المتقدمة لصنع القرار

بحوث العمليات The Operation Research نظرية المباراة Game Theory (شهر نوفمبر 2024)

بحوث العمليات The Operation Research نظرية المباراة Game Theory (شهر نوفمبر 2024)
استراتيجيات نظرية اللعبة المتقدمة لصنع القرار

جدول المحتويات:

Anonim

نظرية الألعاب، دراسة صنع القرار الاستراتيجي، تجمع بين التخصصات المختلفة مثل الرياضيات وعلم النفس والفلسفة. تم اختراع نظرية اللعبة من قبل جون فون نيومان وأوسكار مورجنسترن في عام 1944، وقد قطع شوطا طويلا منذ ذلك الحين. ويمكن قياس أهمية نظرية اللعبة للتحليل الحديث وصنع القرار من خلال حقيقة أنه منذ عام 1970، تم منح ما يصل إلى 12 من كبار الاقتصاديين والعلماء جائزة نوبل في العلوم الاقتصادية لمساهماتهم في نظرية اللعبة.

يتم تطبيق نظرية اللعبة في عدد من المجالات بما في ذلك الأعمال التجارية والمالية والاقتصاد والعلوم السياسية وعلم النفس. فهم استراتيجيات نظرية اللعبة - كل من شعبية وبعض من الطبقات نسبيا أقل شهرة - مهم لتعزيز التفكير المنطقي ومهارات صنع القرار في عالم معقد.

معضلة السجين - باختصار

واحدة من استراتيجيات نظرية اللعبة الأكثر شعبية والأساسية هي معضلة السجين. ويستكشف هذا المفهوم استراتيجية صنع القرار التي يتخذها شخصان، ينتهيان في نهاية المطاف بنتائجهم الأسوأ مما لو تعاونا مع بعضهما البعض في المقام الأول.

في معضلة السجين، يتم القبض على اثنين من المشتبه بهم الذين تم القبض عليهم لارتكاب جريمة في غرف منفصلة ولا يمكن التواصل مع بعضهم البعض. ويعلم المدعي العام كل واحد منهم على حدة أنه إذا كان (استدعى له المشتبه به 1) يعترف بشهادته ويثبت ضده، فإنه يستطيع أن يرحل، ولكن إذا لم يتعاون ويشتبه 2، فإن المشتبه به 1 سيحكم عليه بالسجن ثلاث سنوات. وإذا اعترف كلاهما، فسوف يحكم عليهما بالسجن لمدة سنتين، وإذا لم يعترف أي منهما، فسيحكم عليهما بالسجن لمدة سنة واحدة.

في حين أن التعاون هو أفضل استراتيجية للمشتبه فيهما، عندما تواجه هذه المعضلة، تظهر الأبحاث أن معظم الناس العقلانيين يفضلون الاعتراف والشهادة ضد الشخص الآخر بدلا من الصمت والاستفادة من الفرصة التي يعترف بها الطرف الآخر.

استراتيجية نظرية الألعاب

معضلة السجين تضع الأساس لاستراتيجيات نظرية اللعبة المتقدمة التي تشمل منها الشعبية:

مطابقة بينيس : هذه هي لعبة صفر مجموع التي تنطوي على لاعبين اثنين (ندعو لهم لاعب A و لاعب B) وضع في وقت واحد فلسا واحدا على الطاولة، مع العائد اعتمادا على ما إذا كانت البنسات المباراة. إذا كان كل من البنسات هي رؤساء أو ذيول، لاعب A يفوز ويحافظ على لاعب قرش. إذا لم تتطابق، لاعب B يفوز ويحافظ على لاعب ق.

الجمود : هذا سيناريو اجتماعي مثل معضلة السجين في أن اثنين من اللاعبين يمكن أن تتعاون أو عيب (ط.ه. لا تتعاون). في حالة الجمود، إذا كان لاعب A و لاعب B على حد سواء التعاون، فإن كل الحصول على مكافأة من 1، وإذا كان كلاهما عيب، فإن كل الحصول على مكافأة من 2. ولكن إذا كان لاعب A يتعاون وعيوب لاعب B، ثم يحصل على مكافأة 0 و B يحصل على مردود 3. في الرسم البياني للمردود أدناه، يمثل الرقم الأول في الخلايا (أ) من خلال (د) مكافأة اللاعب A، والرقم الثاني هو لاعب B:

مصفوفة عطل الجمود < لاعب ب

التعاون

عيب

لاعب

التعاون

(a) 1، 1

(b) 0، 3

ديفيكت

، 0

(د) 2، 2

يختلف الجمود عن معضلة السجين في أن العمل من أكبر المنفعة المتبادلة (أي كل من عيب) هو أيضا الاستراتيجية المهيمنة. يتم تعريف استراتيجية مهيمنة للاعب باعتبارها واحدة التي تنتج أعلى مكافأة من أي استراتيجية المتاحة، بغض النظر عن الاستراتيجيات التي يستخدمها لاعبين آخرين.

ومن الأمثلة الشائعة على الجمود هو وجود قوتين نوويتين تحاولان التوصل إلى اتفاق للقضاء على ترساناتهما من القنابل النووية. وفي هذه الحالة، ينطوي التعاون على الالتزام بالاتفاق، في حين أن الانشقاق يعني التنازل سرا عن الاتفاق والاحتفاظ بالترسانة النووية. ومن المؤسف أن أفضل نتيجة لأي من الأمة هي أن تتراجع عن الاتفاق وأن تحتفظ بالخيار النووي بينما تلغي الدولة الأخرى ترسانتها، لأن ذلك سيعطي الأول ميزة خفية هائلة على هذه الأخيرة إذا اندلعت الحرب بين البلدين. الخيار الثاني الأفضل هو أن يخل أو لا يتعاون، لأن هذا يحتفظ بوضعهم كقوى نووية.

كورنوت كومبيتيتيون

: هذا النموذج هو أيضا مفهوما من الناحية النظرية لمعضلة السجين، ويدعى عالم الرياضيات الفرنسي أوغستين كورنوت، الذي قدمه في عام 1838. التطبيق الأكثر شيوعا لنموذج كورنوت هو وصف احتكار الثنائي أو اثنين رئيسي المنتجين في السوق. على سبيل المثال، افترض أن شركتين A و B تنتجان منتجا متطابقا ويمكنهما إنتاج كميات عالية أو منخفضة. وإذا تعاون كلاهما ووافقا على الإنتاج بمستويات منخفضة، فإن العرض المحدود سيترجم إلى ارتفاع سعر المنتج في السوق وتحقيق أرباح كبيرة لكلتا الشركتين. من ناحية أخرى، إذا عيبت ونتجت على مستويات عالية، فإن السوق سوف تغمر وتؤدي إلى انخفاض سعر المنتج وبالتالي انخفاض الأرباح. ولكن إذا تعاون المرء (i، e) على مستويات منخفضة)، والعيوب الأخرى (i تنتج بشكل خفي على مستويات عالية)، ثم الأول يكسر حتى في حين أن هذا الأخير يكسب ربح أعلى مما لو كان كلاهما تتعاون.

تظهر مصفوفة العائد للشركات A و B (الأرقام تمثل الربح بملايين الدولارات). وبالتالي، إذا كان A يتعاون وينتج عند مستويات منخفضة بينما B العيوب وينتج على مستويات عالية، والمكافأة كما هو مبين في الخلية (ب) - التعادل للشركة A و 7 ملايين $ في الأرباح للشركة B.

كورنوت بايوف مصفوفة

شركة B

شركة B

شركة

عيب

شركة

تعاون

(a) 4، 4

(b) 0، 7

) 7، 0

(د) 2، 2

التنسيق

: بالتنسيق، يحصل اللاعبون على مكاسب أعلى عندما يختارون نفس مسار العمل. على سبيل المثال، النظر في اثنين من عمالقة التكنولوجيا الذين يقررون بين إدخال تكنولوجيا جديدة جذرية في رقائق الذاكرة التي يمكن أن تكسب لهم مئات الملايين في الأرباح، أو نسخة منقحة من التكنولوجيا القديمة التي من شأنها كسب لهم أقل من ذلك بكثير. إذا قررت شركة واحدة فقط المضي قدما في التكنولوجيا الجديدة، فإن اعتماد السوق من قبل المستهلكين سيكون أقل بكثير، ونتيجة لذلك، سوف تكسب أقل مما لو قررت كلتا الشركتين في نفس مسار العمل. وتظهر مصفوفة العائد أدناه (تمثل الأرقام الأرباح بملايين الدولارات).

وهكذا، إذا قررت الشركتان إدخال التكنولوجيا الجديدة، فإنهما سيكسبان 600 مليون دولار لكل منهما، في حين أن إدخال نسخة منقحة من التكنولوجيا القديمة سيكسبها 300 مليون دولار لكل منهما، كما هو مبين في الخلية (د). ولكن إذا قررت الشركة (أ) وحدها إدخال التكنولوجيا الجديدة، فإنها لن تكسب سوى 150 مليون دولار، على الرغم من أن الشركة B ستكسب $ 0 (ويفترض أن المستهلكين قد لا يكونون على استعداد لدفع ثمن التكنولوجيا التي عفا عليها الزمن الآن). وفي هذه الحالة، من المنطقي أن تعمل الشركتان معا بدلا من العمل بمفردهما.

الشركة المصنعة

التكنولوجيا الجديدة

التكنولوجيا الجديدة

التكنولوجيا الجديدة

شركة

التكنولوجيا الجديدة

(أ) 600، 600

(ب) 0، 150 < التكنولوجيا القديمة

(c) 150، 0

(d) 300، 300

حريش لعبة

: هذه هي لعبة واسعة النطاق فيها لاعبين اثنين بالتناوب الحصول على فرصة لاتخاذ أكبر حصة من ببطء زيادة المال خبأ. لعبة حريش هو متتابعة، لأن اللاعبين جعل تحركاتهم واحدا تلو الآخر بدلا من في وقت واحد. كل لاعب يعرف أيضا الاستراتيجيات التي اختارها اللاعبون الذين لعبوا من قبلهم. وتختتم اللعبة في أقرب وقت لاعب يأخذ خبأ، مع أن لاعب الحصول على الجزء الأكبر واللاعب الآخر الحصول على الجزء الأصغر.

على سبيل المثال، إذا كان لاعب A ومشغل B يلعبون لعبة سنتيبيد، افترض أن اللاعب A يذهب أولا ويجب أن يقرر ما إذا كان يجب أن "تأخذ" أو "تمرير" الخبأ، الذي يصل حاليا إلى $ 2. إذا كان يأخذ، ثم A و B الحصول على 1 $ لكل منهما، ولكن إذا كان يمر، والقرار "خذ أو تمرير" الآن يجب أن يكون من قبل لاعب B. إذا B يأخذ، وقالت انها تحصل على 3 $ (أي خبأ السابق من $ 2 + $ 1 ) و A يحصل على $ 0. ولكن إذا ب يمر، والآن يحصل على اتخاذ قرار ما إذا كان اتخاذ أو تمرير، وهلم جرا. إذا كان كل من اللاعبين دائما اختيار لتمرير، فإن كل يحصل على مكافأة من 100 $ في نهاية المباراة. النقطة من اللعبة هو أنه إذا A و B على حد سواء التعاون و "تمرير" إلى نهاية اللعبة، ويحصلون على الحد الأقصى للمردود من 100 $ لكل منهما. ولكن إذا كانوا لا يثقون اللاعب الآخر ونتوقع منهم أن "تأخذ" في أول فرصة، ثم التوازن ناش يتنبأ أن اللاعبين سوف تأخذ أدنى دعوى ممكنة (1 $ في هذه الحالة). وقد أظهرت الدراسات التجريبية، مع ذلك، أن هذا السلوك "العقلاني" (كما تنبأت نظرية اللعبة) نادرا ما تظهر في الحياة الحقيقية. هذا ليس مفاجئا حدسي نظرا لحجم صغير من العائد الأولي فيما يتعلق النهائي. كما تم عرض سلوك مماثل من قبل المواضيع التجريبية في معضلة المسافر.

معضلة المسافر

: هذه لعبة غير صفرية حيث يحاول كل من اللاعبين تحقيق أقصى قدر من العائد الخاص دون النظر إلى الآخر. وقد وضعتها شركة كوشيك باسو الاقتصادية في عام 1994، في معضلة المسافر، توافق شركة طيران على دفع تعويضين للمسافرين عن الأضرار التي لحقت بأصناف متطابقة. ومع ذلك، يطلب من المسافرين بشكل منفصل تقدير قيمة البند، مع حد أدنى قدره دولارين و 100 دولار كحد أقصى. إذا كان كل من كتابة نفس القيمة، فإن شركة الطيران تسدد كل منهم هذا المبلغ. ولكن إذا كانت القيم تختلف، فإن شركة الطيران تدفع لهم قيمة أقل، مع مكافأة من 2 $ للمسافر الذي كتب أسفل هذه القيمة أقل وعقوبة 2 دولار للمسافر الذي كتب أسفل القيمة الأعلى.

مستوى توازن ناش، استنادا إلى تحريض الخلف، هو $ 2 في هذا السيناريو. ولكن كما هو الحال في لعبة حريش، التجارب المختبرية تثبت باستمرار أن معظم المشاركين - ساذجة أو خلاف ذلك - اختيار عدد أعلى بكثير من 2 $. معضلة المسافر يمكن تطبيقها لتحليل مجموعة متنوعة من مواقف الحياة الحقيقية. فعلى سبيل المثال، يمكن أن تساعد عملية التحريض المتخلف على تفسير كيف يمكن لشركتين منخرطتين في المنافسة الحادة أن تسرع باطراد في خفض أسعار المنتجات في محاولة للحصول على حصتها في السوق، الأمر الذي قد يؤدي إلى تكبدها خسائر أكبر على نحو متزايد في هذه العملية.

استراتيجيات نظرية لعبة إضافية

معركة الجنس

: هذا هو شكل آخر من لعبة التنسيق وصفها في وقت سابق ولكن مع بعض التباين في العائد. وهو ينطوي أساسا على زوجين يحاولون تنسيق مساءهم. وبينما كانوا قد وافقوا على الاجتماع إما في لعبة الكرة (تفضيل الرجل) أو في مسرحية (تفضيل المرأة)، فقد نسوا ما قرروا، ومضاعفة المشكلة، لا يمكن التواصل مع بعضهم البعض. أين ينبغي أن تذهب؟ مصفوفة العائد كما هو مبين - الأرقام في الخلايا تمثل الدرجة النسبية للتمتع الحدث للمرأة والرجل، على التوالي. على سبيل المثال، الخلية (أ) تمثل العائد (من حيث مستويات التمتع) للمرأة والرجل، على التوالي، في المسرحية (انها تتمتع بها أكثر بكثير مما يفعل). الخلية (د) هي المردود إذا كان كل من جعله إلى لعبة الكرة (انه يتمتع بها أكثر مما تفعل). الخلية (ج) تمثل عدم الرضا إذا كان كلاهما لا يذهب فقط إلى موقع خاطئ، ولكن أيضا إلى الحدث الذي يتمتعون أقل - المرأة في لعبة الكرة والرجل للعب.

معركة الجنس مصفوفة العائد الرجل

لعب

لعبة الكرة

امرأة

لعب

(أ) 6، 3

(ب) 2، 2 > لعبة الكرة

(ج) 0، 0

(د) 3، ​​6

ديكتاتور لعبة

: هذه هي لعبة بسيطة التي لاعب يجب أن تقرر كيفية تقسيم الجائزة النقدية مع لاعب B ، الذي لا يوجد لديه مدخلات في قرار اللاعب أ. في حين أن هذه ليست استراتيجية نظرية اللعبة

في حد ذاتها

، فإنه يوفر بعض الأفكار المثيرة للاهتمام في سلوك الناس. وتكشف التجارب أن حوالي 50٪ يحتفظون بجميع الأموال لأنفسهم؛ 5٪ تقسيمه بالتساوي، والآخر 45٪ يعطي المشارك الآخر حصة أصغر. ويرتبط لعبة الديكتاتور ارتباطا وثيقا لعبة الإنذار، الذي يعطى اللاعب ألف مبلغ معين من المال، جزء منها يجب أن تعطى لاعب B، الذي يمكن قبول أو رفض المبلغ المعطى.الصيد هو أنه إذا كان اللاعب الثاني يرفض المبلغ المقدم، على حد سواء A و B الحصول على أي شيء. وتعقد ألعاب الديكتاتور والإنذار دروسا هامة لقضايا مثل العطاء الخيري والعمل الخيري. حرب السلام : الاختلاف في معضلة السجين التي يتم فيها استبدال قرارات "التعاون أو العيب" ب "السلام أو الحرب". "يمكن أن يكون القياس اثنين من الشركات العاملة في حرب أسعار. إذا امتنع كلاهما عن خفض الأسعار، فإنهما يتمتعان بالازدهار النسبي (الخلية أ)، ولكن حرب الأسعار سوف تقلل من المكاسب بشكل كبير (الخلية د). ومع ذلك، إذا كان A يشارك في خفض الأسعار (الحرب) ولكن B لا، فإن A سيكون لها عائد أعلى من 4 لأنها قد تكون قادرة على الحصول على حصة كبيرة في السوق، وهذا حجم أعلى من شأنه أن يعوض انخفاض أسعار المنتجات. شركة ب

شركة ب السلام

الحرب

شركة

السلام

(أ) 3، 3

(ب) 0، 4 > الحرب

(ج) 4، 0

(د) 1، 1

معضلة المتطوعين

: في معضلة المتطوع، على شخص ما أن يقوم بعمل روتيني أو عمل من أجل الصالح العام. وتتحقق أسوأ نتيجة ممكنة إذا لم يتطوع أحد. على سبيل المثال، النظر في شركة حيث الاحتيال المحاسبة متفشية ولكن الإدارة العليا لا يدركون ذلك. بعض الموظفين المبتدئين في قسم المحاسبة على بينة من الاحتيال ولكن يترددون في إبلاغ الإدارة العليا، لأنه سوف يؤدي إلى إطلاق النار على الموظفين المشاركين في الاحتيال وربما على الأرجح للمحاكمة. قد يكون وصفها بأنها "المبلغين" قد يكون لها أيضا بعض التداعيات أسفل الخط. ولكن إذا لم يتطوع أحد، فإن الغش على نطاق واسع قد يؤدي إلى إفلاس الشركة في نهاية المطاف وفقدان وظائف الجميع.

الخلاصة

نظرية اللعبة يمكن استخدامها بشكل فعال جدا كأداة لصنع القرار سواء في بيئة اقتصادية أو تجارية أو شخصية.