A Snake game featuring a Deep Q-Network agent that learns to play and can compete against a human player.
يقدم هذا المشروع محاكاة للعبة الثعبان مع دمج خوارزمية التعلم المعزز Deep Q-Network لتدريب وكيل يتعلم كيفية اللعب. يتم تشغيل اللعبة على شبكة مربعات 20×20، حيث يبدأ الثعبان في المركز ويتحرك وفقًا لخيارات الاتجاه الثلاثة: مستقيم، يمين، أو يسار. يُمثل حالة البيئة بردود فعل ثمانية بُعد، تشمل مخاطر الاصطدام واتجاهات الطعام والاتجاه الحالي للثعبان. يستخدم الوكيل شبكة عصبية بسيطة ذات طبقتين لتوليد قيم Q، مع تطبيق استكشاف epsilon-greedy وتخزين التجارب في ذاكرة Replay. يتم تدريب الوكيل عبر 2000 حلقة باستخدام خوارزمية Adam، مع تسجيل التقدم في رسومات بيانية للربح والخسارة. يمكن للمستخدم اللعب يدويًا أو مشاهدة الوكيل أو التنافس معه في وضع الشاشة المقسمة، مع إمكانية إعادة تشغيل اللعبة تلقائيًا عند انتهاء الجولات.
The reinforcetactics project is a turn-based strategy game designed for reinforcement learning research.
هذا المشروع هو لعبة استراتيجية متباعدة في الزمن، تم تطويرها باستخدام Pygame و Gymnasium. مصممة لتمكين الباحثين من تجربة مختلف الاستراتيجيات والخوارزميات. توفر اللعبة مساحة للبحث والتجريب حول النماذج العصبية وتحسينها، مما يسمح للمستخدمين بالاستفادة من البيئة الاستراتيجية.
PySokoban is a complete Sokoban puzzle game developed in Python, featuring a modular approach for level creation and numerous improved features.
هذا لعبة بزوبان الكلاسيكية حيث يجب على اللاعب دفع الأبواق إلى مواقع الهدف داخل المستودع. هذا المشروع يimplement اللعبة مع العديد من الميزات، بما في ذلك مركز نظام الحذف ، ووضع النقطة ، وGUI باستخدام Pygame ، ومحرر مستوى الرسومية ، ونظام الجلد/الصور للتعديل ، ونظام التحقق المستوى.