This project provides automated end‑to‑end tests for the OpenGlad WebAssembly build, ensuring correct functionality across browsers.
يُقدِّم هذا المشروع مجموعة اختبارات آلية تُشغَّل باستخدام Playwright لمحاكاة تفاعلات المستخدم والتحقق من سلوك وحدة OpenGlad WebAssembly في المتصفحات الحقيقية. تغطي الاختبارات الميزات الأساسية مثل العرض ومعالجة الأحداث ومعالجة البيانات، لضمان أن البناء WASM يعمل كما هو متوقع. تُنظم الاختبارات في مجموعات منطقية ويمكن تشغيلها محلياً أو كجزء من خطوط أنابيب التكامل المستمر. توفر النتائج تقارير مفصلة ولقطات شاشة عند الفشل، ما يسهل عملية تصحيح الأخطاء. تم تصميمها لتكون قابلة للتوسيع بسهولة مع إضافة ميزات جديدة إلى مشروع OpenGlad. تُعَدُّ أداةً حيوية لضمان جودة المنتج قبل الإطلاق.
Automated end‑to‑end testing for a financial services web application using Selenium and Pytest.
يُقدِّم هذا الإطار مجموعة شاملة من اختبارات النهاية إلى النهاية لتطبيق خدمات مالية عبر الويب. يُبنى باستخدام لغة بايثون وSelenium WebDriver مع Pytest، ويعتمد على نمط تصميم Page Object Model لضمان صيانة الاختبارات وإعادة استخدامها بسهولة. تُولَّد بيانات الاختبار ديناميكيًا باستخدام Faker، وتُنفَّذ الاختبارات بالتوازي عبر pytest‑xdist لتقليل زمن التنفيذ. يُستخدم Allure لتوليد تقارير شاملة، ويُدمج الإطار مع خط أنابيب CI/CD لتشغيل الاختبارات تلقائيًا. يستهدف الإطار مهندسي ضمان الجودة والمطورين الذين يحتاجون إلى اختبارات موثوقة ومتكررة للكشف المبكر عن الانحرافات وضمان تجربة مستخدم سلسة. يميز هذا الحل بتركيبه النمطي، وإمكانيات توليد البيانات، وتكاملاته مع أدوات CI/CD، مما يقلل الجهد اليدوي ويزيد من كفاءة التحقق من جودة التطبيق.
A command‑line harness that evaluates the core capabilities of AI agents by running a suite of automated tasks.
يُشغّل هذا الإطار مجموعة من المهام المُعرفة مسبقاً التي تستهدف قدرات محددة للذكاء الاصطناعي مثل فهم الكود، توليده، إصلاح الأخطاء، إعادة هيكلته، وتحويل البيانات. تُقدّم كل مهمة نصاً طبيعيًا، ملفات بذرة، ومُحقّق آلي لتقييم الدقة ضمن حد زمني قابل للتكوين. يمكن للمستخدم تشغيل جميع المهام على جميع الوكلاء المدعومين أو اختيار مهام ووكلاء محددين عبر خيارات سطر الأوامر. تُخزّن النتائج كملفات JSON، موضحة حالة النجاح أو الفشل، زمن التنفيذ، والمخرجات لكل زوج مهام-وكيل. صُمم هذا الإطار للباحثين والمطورين الذين يحتاجون إلى معيار متكرر وآلي لأداء الوكلاء الذكاء الاصطناعي.
A test harness that runs unit and integration tests for the Leyi codebase, helping developers verify functionality before deployment.
يُقدِّم هذا المشروع حزمة اختبارات خفيفة الوزن مصممة لتشغيل اختبارات الوحدة والتكامل على قاعدة كود ليدي. يتضمن مجموعة من السكربتات المكتوبة بلغة بايثون التي تُكتشف وتنفّذ وحدات الاختبار، بالإضافة إلى أدوات باش تُسهل تنسيق تشغيل الاختبارات في بيئات مختلفة. يلتقط الحزمة نتائج الاختبارات ويولد تقارير مختصرة، ويمكن دمجه بسهولة في خطوط أنابيب التكامل المستمر. يستهدف المطورين ومهندسي ضمان الجودة، مما يُسهل عملية التحقق من تغييرات الكود ويضمن عدم إدخال أخطاء جديدة. من خلال أتمتة سير العمل الاختباري، يقلل المشروع الجهد اليدوي ويُسرّع دورة الإطلاق.
It evaluates whether a knowledge graph of metaphors improves large language model reasoning.
يقدم هذا المشروع مجموعة من أدوات التقييم التي تقيس تأثير قاعدة بيانات الرموز المجازية المنظمة على أداء نماذج اللغة الكبيرة. يتضمن ذلك قوالب للطلبات، وملفات تقييم، ومجموعات اختبارات تُقيّم مهام مثل تسمية المكونات، واكتشاف نقاط الفشل، وتحديد الرموز المجازية. تُستخدم أدوات التقييم خوادم OpenRouter لتقييم النتائج كـ "LLM-as‑judge"، وتدعم نهج الاستدعاء الوظيفي بالإضافة إلى التضمين السياقي. يستهدف المشروع الباحثين والمطورين الذين يرغبون في مقارنة قدرات نماذج اللغة على التفكير وتقييم فوائد استرجاع الرموز المجازية بشكل مستهدف. يوضح المشروع كيف يمكن لاستعلامات محددة أن تحسن دقة وفائدة النماذج مقارنة بالحقن السياقي الضخم.
Automated unit tests for a Python morphological processing library.
يقدّم هذا المشروع مجموعة شاملة من اختبارات الوحدة المصممة للتحقق من صحة وظائف مكتبة معالجة التصريفات المكتوبة بلغة بايثون. تغطي الاختبارات مجموعة واسعة من السيناريوهات، بما في ذلك التجزئة، والتصريف، واستخراج السمات الصرفية، مما يضمن أن كل مكوّن يعمل كما هو متوقع. تم تنظيم الاختبارات لتسهيل دمجها في خطوط أنابيب التكامل المستمر، وتوفير ملاحظات سريعة حول تغييرات الكود. يستهدف المطورين الذين يعتنون أو يمدّون المكتبة، ويساعد على منع الانحدارات وضمان أداء ثابت عبر التحديثات. من خلال تشغيل هذه الاختبارات، يمكن للمساهمين تعديل الكود أو إضافة ميزات جديدة بثقة، مع العلم أن السلوك الأساسي يظل ثابتًا.
This project is a testing classifier, intended for developers to evaluate and improve their code.
هذا المشروع هو مُصنف اختبار، مصمم لصانعي البرامج لتقييم وتحسين كودهم. يعتبر هذا المشروع من أدوات التطوير السريع التي تساعد على تسهيل عملية تحديد وترتيب الاختبارات.
Provide broken Python modules as test fixtures for validating an automated code‑repair system.
يقدم هذا المشروع مجموعة من الوحدات البرمجية المكتوبة بلغة بايثون والتي تحتوي على أخطاء مقصودة، وتُستخدم كأدوات اختبار لتجارب التكامل الشاملة لنظام إصلاح الأخطاء. يتضمن المشروع ثلاث سيناريوهات مختلفة تُظهر أخطاءً من أنواع متعددة: خطأ في النوع، خطأ في المنطق (خطأ في الإزاحة)، وفشل في الاتصال بواجهة برمجة تطبيقات خارجية. تُصمم الاختبارات للتحقق من قدرة النظام على اكتشاف الخطأ، اقتراح الإصلاح، وتطبيقه تلقائياً. يُستفيد منه مطورو البرمجيات ومهندسو ضمان الجودة عند اختبار دورة اكتشاف الأخطاء وإصلاحها قبل دمج محرك الإصلاح في سير العمل. كما يُظهر المشروع طريقة تنظيم بيانات الاختبار والنتائج المتوقعة لتسهيل الاختبار الآلي. يهدف المشروع إلى توفير بيئة تحاكي سيناريوهات حقيقية تساعد على تحسين كفاءة وأمان عمليات الصيانة.
A benchmark framework that evaluates large language models on progressively generating graphs from natural language instructions.
يُقدِّم GraphInstruct إطاراً معيارياً منظماً لتقييم قدرة نماذج اللغة الكبيرة على توليد الرسوم البيانية استناداً إلى أوامر نصية. يتضمن مجموعة مختارة من المهام التدريجية التي تزداد تعقيداً تدريجياً، ما يتيح للباحثين تتبع أداء النماذج عبر مراحل مختلفة. يدمج الإطار مكتبات التصوير لتوليد الرسوم البيانية ويُقدِّم مقاييس دقيقة لدرجة الدقة، والوفاء بالمتطلبات، وسرعة التوليد. يستهدف الباحثين في مجال معالجة اللغة الطبيعية وتوليد الرسوم البيانية، ويُمكّنهم من إجراء مقارنات قابلة للتكرار بين النماذج المختلفة. يساهم في دفع تطوير أنظمة توليد أكثر قدرة على التعامل مع أوامر نصية معقدة، مع التركيز على تحسين جودة الرسوم البيانية المولَّدة. كما يتيح إمكانية توسيع نطاق التقييم ليشمل سيناريوهات تطبيقية متنوعة، مما يعزز من فاعلية النماذج في البيئات الواقعية.
A declarative unit testing framework for validating Spark Declarative Pipelines.
يقدم هذا الإطار نهجاً إعلانيًا لاختبار الوحدات لخطوط أنابيب Spark Declarative، مما يمكّن المطورين من تعريف سلوك الأنابيب المتوقع بطريقة موجزة وسهلة القراءة. يقوم تلقائيًا بمقارنة مخرجات الأنابيب مع التوقعات المحددة مسبقًا، مما يكتشف الانحرافات ومشكلات جودة البيانات مبكرًا في دورة التطوير. يتكامل المكتبة بسلاسة مع خطوط CI/CD الحالية، مما يتيح تشغيل الاختبارات كجزء من عمليات البناء والنشر الآلية. يستهدف مهندسي البيانات ومطوري الأنابيب، ويقلل الجهد اليدوي في الاختبار ويزيد الثقة في صحة الأنابيب. بتركيزه على المواصفات الإعلانية، يبسط صيانة الاختبارات ويعزز توثيق عقود الأنابيب بوضوح.
A test suite that verifies the functionality and stability of the Hendrix Flanger VST3 audio plugin.
يقدّم هذا المشروع مجموعة شاملة من الاختبارات الآلية لمكوّن فلاتر Hendrix Flanger VST3. تشمل الاختبارات وحدات اختبار للكتل المعالجة الفردية، واختبارات تكامل تُشغّل المكوّن داخل بيئات استضافة شائعة، واختبارات رجعية تقارن المخرجات مع ملفات صوتية مرجعية. تُكتب الاختبارات بلغة Python وC++ وتستفيد من مكتبات NumPy وSciPy لتحليل المقارنات الصوتية. يستهدف المشروع مطوري المكوّنات ومهندسي ضمان الجودة الذين يحتاجون إلى التأكد من سلوك موحد عبر التحديثات. من خلال تشغيل هذه الاختبارات، يمكن للمطورين اكتشاف الانحرافات بسرعة، والتحقق من معالجة المعلمات، وضمان التوافق عبر الأنظمة المختلفة.
A command-line tool that runs end‑to‑end tests against Katalon's Kai chatbot agent, collects performance metrics, and generates analytics dashboards.
توفر الأداة واجهة سطر أوامر بسيطة لتشغيل سيناريوهات اختبار آلية على وكيل Kai. تتواصل مع بروتوكول الوكيل عبر نقطتي نهاية، وتتابع حالة التنفيذ وتستخرج تاريخ المحادثة. تشمل سيناريوهات الاختبار مسارات النجاح، وحالات الحافة، وتفاعلات متعددة الجولات، وحالات الضغط. تحلل الوحدة التحليلية زمن الاستجابة، واستخدام الأدوات، ومعدلات الأخطاء، وتنتج تقارير JSON ولوحات عرض مرئية. تستهدف المهندسين المختصين بالاختبار الآلي والضمان الجودة الذين يحتاجون إلى التحقق من سلوك وكيل المحادثة وأدائه.
This project provides automated end‑to‑end tests for a web mapping interface, ensuring its functionality across browsers.
يُقدِّم هذا المشروع مجموعة اختبارات شاملة تُحاكي تفاعلات المستخدم مع واجهة خريطة الويب، مع التركيز على وظائف التحميل، وتبديل الطبقات، وأدوات الرسم. تُنفَّذ الاختبارات في بيئة غير مرئية، ما يتيح دمجها بسلاسة في خطوط أنابيب التكامل المستمر. يستهدف المشروع مهندسي ضمان الجودة ومطوري الواجهة الأمامية الذين يحتاجون إلى كشف الانحرافات قبل الإطلاق. يساهم في تقليل الأخطاء التي قد تظهر بعد تحديثات الكود، ويضمن استقرار تجربة المستخدم. يميز المشروع قدرته على التحقق من التوافق عبر المتصفحات الرئيسية، مما يضمن تجربة موحدة للمستخدمين النهائيين.