A benchmark framework that evaluates large language models on progressively generating graphs from natural language instructions.
يُقدِّم GraphInstruct إطاراً معيارياً منظماً لتقييم قدرة نماذج اللغة الكبيرة على توليد الرسوم البيانية استناداً إلى أوامر نصية. يتضمن مجموعة مختارة من المهام التدريجية التي تزداد تعقيداً تدريجياً، ما يتيح للباحثين تتبع أداء النماذج عبر مراحل مختلفة. يدمج الإطار مكتبات التصوير لتوليد الرسوم البيانية ويُقدِّم مقاييس دقيقة لدرجة الدقة، والوفاء بالمتطلبات، وسرعة التوليد. يستهدف الباحثين في مجال معالجة اللغة الطبيعية وتوليد الرسوم البيانية، ويُمكّنهم من إجراء مقارنات قابلة للتكرار بين النماذج المختلفة. يساهم في دفع تطوير أنظمة توليد أكثر قدرة على التعامل مع أوامر نصية معقدة، مع التركيز على تحسين جودة الرسوم البيانية المولَّدة. كما يتيح إمكانية توسيع نطاق التقييم ليشمل سيناريوهات تطبيقية متنوعة، مما يعزز من فاعلية النماذج في البيئات الواقعية.
A test suite that verifies the functionality and stability of the Hendrix Flanger VST3 audio plugin.
يقدّم هذا المشروع مجموعة شاملة من الاختبارات الآلية لمكوّن فلاتر Hendrix Flanger VST3. تشمل الاختبارات وحدات اختبار للكتل المعالجة الفردية، واختبارات تكامل تُشغّل المكوّن داخل بيئات استضافة شائعة، واختبارات رجعية تقارن المخرجات مع ملفات صوتية مرجعية. تُكتب الاختبارات بلغة Python وC++ وتستفيد من مكتبات NumPy وSciPy لتحليل المقارنات الصوتية. يستهدف المشروع مطوري المكوّنات ومهندسي ضمان الجودة الذين يحتاجون إلى التأكد من سلوك موحد عبر التحديثات. من خلال تشغيل هذه الاختبارات، يمكن للمطورين اكتشاف الانحرافات بسرعة، والتحقق من معالجة المعلمات، وضمان التوافق عبر الأنظمة المختلفة.