The Harbor Clerk project is a tool for managing and retrieving documents in a Dropbox-like system.
هاربور كلير هو نظام إدارة مستندات مدمج يجمع بين فوائد تخزين السحابة مع القدرة على استرجاع البيانات في الموقع. يسمح للمستخدمين بتخزين و إدارة مستنداتهم بشكل آمن، بينما يوفر خيارًا لاسترجاع البيانات من دون الاتصال بالإنترنت. يستخدم النظام قواعد البيانات Minio و PostgreSQL لضمان توافقية البيانات و متوافقتها.
This project is a footfall counter, likely used in retail or commercial settings to track pedestrian traffic.
هذا المشروع هو مقياس مرور الأقدام، يُستخدم في بيئات تجارية أو تجارية لمراقبة حركة المشاة. يتم بناؤه باستخدام Python و يستفيد من مكتبة numpy. بدون مزيد من المعلومات، لا يزال غير واضح كيف سيتم استخدام هذه البيانات أو تخزينها.
A curated dataset for training and evaluating distraction detection models.
يقدّم هذا المشروع مجموعة بيانات شاملة ومُعلمة صُممت لدعم تطوير نماذج التعلم الآلي التي تكشف عن الانحراف في سياقات مختلفة. تتضمن البيانات عينات متنوعة مُعلمة بفئات الانحراف، مما يتيح للباحثين تدريب مصنّفات قوية. تم تنظيمها لتسهيل دمجها بسهولة مع خطوط أنابيب التعلم الآلي الشائعة، مع توثيق واضح حول الصيغة ومبادئ التسمية. الجمهور المستهدف الأساسي هو علماء البيانات والباحثين الذين يعملون في مجال التفاعل بين الإنسان والحاسوب، سلامة القيادة، وتحليل السلوك. من خلال توفير معيار موحد، تساعد المجموعة على مقارنة أداء الخوارزميات وتسريع الابتكار في كشف الانحراف.
The Runway Orientation Visualisation project maps the orientation of airport runways worldwide to reveal prevailing wind patterns and geographic conventions.
هذا المشروع يرسم اتجاهات ملاحة المطارات حول العالم لاستكشاف أنماط الرياح والمناطق الجغرافية. يستخدم البيانات من OurAirports ويتجميع المطارات القريبة حسب اتجاهها، ثم يحسب كل مجموعة باستخدام طريقة الدوران المتوسطة. يتيح للمستخدمين رؤية مناطق مختلفة حول العالم.
Calculate the Beneish M‑Score for Korean IFRS companies to assess potential earnings manipulation.
يُعدّ هذا الأداة حلاً لحساب درجة بينيش، وهو مؤشر إحصائي يُستخدم لاكتشاف التلاعب بالأرباح، مع تركيز خاص على الشركات المدرجة في بورصتي كوسبي وكوسداك الكورية التي تتبع المعايير الدولية للتقارير المالية. يستورد الأداة بيانات القوائم المالية، ويطبق صيغة بينيش القياسية، ثم يُخرج نتيجة الدرجة مع نسب تشخيصية توضح نقاط الضعف المحتملة. يتيح هذا التقييم للخبراء الماليين تحديد الشركات التي قد تتبع ممارسات محاسبية متشددة. يُصمم الأداة لتلبية احتياجات المستثمرين ومديري المخاطر والباحثين في مجال المالية الذين يحتاجون إلى تحليل سريع وموثوق للبيانات المالية الكورية. يعتمد التنفيذ على مكتبات علم البيانات في لغة بايثون لضمان دقة الحسابات وسهولة دمجها في سير العمل الحالي.
The building-analysis project is designed for architects and engineers to analyze building data.
هذا المشروع يقدم أداة برمجية مبنية على لغة بايثون للتحليل البياني للمباني. يستخدم هذا الأداة مكتبة NumPy للعمليات الحسابية العددية الفعالة. لا يوجد حاليًا دمج قاعدة بيانات. الهدف من هذا المشروع هو تقديم طريقة بسيطة وفعالة لprocessing وتصفح المعلومات المتعلقة بالمنشآت.
This project is a QDrant-based search engine for efficient and scalable data retrieval.
هذا المشروع هو محرك بحث مبني على قدرنت، مصمم لتقديم قدرات استرجاع البيانات الفعالة والمتوفرة على نطاق واسع. يستخدم البرنامج الرئيسي لغة بايثون. يعتمد المشروع على ريدس للوظائف الإضافية. في الوقت الحالي، لا تتوافر وصفة مفصلة في README.
This project is designed to provide a platform for data analysis and visualization.
يبدو أن مشروع Numbers Don't Lie, Blutmans Do يركز على تحليل البيانات والتصوير. ومع ذلك، دون وجود معلومات إضافية، صعب تحديد تفاصيل وظيفته. يستخدم اللغات Python و JavaScript وتفاعل مع قواعد البيانات PostgreSQL. اسم المشروع يشير إلى تركيزه على الفهم المبني على البيانات.
A Python package that reproduces figures and analyses from a 2023 neuroscience study on mouse behavior.
يُقدِّم هذا المشروع حزمة Python تُعيد إنتاج الرسوم البيانية والتحليلات التي عرضت في دراسة علم الأعصاب لعام 2023 حول سلوك الفأر. تتضمن الحزمة سكربتات معالجة البيانات، ودوال مساعدة، وأدوات رسم تُحاكي منهجية الدراسة الأصلية. يمكن للمستخدمين تحميل مجموعات البيانات الأولية والمعالجة، إعداد بيئة conda، وتشغيل الوحدات المرفقة لتوليد رسومات جاهزة للنشر. صُممت الحزمة للباحثين الذين يحتاجون إلى التحقق من صحة النتائج، توسيعها، أو بناء على اكتشافاتها. تُركز على إعادة الإنتاجية وتوثيق واضح لكل خطوة في مسار التحليل.
Provides a comprehensive cricket database and pre‑trained predictive models for analysis and simulation.
يحتوي هذا المشروع على قاعدة بيانات DuckDB ضخمة تضم بيانات الكريكيت على مستوى الكرة الواحدة، مع تفاصيل المباريات، معلومات اللاعبين، ومقاييس المهارة المستخرجة. كما يتضمن نماذج XGBoost مُدربة مسبقاً تتنبأ بنتائج مثل النقاط، الإهانات، وأداء الفرق. يمكن للمستخدمين استعلام قاعدة البيانات مباشرة أو عبر حزمة R توفر وظائف مساعدة لتثبيت، تحديث، واسترجاع البيانات. يدعم المشروع صيغاً متعددة (T20، ODI، Test) وجنسين، ويقدّم نتائج محاكاة من عمليات مونت كارلو. يهدف المشروع إلى تحليل البيانات، علم البيانات، ومطوري التطبيقات الذين يحتاجون إلى بيانات كريكيت موثوقة وجاهزة للاستخدام في الأبحاث أو نمذجة أو تطوير التطبيقات.
The mkseg project provides a unified cell segmentation pipeline for analyzing microscopy images.
هذا المشروع يقدم مسارًا متكاملًا لفرز الخلايا في صور المجهرية. مصمم للعمل مع مختلف أنواع البيانات المجهرية، بما في ذلك صور MK و HSPC و NMJ و Vessel. يستخدم المسار خوارزميات التعلم الآلي لتحديد الخلايا الفردية بدقة وتفريقها عن الخلفية. يمكن أن يكون هذا مفيدًا في التطبيقات البحثية والتحليلية حيث يعد فرز الخلايا خطوة مهمة.
A Python-based data analytics toolkit for the Ucasal dataset, enabling users to explore, visualize, and analyze data.
يقدم هذا الأداة مجموعة من الوظائف والمرافق لإجراء تحليل بيانات على مجموعة بيانات Ucasal. يدعم تحميل البيانات الخام، تنظيفها ومعالجتها، حساب الإحصاءات الوصفية، وإنشاء مجموعة متنوعة من الرسوم البيانية مثل المدرجات التكرارية، مخططات الانتشار، والخرائط الحرارية. يمكن للمستخدمين تشغيل سير عمل تحليل استكشافي بسرعة وتصدير النتائج إلى صيغ شائعة مثل CSV أو PDF. تم تصميم المكتبة للخبراء والباحثين الذين يحتاجون إلى حل مرن قائم على بايثون دون الحاجة إلى إعداد بنية تحتية معقدة. تُسهل الأداة المهام المتكررة وتدعم إعادة إنتاج التحليل. كما توفر واجهة برمجية بسيطة تسمح بدمجها بسهولة في مشاريع أخرى. يميزها تركيزها على مجموعة بيانات محددة، مما يتيح استكشاف أعمق للأنماط والاتجاهات داخل Ucasal.
A playground for creating straightforward, story-driven data visualizations using popular data libraries.
يُقدّم هذا المشروع مجموعة من الأدوات البسيطة لإنشاء رسومات بيانية توضح بيانات حقيقية بطريقة سردية واضحة. يتيح للمستخدمين مقارنة بيانات خطوط المترو باستخدام مخططات بولار أو رادار، مع تفصيل ساعات اليوم، والمناطق، وفئات الأجرة. كما يتضمن مثالاً على تحليل توزيع الأسماء الأولية للاعبين في الدوري الأمريكي لكرة السلة، مع تقدير الجنس باستخدام مكتبة تحليل الأسماء. تُبنى الرسومات باستخدام مكتبة رسم بياني تفاعلية، ما يتيح تصفح البيانات وتكبيرها بسهولة. يستهدف المشروع المتعلمين والباحثين الذين يرغبون في تجربة مكتبات تحليل البيانات دون الحاجة إلى إعداد بيئة معقدة. يبرز المشروع بوضوح كيف يمكن تحويل مجموعات البيانات إلى قصص بصرية مفهومة، مع التركيز على البساطة والوضوح.
The JOE Job Market Tracker is an analysis tool for tracking economics job market postings from the American Economic Association's Job Openings for Economists (JOE).
هذا المشروع يقدم تحليلًا شاملًا للตลาด الوظيفي في الاقتصاد عن طريق متابعة المنشورات من جمعية الاقتصاد الأمريكية لفتح وظائف الاقتصاديين (JOE). يحتوي على العديد من الميزات، بما في ذلك الاتجاهات cumulative posting trends، التحليل الدوري 4-أسبوع flow، ومراجعة متعددة. كما يولد مخططات HTML تفاعلية ومخططات PNG ثابتة لتحسين فهم المستخدمين للتrends السوقية.
A dataset and simulator that generates realistic telemetry for RF filter manufacturing lines, including injected anomalies for testing analytics.
يقدّم هذا المشروع مجموعة بيانات شاملة لقياسات المراقبة في خطوط تصنيع أربعة أنواع مختلفة من مرشحات RF، مع تغطية مفصلة للمعلمات مثل الاهتزاز، ودرجة الحرارة، والطبقات المطبقة، والتصوير الضوئي، والتشذيب، والتعديل، ومحطات الاختبار. يتضمن المشروع مولد دفعات ينتج أكثر من 300 ألف سجل بصيغة JSONL، مع حقن شذوذات حقيقية في فترات متتالية، بالإضافة إلى محاكي تدفق يرسل بيانات في الوقت الفعلي مع معدل شذوذ يبلغ 8٪. كل سجل يحتوي على علم `is_anomaly` لتسهيل تصنيف البيانات في نماذج التعلم الآلي. تم تصميم البيانات لتلبية احتياجات الباحثين والمهندسين الذين يطورون نماذج كشف الشذوذ، والصيانة التنبؤية، وتحسين عمليات التصنيع.
This project is a trading journal for users to track and analyze their investment activities.
هذا المشروع هو سجل تجاري للمستخدمين لمراقبة و تحليل نشاطات الاستثمار الخاصة بهم. يسمح هذا التطبيق للمستخدمين بتعريف البيانات التجارية، عرض القياسات الأداء، وتوليد رسومات مرئية لمساعدة على اتخاذ القرارات.
A benchmark that evaluates thermodynamic reasoning capabilities of large language models.
يُعد ThermoQA مقياساً مُصمماً خصيصاً لاختبار مدى قدرة النماذج اللغوية الكبيرة على فهم وتطبيق مفاهيم الديناميكا الحرارية. يتضمن مجموعة متنوعة من الأسئلة الفيزيائية التي تتطلب استنتاجاً كميًا، وتحويل وحدات، وتطبيق القوانين الأساسية. يُقدّم المقياس إجابات مرجعية ومعايير تقييم لقياس أداء النماذج بشكل موضوعي. يمكن للباحثين والمطورين استخدامه لتقييم البنى الجديدة، أو استراتيجيات التعديل، أو تصميمات التوجيه. يسلّط الضوء على نقاط القوة والضعف في التفكير الدنّامي، مما يساهم في توجيه تحسينات مستقبلية في نمذجة اللغة العلمية.
A Python tool that analyzes daily equity price data to identify potential reversal signals occurring on Wednesdays.
يستورد هذا البرنامج بيانات أسعار الأسهم التاريخية ويطبق فلترًا إحصائيًا لتحديد أنماط الانعكاس التي تظهر غالبًا يوم الأربعاء. يقوم بتنظيف البيانات، ويحسب مؤشرات رئيسية مثل المتوسطات المتحركة والتقلب، ثم يحدد الأيام التي يختلف فيها تحرك السعر بشكل كبير عن الاتجاه العام. ينتج تقريرًا مختصرًا يضم تواريخ الانعكاس، وقوة الإشارة، ونقاط الدخول أو الخروج المقترحة للمتداولين. صُمم هذا الأداة للباحثين الكميين والمتداولين الذين يرغبون في وسيلة سريعة وقابلة للتكرار لاكتشاف نقاط التحول منتصف الأسبوع في السوق. لا تتطلب الأداة أي قاعدة بيانات، وتعمل بكفاءة باستخدام مكتبات بايثون القياسية مثل NumPy وPandas. تتميز بقدرتها على التعامل مع مجموعات بيانات كبيرة بسرعة، وتوفر واجهة سهلة الاستخدام للنتائج التي يمكن دمجها في استراتيجيات التداول أو التحليل الفني. كما تتيح إمكانية تعديل معايير الفلترة لتناسب أساليب التداول المختلفة، مما يجعلها أداة مرنة ومتكاملة في بيئة التحليل المالي.
This project provides a training dataset for fine-tuning open-source Large Language Models (LLMs) to understand Gerbil Scheme, a dialect of Scheme built on Gambit.
يحتوي المجموعة على 5,970 إدخالاً، بما في ذلك وثائق رسمية، ووصفات كود مُصدقة، ووثائق وظيفية API، ومصادر تعليمية. تغطي المواضيع المختلفة مثل تحليل JSON، التعامل مع الأخطاء، وأنماط الأمان. يتم توفير البيانات في صيغات ChatML/ShareGPT وألپاكا، مما يجعلها متوافقة مع أدوات LoRA الشهيرة مثل LLaMA-Factory وAxolotl.
This project provides a market analysis toolkit for options trading, offering features such as HMM regime detection, technical indicators, phase detection, and opportunity assessment.
هذا المشروع يوفّر أداة تحليل السوق للاستثمار في خيارات، وتضم ميزات مثل اكتشاف الأنماط باستخدام النماذج اللازمة، والمتغيرات الفنية، واكتشاف المراحل، وتقييم الفرص. هذه الأدوات تساعد المستثمرين على اتخاذ قرارات أكثر دقة بناءً على تفاصيل حول السوق.
A Python-based system that monitors livestock behavior in real time, using sensor data to detect activity patterns and dynamically adjust sampling rates for energy efficiency.
يُعد LiveEdge نظامًا قائمًا على لغة بايثون يراقب سلوك المواشي في الوقت الحقيقي، مستفيدًا من بيانات المستشعرات لتحديد أنماط النشاط. يستخدم نماذج تعلم الآلة لتصنيف السلوكيات، ويضبط معدلات أخذ العينات تلقائيًا لتقليل استهلاك الطاقة. يوفر المنصة تحليلات بصرية عبر مخططات تفاعلية وتقارير مفصلة، مما يمكّن المزارعين من اكتشاف مشكلات الصحة قبل تفاقمها. صُمم خصيصًا لمديري المزارع والباحثين الزراعيين، ويقلل من تكاليف صيانة المستشعرات مع تحسين رفاهية القطيع. بفضل تقنية أخذ العينات التكيفية، يطيل عمر البطاريات ويقلل العبء التشغيلي. يُمكن نشره بسهولة على شبكات المستشعرات الحالية، ويُدعم التكامل مع أنظمة إدارة المزارع. يدمج LiveEdge بين الذكاء الاصطناعي والتحليل البياني لتقديم حلول مراقبة فعّالة ومتكاملة.
ds-pal is a dataset analysis platform designed for data scientists to perform clustering and visualization tasks.
هي منصة تحليل البيانات المفتوحة التي تسمح للمختصين في علم البيانات بتحليل البيانات باستخدام تقنيات التجميع والتصوير. توفر المنصة واجهة مستخدم سهلة الاستخدام لتحميل وتجهيز وتحليل البيانات الكبيرة. تستخدم المنصة مكتبات شعبية مثل scikit-learn و plotly للقيام بالتطبيقات المعقدة في تحليل البيانات.
This project is a Python data pipeline for downloading, parsing, and processing historical equity data from the Brazilian Stock Exchange (B3) for quantitative analysis or backtesting.
هذا المشروع هو مسار بيانات بروتوكول لتحميل وتحليل البيانات التاريخية من البورصة البرازيلية (B3) للتحليلات النوعية أو اختبار العودة
The case-locations project is designed to provide a tool for identifying and managing locations in various contexts.
هذا المشروع يستخدم FastAPI كإطار عمل، جنبا إلى جنب مع Gunicorn و Uvicorn للاستخدام في التوزيع. يعتمد على PostgreSQL كمنظومة إدارة قواعد البيانات، ويستفيد من مكتبة pandas في Python للتعامل مع البيانات. الهدف من هذا المشروع هو إنشاء أداة لإدارة المواقع بفاعلية يمكن استخدامها في تطبيقات متعددة.
This project is a production-grade data pipeline that extracts, normalizes, and structures alternative investment commitment data from U.S. public pension fund disclosures.
هذا المشروع هو خطط استخراج البيانات من الاستثمارات البديلة في التمويلات العامة للتقاعد في الولايات المتحدة. يجمع هذا الخطط البيانات من خمسة من أكبر التمويلات العامة في الولايات المتحدة، ويستخدم تقنيات محددة لاستخراج البيانات من صفحات الويب والملفات PDF. كما يقوم بتحديد الاستثمارات حسب strategie من خلال اسمها، ويتتبع كل بياناته حتى يمكن إعادة توجيهها إلى مصدرها، ويقدم تقارير جودة تشير إلى الأشكال غير المألوفة.
This project simulates and visualizes the homicidal chauffeur differential game using symbolic and numerical tools.
يُقدّم هذا المشروع محاكاة شاملة للعبة السائق القاتل، وهي لعبة تعقب‑تجنّب تقليدية في نظرية الألعاب التفاضلية. يتم استخدام الرياضيات الرمزية لاستنتاج استراتيجيات مثلى، ثم يُطبّق التكامل العددي لتوليد مسارات اللاعبين. تُعرض النتائج عبر رسومات تفاعلية تُظهر تطور السائق والفرار مع مرور الوقت، ما يتيح للمستخدمين تحليل سلوكيات اللعبة بوضوح. يُصمم النموذج ليكون سهل التعديل، بحيث يمكن للطلاب والباحثين تعديل المعلمات أو إضافة سيناريوهات جديدة داخل دفتر الملاحظات. يوفّر هذا المشروع حلاً عملياً لتعليم مفاهيم التحكم في الأنظمة الديناميكية، مع التركيز على التفاعل بين القائد والتابع. يميز المشروع بدمج الأدوات الرمزية والعددية في تجربة واحدة متكاملة، ما يجعله أداة قيمة للبحوث التعليمية والتطبيقية.
A command‑line tool that automatically crawls mobile app stores to collect user reviews for analysis.
يُعد هذا المشروع أداة سطر أوامر بسيطة تُكتب بلغة بايثون وتستعمل مكتبات Selenium وBeautifulSoup لتصفح صفحات متاجر التطبيقات وجمع مراجعات المستخدمين مع تقييماتهم وبيانات التعريف ذات الصلة. يُشغَّل من الطرفية ويقبل معلمات مثل معرّفات التطبيقات وفترات التاريخ، ثم يُخرج البيانات المُجمَّعة بصيغة JSON أو CSV لتسهيل معالجتها لاحقاً. صُمِّم لتلبية احتياجات المطورين والمسوقين والمحللين الذين يرغبون في الحصول على تعليقات فورية حول تطبيقاتهم أو تطبيقات المنافسين. يتعامل مع التصفح المتعدد الصفحات، وتحميل المحتوى الديناميكي، ويُطبِّق إجراءات بسيطة لتجاوز قيود التصفح الآلي. بفضل توفيره لبيانات مراجعات منظمة، يُمكنه دعم تحليل المشاعر، ورصد الاتجاهات، وتحديد أولويات الميزات المستقبلية.
The mrigney__weatherAnalyzer project is designed for users to analyze and visualize weather data.
هذا المشروع يستخدم مكتبات لغة بايثون مثل NumPy و Pandas و Plotly و Streamlit لإنشاء تطبيق ويب يسمح للمستخدمين إدخال وتحليل البيانات الجوية. يوفر هذا الأداة ميزات للرؤية البيانية، مما يجعل من السهل على المستخدمين فهم وتفسير البيانات. على الرغم من عدم استخدام قاعدة بيانات محددة، يعتمد المشروع على البيانات المدخلة من قبل المستخدم أو APIs خارجية للاستفادة من المعلومات الجوية.
A data pipeline that scrapes UK Companies House, enriches company records with director, financial, and contact data, and scores each company for private‑equity acquisition suitability.
يقوم النظام بجمع قوائم الشركات النشطة من واجهة برمجة تطبيقات Companies House باستخدام رموز SIC والبحث بالكلمات المفتاحية، ثم يزيل النتائج غير الصحيحة. يُثري كل سجل بمعلومات المدراء، والرسوم العامة، وإشارات قابلية الصفقة، ويقدّر الإيرادات والـEBITDA عبر نموذج ثلاثي الأبعاد. يتم استخراج معلومات الاتصال من خلال تحديد مواقع الشركات على الويب واستنتاج أنماط البريد الإلكتروني. يُصنّف النظام الشركات وفقًا لنموذج استحواذ رباعي الأبعاد يوزع الوزن على الحجم، وجاذبية السوق، وملكية، وإشارات الصفقة، ليُنتج قائمة مرتبة. تُصدر النتيجة ملف Excel مكوّن من ستة أوراق، تتضمن خط أنابيب مرتّب، وبروفايلات مفصلة، ومعلومات الاتصال بالمدراء، وتقديرات مالية، وتحليل التوسيع، وإحصاءات ملخّصة. يهدف هذا الحل إلى محللي الاستثمار الخاص وفرق تطوير الشركات الذين يبحثون عن منهجية تحليلية منهجية للعثور على أهداف استحواذ على الشركات الصغيرة والمتوسطة في المملكة المتحدة.
Titanium is a data analysis and visualization tool for web applications.
هذا المشروع يستخدم لغة بايثون لإنشاء لوحة تحكم تفاعلية للمساعدة في استكشاف البيانات وتحليلها. يعتمد على مكتبات مثل BeautifulSoup و NumPy و Pandas و SciPy و Streamlit لتقديم واجهة مستخدم سهلة الاستخدام للتحليلات البيانية. هذا الأداة مصممة لأصحاب العمل الذين يحتاجون إلى تحليل بيانات معقدة.
A tool that calculates labor market tightness metrics from vacancy and unemployment data, providing insights for economists and policymakers.
يقدم المشروع مجموعة من السكربتات التي تستورد إحصائيات الشواغر والبطالة، وتقوم بتنظيف البيانات وتحويلها، ثم تحسب مؤشرات تشديد سوق العمل. يتضمن نماذج إحصائية يمكنها التنبؤ بمستويات التشديد المستقبلية استناداً إلى الاتجاهات التاريخية. يمكن للمستخدمين تشغيل الأداة من سطر الأوامر أو استيراد الدوال في خطوط تحليلهم الخاصة. الجمهور الأساسي يتألف من الاقتصاديين المتخصصين في سوق العمل، ومحللي السياسات، والباحثين الذين يحتاجون إلى مؤشرات موثوقة لتقييم ديناميكيات القوى العاملة. من خلال أتمتة معالجة البيانات والنمذجة، يقلل المشروع الجهد اليدوي ويعزز القابلية للتكرار. كما يوضح النتائج رسومات بيانية تسهل تفسير الأنماط الزمنية بسرعة.
An OCR and retrieval pipeline that ingests large engineering PDFs into a searchable SQLite database and serves queries via an MCP server for LLM agents.
يُقدّم هذا المشروع خطاً كاملاً لمعالجة ملفات PDF الهندسية الضخمة مثل المناقصات والمواصفات. يبدأ بتقسيم المستندات الكبيرة إلى أقسام منطقية، ثم يُطبّق OCR واكتشاف التخطيط لتحويل كل قسم إلى JSON منظم. تُستخرج الجداول وتُحسّن باستخدام pdfplumber، وتُضاف بيانات التعريف التي يُستخرجها نموذج LLM عبر واجهة Anthropic. تُخزّن المحتويات الناتجة صفحةً بصفحة في قاعدة بيانات SQLite مع دعم FTS5 للبحث النصي الكامل، مع مسارات تتبع الأقسام وبيانات التعريف. يُقدّم خادم MCP أدوات للبحث والتنقل وإعادة الاستخراج، مما يمكّن وكلاء الذكاء الاصطناعي من استرجاع الأقسام ذات الصلة بسرعة.
A Python tool that automates bank statement reconciliation against internal accounting records.
تقوم هذه الأداة باستخراج بيانات كشف الحساب البنكي والسجلات المحاسبية الداخلية، ثم تطبق عمليات تطبيع وتحويل للبيانات لتسهيل المقارنة. تستخدم مكتبات معالجة البيانات القوية لتنظيف وتوحيد وتطابق المعاملات بكفاءة عالية، حتى مع مجموعات بيانات ضخمة. تُنتج تقارير مفصلة عن المطابقة، مع إبراز المعاملات غير المتطابقة أو المكررة، وتتيح تصدير النتائج إلى قاعدة بيانات PostgreSQL لتوثيق التدقيق. صممت لتلبية احتياجات فرق المالية التي ترغب في أتمتة عملية المطابقة بشكل متكرر، مع تقليل الأخطاء البشرية وتوفير الوقت. تدعم الأداة تشغيلات مجدولة ويمكن دمجها مع سير العمل الحالي عبر واجهة سطر الأوامر أو استدعاءات برمجية.
Aggregates activity logs from multiple sources into a unified format for analysis.
يعمل هذا البرنامج على جمع بيانات النشاط من مصادر متعددة وتوحيدها في تنسيق منظم واحد. يدعم تنسيقات إدخال متعددة ويمكن تكوينه لسحب السجلات من ملفات محلية، أو واجهات برمجة تطبيقات عن بُعد، أو مصادر تدفق بيانات. بعد التجميع، يُحوَّل الناتج إلى JSON أو CSV، ما يسهّل تحليله أو إعداده للتقارير. يهدف إلى مساعدة المطورين ومديري الأنظمة في مراقبة سلوك المستخدم، واستخدام النظام، ومتطلبات الامتثال، مع تقليل تعقيد التعامل مع مصادر السجلات المتعددة. يقدّم نقطة إدخال موحدة، مما يسرّع عمليات التجميع والتقارير ويقلل الأخطاء المحتملة في معالجة البيانات.
A Python-based pipeline that reproduces the quantitative findings of the "Cognitive Obesity" research study.
يُقدّم هذا المشروع سير عمل متكامل وقابل للتكرار للتحقق من النموذج التوازني المضاف المقترح في دراسة "السمنة المعرفية". يقوم بتنزيل مجموعات بيانات ضخمة ومتنوعة تلقائياً، بما في ذلك NHANES وATUS ومصادر البنك الدولي وWHO GHO وOWID، ثم يُنفّذ إحصائيات وصفية، وتحليل الارتباط، ومقارنات التأثيرات الثابتة، وتحليل الانحدار بالعتبة، واختبارات جرانجر للسببية، وفحوصات الصلابة. يُقسّم التحليل إلى ثلاثة أقسام منطقية: تقريب أولي، ودراسة لوحة على مستوى الماكرو عبر 177 دولة، وتحقق على مستوى الفرد باستخدام بيانات الاستطلاع. يمكن للباحثين تشغيل كامل السلسلة مع سطر أوامر واحد، وإنشاء جميع الرسوم البيانية والجداول، واستكشاف مُقدّرات بديلة مثل DK‑SE، واتجاهات الدول، وFD‑IV. تم تصميم المشروع لتعزيز القابلية للتكرار والشفافية في البحث العلمي في مجال العلوم الاجتماعية.
A curated SQLite database of Greek vocabulary at CEFR B1 level, including verb conjugations and word categories.
يقدّم هذا المشروع قاعدة بيانات SQLite شاملة للمفردات اليونانية المصممة لمستوى CEFR B1. تتضمن أكثر من ألفين كلمة موزعة على جميع أجزاء الكلام، مع 580 كلمة مختارة بعناية في مستوى B1 تتضمن المقالات وفئات الموضوعات وعلامات جزء الكلام. كما تتضمن القاعدة 1,592 كلمة مأخوذة من شجرة المفردات في Duolingo و2,706 إدخالًا لتصريفات الأفعال لـ153 فعلًا عبر أزمنة الحاضر والماضي والمستقبل. تم إعداد جدول للجمل المثال لتوسيع المحتوى مستقبلاً. توفر السكربتات المقدمة إمكانية إنشاء القاعدة، ملئها، والتحقق منها بسهولة، ما يجعلها جاهزة للدمج في أدوات تعلم اللغة أو مشاريع البحث.
The gridfia project provides spatial raster analysis capabilities for the USDA Forest Service's BIGMAP data.
هذا المشروع يهدف إلى تحليل الرسومات الجغرافية الموزعة على USDA Forest Service BIGMAP بيانات. يستخدم هذا الأداة لغة بايثون و مكتبات متعددة مثل matplotlib, numpy, pandas لتحليل وتحليل البيانات الجغرافية.
The michaelkurish-insta__runbot project is a personal running data pipeline that ingests workout data from multiple sources, reconciles them into a canonical SQLite database, and provides a review UI for conflict resolution and browsing.
هذا المشروع هو نظام إدارة البيانات الرياضية للجري الشامل. يجمع البيانات من مصادر متعددة مثل Apple Watch، Strava API، Garmin Connect و Runalyze، ويخزنها في قاعدة بيانات SQLite مركزية. كما يحتوي النظام على ميزات لتوحيد وتحسين البيانات، مما يوفر واجهة مراجعة للتعامل مع الصراعات والتصفح.
This project allows users to browse, retrieve, and manage SPICE kernels and metakernels from NASA and ESA mission archives.
يعد مشروع spice-kernel-db مخزن مركزي لوصول وتحكم في كرات النواة والمتاكرات SPICE. يسمح للمستخدمين بتصفح الأرشيفات المتاحة، تنزيل الكرات أو المتاكرات المحددة، وتنفيذ مهام إدارة. تركز المشروع على أرشيفات مشاريع ناسا وإسا، مما يجعلها مصدرًا قيمًا للبحوث والتنمية في مجال الفضاء.
A Python tool that simulates Schelling's segregation model and provides quantitative analysis of phase transitions, critical points, and spatial scaling.
يُقدِّم هذا المشروع تنفيذًا لنموذج سيجليينغ الكلاسيكي للتقسيم على شبكة ثنائية الأبعاد مع إضافة أدوات تحليلية متقدمة. يتم استخراج النقطة الحرجة للحدّس (T_c) عبر ضبط منحنى سيجمويد، مع توفير حدود الخطأ وفواصل الثقة. تُجرى تحليلًا لتكبير الحجم المحدود عبر أحجام شبكات مختلفة لتقدير الأسس الحرجة وتوحيد المنحنيات على منحنى موحد. كما يحسب البرنامج مسارات مسافة متعددة المقياس، ويقارن توزيع التحمّل غير المتجانس مع الحالة المتجانسة، ويُنتج مخططًا مرحليًا شاملاً عبر متغيرات التحمّل والكثافة. تُتيح النتائج للباحثين رسم خرائط بصريّة دقيقة للانتقال من الحالة المختلطة إلى الحالة المتقسّمة، مع تحليل إحصائي دقيق للحدّس والنقاط الحرجة. يدمج المشروع بين محاكاة سلوك الوكلاء، وتحليل الانتقال الطوري، وتقييم التباين المكاني، مما يوفّر منصة شاملة لدراسة الأنظمة المعقدة. يمكن للباحثين استخدام الأداة لتوليد بيانات قابلة للتكرار، وتقييم تأثيرات التحمّل المتنوع على النتيجة النهائية، وتوضيح العلاقة بين الكثافة والتقسيم.
vost is a versioned filesystem that uses bare Git repositories for storage.
يوفر vost نظام ملفات مسجلة، مما يسمح للمستخدمين بمراقبة التغييرات وتعاون على الملفات. يستخدم هذا النظام مخازن Git البسيطة كآلية تخزين أساسية. هذه الطريقة تجعل تخزين واسترجاع إصدارات الملفات فعالًا، مما يجعلها مناسبة للاستخدام في التطبيقات التي تتطلب سيطرة على الإصدارات وتوافقية الملفات.
vost is a versioned filesystem that uses bare Git repositories for storage.
هو نظام ملفات مصنف يعتمد على مستودعات Git العارية لتخزين البيانات. يوفر طريقة بسيطة لمراقبة وتتبع التغييرات في الملفات والمجلدات. صمم vost للتعامل مع الحالات التي لا تتوافق فيها نظام الملفات التقليدي، مثل الأنظمة المنقسمة أو عند التعامل مع datasets كبيرة. يستخدم المشروع Click لإدارة الواجهة السطرية.
This tool analyzes Mezmo error logs to classify new, recurring, and resolved error patterns and optionally sends a summary to Slack.
يقوم البرنامج بالاتصال بخدمة Mezmo باستخدام مفتاح الخدمة المقدم لاسترجاع سجلات الأخطاء المكررة في يوم محدد وفترة أساسية تاريخية. يتم تطبيع رسائل الأخطاء عن طريق إزالة البيانات المتغيرة مثل UUIDs، عناوين IP، الطوابع الزمنية، وأسماء الحاويات، ثم تجميعها حسب التطبيق والرسالة. تُصنَّف كل مجموعة أخطاء إلى جديدة، متكررة، أو محلولة اعتماداً على وجودها في اليوم المختار مقابل الفترة الأساسية، وتُضاف مؤشرات اتجاه للخطأ المتكرر مثل الارتفاع أو الانخفاض. تُصدر النتائج بصيغة JSON منظمة إلى مجموعة بيانات ومخزن القيم، ويمكن إرسال ملخص اختياري إلى قناة Slack. يتيح هذا الأداة لفريق التطوير مراقبة الأنماط الجديدة بسرعة، تتبع اتجاهات الأخطاء، وتبقي أصحاب المصلحة على علم بالتحولات في جودة النظام.
This project analyzes autocorrelation patterns in intraday 15-minute bars for popular stocks using Polygon.io data.
هذا المشروع يقوم بتحليل التفاعلات الذاتية في البارز الداخلية 15 دقيقة لأسهم شائعة باستخدام بيانات بوليغون.يو.، ويحسب التفاعلات المتأخرة ويتولى إنتاج الرسومات والتقارير الإحصائية. يجمع المشروع البيانات التاريخية من داخل اليوم من بوليغون.يو.، ويحسب تغييرات النسبة المئوية لكل بار، وي.export النتائج إلى صيغ CSV و Excel.
A pipeline that ingests raw materials and transforms them into refined outputs while offering a visual interface for monitoring and control.
يُعدّ Alchemical Forge نظاماً متكاملاً لمعالجة المواد الخام، حيث يستورد البيانات من مصادر متعددة—سواء كانت ملفات، أو تدفقات، أو أنظمة أخرى—ويحولها عبر سلسلة قابلة للتكوين من التحولات. يعتمد المحرك الأساسي على لغة بايثون مع سكربتات باش لتنسيق العمليات، ما يتيح دمجه بسهولة في سير العمل الحالي. يوفّر النظام واجهة بصرية جذابة تُعرف بالنظام العصبي الجمالي، تعرض حالة كل مرحلة في الوقت الحقيقي، وتُظهر تنبيهات عند حدوث أخطاء، وتسمح بالتحكم اليدوي عند الحاجة. يهدف هذا الحل إلى تقليل الجهد اليدوي وتعزيز تتبع العمليات، ما يتيح للفرق التركيز على استخراج القيمة من المواد الخام. بفضل تبسيط نقل البيانات ومعالجتها، يُسهم في تحسين الكفاءة والموثوقية في بيئات الإنتاج المتنوعة.
A replication package that reproduces the tables and figures of a study on how human capital investment affects economic growth and poverty.
يُقدِّم هذا الحزمة جميع البيانات والبرامج النصية في برنامج ستاتا اللازمة لإعادة إنتاج النتائج التجريبية لدراسة تبحث في تأثير الاستثمار في الصحة والتعليم والحد من التوقف في النمو على النتائج الاقتصادية على المدى الطويل. يتضمن نموذج محاكاة معقَّد يقدِّر اتجاهات النمو والفقر على مدى 50 سنة لعدد 157 دولة، مقسمة حسب مجموعات الدخل وفق البنك الدولي. يمكن للمستخدمين تشغيل برنامج نصي رئيسي واحد يضبط المسارات، ويحمِّل حزم ستاتا المضمنة، ويُنفِّذ سلسلة التحليل، ويُنتج الرسوم البيانية والبيانات الوسيطة. كما يتضمن الحزمة برنامجاً منفصلاً لتحليل مشاركة القوى العاملة يجب تشغيله في جلسة نظيفة. يمكن للباحثين تعديل بيانات الإدخال أو توسيع المحاكاة لتشمل دولاً جديدة أو سيناريوهات سياساتية.
This project provides a tool for screening and evaluating investment opportunities.
هذا المشروع يقدم أداة لمراجعة و تقييم فرص الاستثمار. يعتمد على لغة البرمجة Python و يستخدم مكتبات مثل Matplotlib, NumPy, و Pandas للتعامل مع البيانات و الرسومات. يمكن استخدام الأداة من قبل المستثمرين الفرديين أو المحترفين الماليين الذين يبحثون عن تسهيل عملية البحث الاستثماري.
A Python tool for estimating the physical parameters of gravitational wave sources.
يُعَدّ هذا البرنامج أداةً برمجية متخصصة في تحليل بيانات الموجات الجاذبية لاستخلاص معلمات المصدر الفيزيائية مثل الكتل والدوارات وموقع السماء. يعتمد على مكتبات عددية قوية لتطابق نماذج الموجات مع الإشارات المُلاحَظة، ويُنتِج توزيعات لاحتمالية لاحقة للمعلمات. يتضمن سير العمل استيراد البيانات، ومعالجتها، وتقييم الاحتمالية، وتوليد العينات عبر خوارزمية ماركوف-تشين مونت كارلو. صُمم هذا البرنامج خصيصاً للباحثين في الفيزياء الفلكية وعلم الموجات الجاذبية، لتسهيل سير العمل وتحسين كفاءة التحليل. يُقدّم النتائج بصيغة رسومية عالية الجودة، مع إمكانية حفظها في تنسيقات علمية قياسية للمتابعة. يميز هذا الحل بقدرته على دمج خطوات التحليل المتعددة في واجهة واحدة، مما يقلل الحاجة إلى أدوات متعددة ويُسرّع عملية الاستخلاص.
This project is a trading analyzer for users to analyze and understand their trades.
هذا المشروع هو محلل للتجارة للمستخدمين لتحليل وتفهم تجارتهم. يعتبر هذا الأداة مصممة لمساعدة المستخدمين على تحليل وتحديد نمطات وتنبؤات في البيانات، مما يساعد على اتخاذ قرارات استثمار أفضل. تتركز الوظيفة الرئيسية للمشروع حول تحليل البيانات والتصوير، مما يسمح للمستخدمين فهم أعمق لنشاطاتهم الاستثمارية.
A Python library that predicts vertical ground reaction force curves from triaxial accelerometer signals using functional principal component analysis and a lightweight neural network, enabling force‑plate quality biomechanical metrics from a single wearable sensor.
يقدم الحزمة مساراً كاملاً لتحويل بيانات التسارع ثلاثية المحاور التي تُجمع أثناء القفزات المتحركة إلى منحنيات القوة الأرضية الرأسية (vGRF). يستخدم تحليل المكوّنات الرئيسية الوظيفية (FPCA) لتقليل كل من الإشارات الداخلة والخارجة إلى متجهات درجات منخفضة الأبعاد، ثم يُدرّب شبكة عصبية بسيطة ذات طبقة مخفية واحدة لتعلم العلاقة بينهما. يمكن للنموذج الناتج التنبؤ بارتفاع القفز، والقوة القصوى، وموجات القوة الكاملة بدقة عالية، مع مطابقة معايير جودة مكابح القوة مع استخدام مستشعر قابل للارتداء واحد فقط. تتضمن المكتبة أدوات لتحميل البيانات، ومعالجتها، وتصويرها، وتقييمها، مما يجعلها مناسبة للبحوث وتحليل الأداء في الميدان. تُظهر الدراسة أن تمثيل الإشارة بعناية يمكن أن يتفوق على هياكل معمارية أكثر تعقيداً مثل المحولات، مما يبرز أهمية هندسة الميزات في مهام التنبؤ الحركي.