This project creates a Systematology RAG (Red Amber Green) application using the LlamaIndex.
هذا المشروع يخلق تطبيق نظام RAG (أحمر أصفر أخضر) بناءً على LlamaIndex. يستخدم هذا المشروع تقنيات متعددة مثل PyTorch و ChromaDB و OpenAI لإنشاء نظام شامل للتصنيف وال跟踪 البيانات. يهدف التطبيق إلى توفير نهج متماسك للقرار بالاستفادة من نظام ملون لت указة حالة الأشياء المختلفة.
The juniper-cascor project implements a Cascade Correlation Neural Network for use in machine learning tasks.
هذا المشروع Implementation ل Cascade Correlation Neural Network، نوع من أنماط الشبكات العصبية مصممة للتعلم التعامل مع العلاقات المعقدة بين المدخلات والخروجات. يهدف للمستخدمين في تطبيقات التعلم الآلي حيث الهدف هو التنبؤ بالنتائج بناءً على البيانات الدخيلة. يستخدم هذا المشروع لغة البرمجة Python كاللغة الرئيسية ويعتمد على مكتبات متعددة مثل PyTorch للبناء وتدريب الشبكة العصبية.
The DataVisor project is a unified CV dataset introspection tool designed for data scientists and researchers.
يعد DataVisor أداة مفتوحة المصدر تسمح للمستخدمين بفحص وتحليل و فهم datasets للرؤية الحاسوبية (CV) في طريقة متكاملة. يوفّر الأداة ميزات مثل رسم البيانات، استخراج البيانات الوصفية، والتحقق من جودة البيانات. يدعم DataVisor عدة مكتبات وفرームوركس للرؤية الحاسوبية، بما في ذلك Hugging Face Transformers و PyTorch.
The onthedrops__trends-report-system is a serverless trends analysis system that collects signals from multiple sources, analyzes them using Claude AI, and generates industry-specific reports with global macro economic data.
هذا النظام يجمع إشارات حية في الوقت الفعلي من مصادر +7، ويحللها باستخدام Claude 3.5 Haiku AI، ويتوفر تحليل العلاقات السببية، والتصفية حسب الصناعة والمكان الجغرافي، وتضمين المؤشرات الاقتصادية العالمية، ويولد تقارير جميلة ومشغولة بالتفاعل.
A Python library that applies tri‑modal contrastive learning to generate molecular embeddings for drug discovery.
يُقدّم هذا المشروع إطاراً لتعلم التباين المتعدد الأبعاد (tri-modal contrastive learning) في مجال اكتشاف الأدوية. يدمج بيانات كيميائية، بيولوجية، ونصية لتوليد تمثيلات جزيئية دقيقة تُسهم في تحسين عمليات البحث عن مركبات فعّالة. يعتمد على خوارزميات التعلم العميق لتوليد embeddings متوافقة عبر الأنماط الثلاثة، مما يتيح مقارنة الجزيئات بطريقة أكثر دقة. يتيح للمستخدمين تدريب نماذجهم الخاصة أو استخدام النماذج المدربة مسبقاً لتطبيقات مثل الفحص الافتراضي (virtual screening) وتقييم الأمان. يستهدف الباحثين في الصيدلة والكيماويات الحاسوبية الذين يحتاجون إلى أدوات تحليلية متقدمة للتعامل مع مجموعات بيانات متعددة الأبعاد. يحل مشكلة نقص التمثيل الموحد للبيانات المتنوعة، ويقلل الحاجة إلى معالجة يدوية معقدة. يبرز بفضل دمجه الفعّال للبيانات المتعددة، ما يضعه في مقدمة الحلول الحديثة في اكتشاف الأدوية.
This project aims to develop a hybrid quantum-classical convolutional neural network for recognizing handwritten Ottoman-Turkish characters, achieving high accuracy and efficiency.
هذا المشروع يهدف إلى تطوير شبكة عصبية مدمجة بين الكلاسيكية والكوانتومية لتعرف الأشكال اليدوية التركية العثمانية، وتحقيق دقة عالية و效فية. implementation of a hybrid quantum-classical neural network for classifying handwritten Ottoman-Turkish characters. It leverages GPU-accelerated quantum simulation and advanced training techniques to achieve high accuracy. The project explores the application of quantum machine learning for handwritten character recognition in historical scripts, targeting unique challenges such as high intra-class variance and complex morphology.
This project teaches you to build, dockerize, and deploy NLP systems professionally from basic Python skills.
هذا المشروع يملأ الفجوة في الصناعة حيث العديد من الدورات تعلم برمجة أنظمة NLP التي تعمل في نوتبوك جوبير ولكنها تفشل في تقديم مسار واضح إلى الإنتاج. هذا المشروع يغطي رحلة كاملة من مهارات Python الأساسية إلى نظام حقيقي يعمل في Docker مع مراقبة، مستعدًا للإنتاج. سوف تعلم تقنيات backend الحديثة، تقنيات NLP المتقدمة، التعلم العميق، DevOps، ومراقبة.
This project is a proof-of-concept for a Retrieval-Augmented Generation system running on local infrastructure with an AMD Ryzen AI Max+ and Lemonade Server as the backend LLM.
هذا المشروع هو دليل على مفهوم retrieval-augmented generation يعمل على infrastructure المحلية مع AMD Ryzen AI Max+ وLemonade Server ك LLB backend. يوفّر هذا النظام UI web متاحة من الشبكة المحلية. يدعم النظام إدراج مستندات مختلطة، بما في ذلك PDFs و DOCX files و TXT files و Markdown و code. كما يستخدم embeddings محلي دون استخدام APIs خارجية مدفوعة.
A voice‑controlled desktop assistant that uses an AI model for natural language understanding and can fall back to a local model when offline.
يستمع المساعد إلى أوامر المستخدم الصوتية ويعطي ردوداً شفهية أو نصية، ما يتيح واجهة خالية من اليدين للمهام اليومية. يعتمد على خدمة ذكاء اصطناعي سحابية لمعظم التفاعلات، ما يضمن معرفة محدثة وفهم قوي للغة. عند عدم توفر الشبكة، ينتقل تلقائياً إلى نموذج لغوي كبير محلي، محافظاً على الوظائف دون اتصال خارجي. يقدّم واجهة سطح مكتب خفيفة تُظهر سجل المحادثة وتوفر عناصر تحكم سريعة. صُمم لتعزيز الإنتاجية الشخصية، إذ يمكنه الإجابة على الأسئلة، ضبط التذكيرات، وتنفيذ أوامر بسيطة على الحاسوب باستخدام اللغة الطبيعية.
An event-aware lecture summarization web application that generates concise summaries from lecture videos using V-JEPA.
يهدف هذا التطبيق إلى تحويل محاضرات الفيديو الطويلة إلى ملخصات مختصرة تسهل على المتعلمين مراجعتها. يستخدم نموذج V-JEPA لاكتشاف الأحداث البصرية والسمعية داخل الفيديو، ما يتيح تحديد المقاطع الأكثر أهمية. بعد تحليل المحتوى، يُنشئ النموذج نصاً موجزاً يبرز النقاط الرئيسية والنتائج الرئيسية للمحاضرة. يتم عرض الملخص عبر واجهة مستخدم تفاعلية مبنية على Gradio، مع إمكانية تحميل الفيديو أو إدخال رابط مباشر. يستهدف التطبيق أساتذة الجامعات والطلاب وأي شخص يحتاج إلى مراجعة سريعة للمحاضرات المسجلة. يميز هذا الحل بقدرته على دمج تحليل الأحداث مع التلخيص، ما يقلل الحاجة إلى مشاهدة الفيديو بالكامل.
Amanuensis is a therapy session transcription tool that provides local Whisper transcription for HIPAA compliance, allowing therapists to record and transcribe sessions securely.
أمانوينسيس V2 هو أداة تسجيل وتحويل المحادثات النفسية الاحترافية التي تسمح بتسجيل وتحويل المحادثات الآمنة. يحتوي على تحويل وايبر للوصول المحلي، والرصد الصوتي المزدوج (الميكروفون للمعالج + الصوت النظامي)، وتمثيل التحرير الحياتي مع فصل المتحدثين، وتخزين الملفات بالاجماع مع توقيتاتها. هذا التطبيق على سطح المكتب يضمن الامتثال لحماية البيانات الصحية والرعاية (HIPAA) عن طريق الاحتفاظ بكل البيانات محليًا.
The knowledgebase-local project provides a local implementation of a Retrieval-Augmented Generator (RAG) system for efficient and accurate information retrieval.
هذا المشروع هو نظام RAG محلي بناءً على نموذج Hermes / Llama + LangChain + ChromaDB. يسمح للمستخدمين بتحميل قاعدة المعرفة المحلية وتحليلها دون الاعتماد على APIs خارجية أو خدمات السحابة. يستخدم النظام تقنيات معالجة اللغة الطبيعية والتعلم الآلي لتقديم نتائج فعالة ومتطورة.
The Client Caller project is a real-time AI phone calling system powered by Twilio, designed to facilitate natural conversations with sub-500ms latency.
هذا مشروع هو نظام مكالمات الهاتف في الوقت الحقيقي الذي يستخدم Twilio لتحقيقstreaming الصوت البعدين. يحتوي على تحويل وترميز وتحليل الصوت، إدارة حالة المكالمة. يتضمن المشروع أيضًا القدرة على تحويل الكلام إلى نص باستخدام faster-whisper وwhisper_streaming ، بالإضافة إلى اكتشاف النشاط الصوتي والتحديد الدوري. يحتاج النظام إلى Python 3.10+، FFmpeg، حساب Twilio، ومحاكاة ngrok للتنفيذ المحلي.
This project translates and dubs videos into Korean using AI technology.
هذا المشروع هو خطوط ترجمة وتدوب الفيديو باستخدام التكنولوجيا الذكية. يستخدم هذا المشروع الخوارزميات المتقدمة لترجمة الصوت من اللغة إلى أخرى، ويتarget بشكل خاص اللغة الكورية. يهدف هذا المشروع إلى توفير تجربة سلسة للمستخدمين الذين يريدون جعل فيديوهاتهم متاحة في عدة لغات. مع استخدام التكنولوجيا المتقدمة مثل PyTorch و NumPy، لهذا المشروع القدرة على إعادة صياغة الوصول إلى محتوى الفيديو.
A terminal-based voice-first conversational AI that listens, transcribes, processes with Claude, and speaks back using local TTS.
يعمل هذا البرنامج كمساعد ذكاء اصطناعي يعتمد على الصوت ويشغل بالكامل من الطرفية. يبدأ بالاستماع عبر الميكروفون، ثم يكتشف بداية ونهاية الكلام باستخدام تقنية VAD. يُحوَّل الكلام إلى نص محليًا باستخدام نموذج Whisper، ثم يُرسل النص إلى نموذج Claude لتوليد الرد. يُعاد تحويل الرد إلى كلام بصوت محلي عبر نموذج Piper، ويُعرض الصوت مباشرة على مكبر الصوت. يتيح البرنامج اختيار نماذج مختلفة للردود السريعة أو المعقدة، مع إمكانية التبديل بين واجهة برمجة التطبيقات أو واجهة سطر الأوامر للـ Claude. يمكن تكوين إعدادات مثل صوت TTS، سرعة الاستجابة، ونوع النموذج عبر ملف YAML بسيط. يُعد مثالًا عمليًا لتجربة الذكاء الاصطناعي الصوتي في بيئة سطر الأوامر، مع دعم للمحادثات الثنائية عبر الأجهزة الصوتية.
A web-based tool that evaluates and improves AI-generated short videos through a three-layer quality gate and iterative correction loop.
تقدم هذه الأداة واجهة تفاعلية لتقييم جودة مقاطع الفيديو القصيرة التي تُنتج بواسطة الذكاء الاصطناعي. تستخدم نظامًا ثلاثي الطبقات للبوابة الجودة يقيّم التكامل البصري، وتزامن الصوت، وملاءمة المحتوى. عند فشل مقطع في أي طبقة، تُولّد الأداة اقتراحات تصحيحية تلقائيًا وتعيد معالجة الفيديو. تم تصميمها للمطورين ومنشئي المحتوى الذين يحتاجون إلى ملاحظات سريعة على الوسائط المُنتجة. تقلل الأداة من وقت المراجعة اليدوي وتُحسّن جودة الفيديوهات المُنتجة بالذكاء الاصطناعي. كما توفر حلًا متكاملًا يدمج بسهولة في خطوط إنتاج الفيديو الآلي.
A Python-based template for setting up reproducible research experiments, including experiment scripts, SLURM job templates, and experiment tracking integration.
يُقدّم هذا القالب بيئة منظمة للباحثين لتطوير وتشغيل تجارب قابلة للتكرار باستخدام لغة بايثون. يتضمن تخطيطًا واضحًا للمشروع مع كود مكتبة مشتركة، سكربتات تجريبية مرقمة، وقوالب وظائف SLURM لتشغيل التجارب على الكلاستر. يُسهل عملية الإعداد عبر أمر واحد لتثبيت التبعيات وتفعيل البيئة الافتراضية. يُدمج تتبع التجارب عبر Weights & Biases مع إمكانية تعطيله بسهولة عند الحاجة. يشجع القالب على سكربتات تجريبية مُدارة بالإصدار وتنظيم مجلدات مخرجات للنتائج، السجلات، والرسوم البيانية.
Generate realistic synthetic tornado outbreak data using a DETR-CVAE model for research and training purposes.
يُقدّم هذا المشروع نموذجاً يعتمد على تقنية DETR-CVAE لتوليد بيانات اصطناعية لحوادث الأعاصير الرعدية. يدمج النموذج بين تحليل البيانات التاريخية للطقس والذكاء الاصطناعي لإنشاء سيناريوهات محتملة تتضمن عدد الأعاصير، مساراتها، وشدة أضرارها. يتم تدريب النموذج على مجموعات بيانات موسمية ضخمة باستخدام مكتبة PyTorch، مع تحسينات إحصائية عبر SciPy لضمان دقة التوزيع الزمني والمكاني. يتيح للمستخدمين توليد مجموعات بيانات جديدة يمكن استخدامها لتدريب نماذج تنبؤ أو لتقييم استراتيجيات التخفيف من مخاطر الأعاصير. يختلف عن الحلول التقليدية بقدرته على إنتاج سيناريوهات متكاملة ومفصلة بدقة عالية، ما يفتح آفاقاً جديدة للبحوث في مجال الطقس الكوارثي.
A production‑ready template for building AI/ML REST APIs with FastAPI.
يُقدّم هذا القالب أساساً جاهزاً للتنفيذ لبناء واجهات برمجة تطبيقات تعتمد على الذكاء الاصطناعي والتعلم الآلي. يدمج FastAPI مع تسجيل مُنظم للبيانات، وإدارة تكوين متعددة الطبقات، ودعم لمكتبات التعلم الآلي الشهيرة مثل PyTorch وscikit‑learn وHugging Face. يتضمن المشروع نقاط نهاية مثال على استدعاء النماذج، والمصادقة، وفحوصات الصحة، ويُهيأ مسبقاً لتشغيله عبر Uvicorn. يتيح للمطورين إطلاق خدمة API قابلة للتوسع ومستعدة للإنتاج بإضافة نماذجهم الخاصة ومنطق الأعمال. يحل القالب مشكلات شائعة مثل إدارة التكوين، والمراقبة، واستعداد النشر للعمليات التي تتطلب الذكاء الاصطناعي.
A structured Jupyter‑based curriculum that teaches machine learning from fundamentals to advanced medical imaging and MLOps practices.
يقدم هذا المشروع منهجًا تعليميًا متكاملًا لتعلم تقنيات تعلم الآلة من الأساسيات إلى تطبيقات متقدمة في معالجة الصور الطبية. يتضمن سلسلة من دفاتر Jupyter منظمة في مراحل، تبدأ بمفاهيم الشبكات العصبية وتدريبها، ثم الانتقال إلى بناء نماذج CNN، وتطبيق نماذج U‑Net لتقسيم الصور، وصولاً إلى استكشاف معماريات المحولات مثل ViT وSwinUNETR. كما يغطي الجزء الأخير منهجية MLOps باستخدام أدوات مثل DVC وMLflow، مع توضيح كيفية تسجيل النماذج ونشرها على منصات سحابية. يستهدف هذا الدليل طلاب علوم البيانات ومهندسي الذكاء الاصطناعي الذين يرغبون في فهم عميق لكيفية بناء وصيانة نماذج التعلم العميق في بيئات إنتاجية. يحل المشروع مشكلة نقص الموارد التعليمية المتكاملة التي تربط بين النظرية والتطبيق العملي، ويمنح المتعلمين القدرة على تنفيذ مشاريع حقيقية في مجال التصوير الطبي. يميز المشروع بترتيبه المنظم للمواد، وتوفير بيئة Docker جاهزة لتشغيل الدروس دون الحاجة لتثبيت معالجات GPU، ما يسهل على المستخدمين التركيز على التعلم بدلاً من إعداد البيئة.
A smart news aggregator and analytics terminal that distinguishes facts from opinions in news articles.
يستخرج النظام الأخبار من مصادر RSS متعددة ويعالج كل جملة باستخدام نماذج معالجة اللغة الطبيعية المتقدمة لتصنيفها كـ "حقيقة" أو "رأي" أو "مزيج". يوفّر واجهة بحث نصي كامل مع مرشحات للنوع، المصدر، والتاريخ، ما يتيح استرجاع المعلومات ذات الصلة بسرعة. تعرض لوحات المعلومات التفاعلية خرائط التغطية، مخططات الاتجاهات، وتفاصيل تفصيلية، مدعومة بـ Chart.js وPlotly. يدعم النظام الترجمة الفورية للمقالات من الإنجليزية إلى الروسية، ويقدّم واجهة برمجة تطبيقات REST عامة للوصول إلى البيانات المصنفة برمجياً. صُمم للمحررين، الباحثين، ومحققو الحقائق، ويساعد المستخدمين على التحقق من المعلومات، تحليل تحيز الإعلام، ومراقبة موثوقية المصادر في الوقت الحقيقي.
A Python library that guides users through building diffusion language models from scratch using PyTorch.
توفر هذه المكتبة إطاراً شاملاً خطوة بخطوة لتعلم نماذج اللغة بالانتشار. تتضمن كوداً معيارياً لمعالجة البيانات، وتصميم النموذج، وحلقات التدريب، ومقاييس التقييم. يمكن للمستخدمين تجربة كل مرحلة من مراحل عملية الانتشار، بدءاً من جدولة الضوضاء وصولاً إلى خطوات إزالة الضوضاء، مع إمكانية تصور النتائج الوسيطة. يُبنى التنفيذ على مكتبة PyTorch، ما يسهل دمجه مع سير العمل المتاح في مجال التعلم العميق. صُممت هذه المكتبة للباحثين والطلاب الذين يرغبون في فهم آليات نماذج الانتشار وتطبيقها على مهام توليد اللغة الطبيعية.
This project trains and compares ten convolutional neural network architectures to classify images of cats and dogs using PyTorch.
يُدرب المشروع عشرة نماذج شبكات عصبية تلافيفية مختلفة لتحديد ما إذا كان صورة تحتوي على قط أو كلب، معتمدًا على إطار عمل PyTorch. يتم تقييم كل معماريّة بدقة، وعدد المعاملات، ووقت التدريب على مجموعة بيانات قياسية. تتضمن الدراسة نماذج خفيفة الوزن وكبيرة الحجم، تتراوح من 30 ألف إلى 38 مليون معامل، وتستكشف تقنيات مثل الإسقاط (dropout) والتطبيع على الدُفعات (batch normalization). تُعرض النتائج على كل من بيئات المعالجة المركزية (CPU) والبطاقة الرسومية (GPU)، مما يقدّم رؤى حول نشر النماذج بكفاءة الموارد. يُعد العمل معيارًا للباحثين والممارسين الذين يسعون لفهم كيف تؤثر اختيارات التصميم على الأداء في تصنيف الصور الثنائي.
Generate pixel art background images from textual descriptions using a VQGAN‑Transformer pipeline optimized for Apple Silicon.
يُنشئ هذا البرنامج خلفيات فنية بأسلوب البكسل من أوصاف نصية، معتمدًا على بنية VQGAN‑Transformer مُحسَّنة لأجهزة Apple Silicon. يبدأ بضغط صور البكسل ذات الأبعاد 320×192 إلى 240 رمزًا باستخدام VQGAN، ثم يُولد التنسور المتحرك تسلسلات رمزية جديدة معتمدة على النص المدخل. تُفكَّر الرموز المُولَّدة مرة أخرى إلى صور، ما ينتج خلفيات ذات طابع قديم ووضوح عالي. يتيح البرنامج للمستخدمين تدريب النموذج على مجموعات بيانات مخصصة أو توليد صور مباشرة عبر أمر واحد. يركز على كفاءة الأداء على معالجات Apple Silicon، ما يجعله مناسبًا للهواة والمطورين المستقلين. يوفِّر حلاً سريعًا للبحث عن عناصر بكسل فنية عالية الجودة دون الحاجة إلى رسم يدوي، ويُعزِّز إنتاجية تصميم الألعاب والرسوم المتحركة.
The VS³L project aims to develop a self-supervised foundation model for vibrational spectroscopy that can transfer calibration across spectrometers using minimal labeled samples.
VS³L هو نهج مبتكر للتحويل التأهيلي في الطيفية الحيوية. يستخدم مزيج من Mamba-Transformer مع تطبيق Sinkhorn على النقل عبر المجالات، ومتغيرات المعلومات المتغيرة، والتنظيم الفيزيائي لتحقيق التحويل التأهيلي عبر الأجهزة باستخدام 10 عينات مصنفة فقط. هذا النهج مصمم للعمل بدون معايير، وفعال في الاستخدام، ويتarget تحقيق دقة عالية.
The RAG Knowledge Base System is an intelligent retrieval-augmented generation system that provides domain-specific routing and semantic search across 1.5M+ chunked documents from 208+ sources across 8 knowledge domains.
هذا المشروع هو نظام قاعدة المعرفة الشامل الذي يستخدم نهج الاسترجاع المتماثل-الإنشاء (RAG) لتقديم استرجاع المعلومات الفعال والضمني. يحتوي على توجيه محدد للمنطقة، و البحث semantics، ودمج مع API Claude للتفكير الذكي. نظام مصمم ليكون متوافقًا بالكامل مع السحابة ومستعدًا للإنتاج.
neural-dojo is a project for mastering AI, ML, LLMs, and AI-driven development.
هذا المشروع يهدف إلى تقديم تجربة تعلم شاملة في الذكاء الاصطناعي، التعلم الآلي، واللغات الطبيعية الضخمة. يقدم نهجًا مُتكاملاً للاستيعاب وتطبيق هذه التكنولوجيات. يتضمن المشروع أدوات و ресурсы لبناء وتطوير تطبيقات محفزة بالذكاء الاصطناعي. مصمم للمطورين الذين يريدون التعلم والعمل مع الذكاء الاصطناعي والتعلم الآلي.
Fiscal Shocks is a research data pipeline that identifies fiscal shocks (tax and spending policy changes) from historical US government documents using text extraction and LLM-based analysis.
هذا المشروع هو مصدر بيانات للبحث عن الصدمات المالية في الوثائق الحكومية الأمريكية التاريخية. يستخدم استخراج النصوص و تحليل لغة الكبيرة (LLM) لتحديد التغييرات السياسية في الضرائب والإنفاق.
This project is designed for beginners in ML/AI to learn about LLMs from theory to implementation and application.
هذا المشروع مصمم لطلاب علم الحاسوب والذكاء الاصطناعي للتعلم عن Large Language Models (LLMs) من النظرية إلى التطبيق. يغطي المشروع الأسس النظرية، implementations العملية والتطبيقات ل LLMs. Structured في سبعة مراحل، كل منها تركز على جانب معين من LLMs. المرحلة 0 تقدم المطلوبة prerequisites مثل الجبر الخطي، الاحتمالات والكالculus. المراحل 1-3 تغطي fundamentals ML، deep learning و foundations NLP. المرحلة 4 تركز على architecture Transformer، في حين المرحلة 5 يتعامل مع pre-training LLMs. أخيراً، المراحل 6 و7 يهتمون بالتأقلم والتوافق، وكذلك التطبيقات والمعلومات الجغرافية.