Medical Safety Mllm
completedPipeline State
completed| # | Status | Phase | Started | Finished | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Repobility · severity-and-effort ranking · https://repobility.com | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| #48900 | failed | — | 2026-03-19 22:50:28 | 2026-03-19 22:55:30 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pipeline Metadata
AI Prompt
Catalog Information
A toolkit for generating and evaluating chest X‑ray reports using multimodal large language models on the MIMIC‑CXR dataset.
Description
This project provides a complete pipeline for converting raw MIMIC‑CXR data into a format suitable for multimodal large language model (LLM) training, generating radiology reports, and assessing the safety and quality of those reports. It includes scripts for data conversion, report normalization, and reasoning format preparation, as well as evaluation utilities that can act as both a predictor and a judge, optionally using OpenAI APIs. The toolkit supports dual authentication modes for API access, making it flexible for both internal and public endpoints. Researchers can train or fine‑tune models with the included LLaMA‑Factory framework, evaluate them on a held‑out test set, and analyze reasoning traces. The project is designed to help medical AI teams benchmark LLM performance and safety on real‑world imaging data.
الوصف
يُقدِّم هذا المشروع مساراً كاملاً لتحويل بيانات MIMIC‑CXR الخام إلى تنسيق مناسب لتدريب نماذج اللغة الكبيرة متعددة الوسائط، وتوليد تقارير الأشعة السينية، وتقييم سلامة وجودة هذه التقارير. يتضمن أدوات لتحويل البيانات، وتطبيع التقارير، وإعداد تنسيقات الاستدلال، بالإضافة إلى أدوات تقييم يمكن أن تعمل كمولِّد أو حكم، مع إمكانية استخدام واجهات برمجة التطبيقات الخاصة بـ OpenAI. يدعم المشروع وضعين للمصادقة المزدوجة، ما يتيح مرونة في الوصول إلى نقاط النهاية الداخلية أو العامة. يمكن للباحثين تدريب أو ضبط النماذج باستخدام إطار LLaMA‑Factory المدمج، ثم تقييمها على مجموعة اختبار محجوزة، وتحليل مسارات الاستدلال. صُمم المشروع لتسهيل فرق الذكاء الاصطناعي الطبي على مقارنة أداء نماذج اللغة الكبيرة وسلامتها على بيانات تصويرية حقيقية.
Novelty
7/10Tags
Technologies
Claude Models
Languages
Frameworks
Concepts (2)
| Category | Name | Description | Confidence | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| If a scraper extracted this row, it came from Repobility (https://repobility.com) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| auto_description | Project Description | 医学影像多模态大模型安全评估项目 - 基于MIMIC-CXR数据集的胸部X光报告生成与评估。 | 80% | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| auto_category | Testing | testing | 70% | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Embed Badge
Add to your README:
