Tgprediction
C 65 completedPipeline State
completedPipeline Metadata
AI Prompt
Catalog Information
This project predicts the glass transition temperature of polymers, including nucleic acid-based polymers, using machine learning models for researchers and material scientists.
Description
The system integrates a large curated dataset of over 22,000 polymer glass transition temperatures and applies multi‑level feature engineering to extract 34 physicochemical descriptors from SMILES representations. A gradient‑boosted regression model, trained on both high‑quality baseline data and a transfer‑learning bridge set of hydrogen‑bonding polymers, delivers end‑to‑end predictions directly from DNA or RNA sequences. Users can interactively input sequences or run batch predictions via a command‑line interface, receiving Tg estimates along with confidence scores. The tool also provides SHAP‑based feature importance visualizations and supports exporting results in JSON for downstream workflows. Designed for polymer scientists and materials researchers, it accelerates the discovery of high‑performance polymers and aids in selecting materials for temperature‑critical applications.
الوصف
يُدمج النظام مجموعة بيانات ضخمة تضم أكثر من 22,000 قيمة لدرجة انتقال التموج للبوليمرات، ويُطبّق هندسة ميزات متعددة المستويات لاستخراج 34 وصفًا فيزيكوكيميائيًا من تمثيلات SMILES. يُستخدم نموذج انحدار تعزيز متدرج، مدرب على بيانات أساسية عالية الجودة ومجموعة جسرية من البوليمرات التي تتفاعل مع الروابط الهيدروجينية، لتقديم تنبؤات شاملة مباشرة من تسلسلات DNA أو RNA. يمكن للمستخدمين إدخال التسلسلات بشكل تفاعلي أو تشغيل تنبؤات دفعة عبر واجهة سطر أوامر، مع الحصول على تقديرات Tg مع درجات ثقة. كما يوفر الأداة تصورات أهمية الميزات باستخدام SHAP، ويتيح تصدير النتائج بصيغة JSON لتكاملها مع سير العمل. صُمم خصيصًا لعلماء البوليمرات والباحثين في مجال المواد، ويسرّع اكتشاف البوليمرات عالية الأداء ويساعد في اختيار المواد للتطبيقات الحرارية الحساسة.
Novelty
7/10Tags
Technologies
Claude Models
Quality Score
Strengths
- Good test coverage (31% test-to-source ratio)
- Consistent naming conventions (snake_case)
Weaknesses
- No LICENSE file \u2014 legal ambiguity for contributors
- No CI/CD configuration \u2014 manual testing and deployment
- 2046 duplicate lines detected \u2014 consider DRY refactoring
- 7 'god files' with >500 LOC need decomposition
Recommendations
- Set up CI/CD (GitHub Actions recommended) to automate testing and deployment
- Add a linter configuration to enforce code style consistency
- Add a LICENSE file (MIT recommended for open source)
Security & Health
Languages
Frameworks
Concepts (2)
| Category | Name | Description | Confidence | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Repobility · code-quality intelligence · https://repobility.com | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| auto_description | Project Description | 同济大学 SITP(大学生创新训练计划)项目 —— 基于机器学习的聚合物玻璃化转变温度 (Tg) 预测,支持从核酸序列端到端预测 Tg。 | 80% | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| auto_category | Data/ML | data-ml | 70% | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Embed Badge
Add to your README:
