فهم الفروقات الجوهرية بين نماذج جوجل المفتوحة وكيفية اختيار الإصدار المناسب لمشروع ONYX.
هذا النموذج "مدرب على التعليمات". هو الخيار المثالي للدردشة (Chatting)، الإجابة على الأسئلة، وتلخيص النصوص. يفهم لغة الحوار البشري بشكل ممتاز.
هذا هو "النموذج الخام". تم تدريبه على كميات هائلة من البيانات لكنه لا يعرف كيف "يحاور". وظيفته الأساسية هي إكمال النص.
للحصول على أفضل سرعة استجابة (Tokens Per Second)، يُنصح بمعالجات حديثة تدعم تقنيات AVX2 أو AVX-512. التكوين المثالي يتطلب ما لا يقل عن 8 إلى 12 نواة حقيقية، مع تردد مرتفع (Boost Clock) لضمان معالجة سريعة لعمليات الـ Prompt Processing، خاصة عند التشغيل على توزيعات Linux المتقدمة مثل Fedora التي تستفيد من إدارة الذاكرة بكفاءة عالية.
| نوع التكميم (Quantization) | الحد الأدنى للرامات | الاستخدام الموصى به |
|---|---|---|
| FP16 (بدون ضغط) | ~9 GB | سيرفرات قوية أو كروت شاشة احترافية |
| 4-bit (مضغوط) | ~4-5 GB | مثالي لجهازك (أفضل أداء) |
| 8-bit | ~6 GB | دقة أعلى قليلاً مع استهلاك متزايد |
نصيحة تقنية: عند النشر النهائي، تأكدي من ضبط `n_ctx` (حجم السياق) ليتناسب مع الرامات المتاحة لضمان عدم حدوث Crash أثناء المحادثات الطويلة.
Author: ONYX (2026)
Base Model: Gemma 3-4B