Google

عائلة Gemma 3-4B

فهم الفروقات الجوهرية بين نماذج جوجل المفتوحة وكيفية اختيار الإصدار المناسب لمشروع ONYX.

Gemma-3-4b-it (Instruct)

هذا النموذج "مدرب على التعليمات". هو الخيار المثالي للدردشة (Chatting)، الإجابة على الأسئلة، وتلخيص النصوص. يفهم لغة الحوار البشري بشكل ممتاز.

جاهز للاستخدام الفوري كمساعد ذكي.
يدعم التنسيقات الحوارية (Role-play).
أداء عالي في المهام المنطقية والبرمجية.

Gemma-3-4b-pt (Pre-trained)

هذا هو "النموذج الخام". تم تدريبه على كميات هائلة من البيانات لكنه لا يعرف كيف "يحاور". وظيفته الأساسية هي إكمال النص.

مناسب لعمل Fine-tuning على بيانات خاصة بشركتك RUI.
يستخدم للتنبؤ بالنص التالي (Text Completion).
لا يصلح كـ Chatbot بدون تدريب إضافي (Instruction Tuning).

متطلبات التشغيل (Hardware)

المعالج (CPU) والأداء الأمثل:

للحصول على أفضل سرعة استجابة (Tokens Per Second)، يُنصح بمعالجات حديثة تدعم تقنيات AVX2 أو AVX-512. التكوين المثالي يتطلب ما لا يقل عن 8 إلى 12 نواة حقيقية، مع تردد مرتفع (Boost Clock) لضمان معالجة سريعة لعمليات الـ Prompt Processing، خاصة عند التشغيل على توزيعات Linux المتقدمة مثل Fedora التي تستفيد من إدارة الذاكرة بكفاءة عالية.

الرامات المطلوبة (RAM/VRAM):

نوع التكميم (Quantization)	الحد الأدنى للرامات	الاستخدام الموصى به
FP16 (بدون ضغط)	~9 GB	سيرفرات قوية أو كروت شاشة احترافية
4-bit (مضغوط)	~4-5 GB	مثالي لجهازك (أفضل أداء)
8-bit	~6 GB	دقة أعلى قليلاً مع استهلاك متزايد

نصيحة تقنية: عند النشر النهائي، تأكدي من ضبط `n_ctx` (حجم السياق) ليتناسب مع الرامات المتاحة لضمان عدم حدوث Crash أثناء المحادثات الطويلة.

Author: ONYX (2026)

Base Model: Gemma 3-4B