جوجل

نموذج Gemma 4 12B للذكاء الاصطناعي يصل رسميًا بقدرات متقدمة للعمل محليًا على اللابتوبات ودعم للصوت والصور بذكاء عالٍ

كل شيء عن Gemma 4 12B!

أعلنت شركة قوقل عن إطلاق نموذجها الجديد Gemma 4 12B، وهو نموذج ذكاء اصطناعي متعدد الوسائط موجه للعمل محليًا على أجهزة اللابتوب، مع تحسينات كبيرة في الأداء والكفاءة، وقدرات متقدمة في فهم ومعالجة النصوص والصور والصوت.

ويأتي النموذج ليقع بين إصدارَي Gemma E4B الخفيف وGemma 26B MoE الأكبر، حيث يهدف إلى تقديم توازن مثالي بين القوة الحسابية وتقليل استهلاك الذاكرة، مما يجعله مناسبًا لأجهزة المستهلكين المزودة بذاكرة لا تقل عن 16GB.

تصميم جديد متعدد الوسائط بدون وحدات ترميز تقليدية

يعتمد Gemma 4 12B على بنية جديدة تُعرف باسم Encoder-Free Architecture، والتي تلغي الحاجة إلى مشفّرات منفصلة للصور والصوت، وهو ما يقلل من زمن الاستجابة ويخفض استهلاك الذاكرة بشكل ملحوظ.

  • في معالجة الصور: يتم استخدام طبقة خفيفة تعتمد على عمليات رياضية بسيطة لنقل البيانات مباشرة إلى النموذج
  • في معالجة الصوت: يتم تحويل الإشارات الصوتية مباشرة إلى نفس فضاء التمثيل المستخدم للنصوص دون طبقات وسيطة

هذا التصميم يسمح بتجربة أسرع وأكثر كفاءة في التعامل مع المدخلات المتعددة.

أداء قوي يقترب من النماذج الأكبر

رغم حجمه المتوسط، يقدم Gemma 4 12B أداءً قريبًا من نموذج 26B MoE الأكبر في اختبارات الأداء، مع استهلاك أقل بكثير للذاكرة، ما يجعله مناسبًا للتشغيل على الحواسيب الشخصية.

ويتميز النموذج بـ:

  • دعم الاستدلال متعدد الخطوات (Multi-step reasoning)
  • تنفيذ مهام ذكية مستقلة (Agentic workflows)
  • تحسين سرعة الاستجابة عبر Multi-Token Prediction
  • تشغيل فعال على بيئات Linux وmacOS

قدرات ذكاء اصطناعي متقدمة للمطورين

تم تصميم Gemma 4 12B ليكون أداة قوية للمطورين، حيث يدعم مجموعة واسعة من الاستخدامات، أبرزها:

  • إنشاء صفحات ويب كاملة من أوامر نصية
  • تحليل البيانات وإنشاء الرسوم البيانية
  • كتابة الأكواد البرمجية وتصحيحها تلقائيًا
  • تنفيذ مهام متعددة بشكل تسلسلي دون تدخل مباشر

كما أطلقت قوقل Gemma Skills Repository، وهي مكتبة رسمية توفر أدوات جاهزة لبناء أنظمة ذكية تعتمد على النموذج.

تشغيل محلي وخصوصية أعلى

يتميز النموذج بإمكانية التشغيل الكامل محليًا على الجهاز دون الحاجة إلى الاتصال بالخوادم السحابية، مما يعزز الخصوصية ويقلل زمن الاستجابة.

ويمكن تشغيله عبر أدوات متعددة، منها:

  • LM Studio
  • Ollama
  • Google AI Edge Gallery
  • Hugging Face Transformers
  • vLLM و llama.cpp

كما يمكن تنزيله مباشرة من منصتي Hugging Face وKaggle واستخدامه في المشاريع المختلفة.

استخدامات قوية في البرمجة والتحليل

يدعم Gemma 4 12B قدرات متقدمة في البرمجة، مثل:

  • توليد الأكواد من أوامر بسيطة
  • إنشاء تصورات ورسوم بيانية تلقائيًا
  • تحليل البيانات محليًا دون اتصال
  • تطوير مشاهد ثلاثية الأبعاد مع إدارة التبعيات
  • تحسين الكود وإصلاح الأخطاء بشكل تلقائي

دعم تطبيقات الصوت والإنتاجية

يمتد استخدام النموذج ليشمل أدوات إنتاجية تعتمد على الصوت، من خلال منظومة Google AI Edge Eloquent، والتي تتيح:

  • تحويل الصوت إلى نص محليًا
  • تحرير النصوص عبر الأوامر الصوتية
  • تنفيذ مهام مثل التلخيص وإعادة الصياغة والترجمة

التوفر

يتوفر نموذج Gemma 4 12B كمصدر مفتوح تحت ترخيص Apache 2.0، مع دعم التشغيل على الأجهزة التي تحتوي على 16GB من الذاكرة، ويستهدف بشكل أساسي الاستخدام المحلي بعيدًا عن السحابة.

المصدر

زر الذهاب إلى الأعلى