أخر الاخبار

Google Gemini AI: كل ما نعرفه حتى الآن

 من المتوقع أن يكون برج الجوزاء أقوى ذكاء اصطناعي تم بناؤه على الإطلاق. سيكون لديه قدرات متطورة متعددة الوسائط، وإتقان المحادثات واللغة والمحتوى على النمط البشري، وفهم الصور وتفسيرها، والبرمجة بشكل متكرر وفعال، ودفع البيانات والتحليلات، وسيتم استخدامه من قبل المطورين لإنشاء تطبيقات الذكاء الاصطناعي وواجهات برمجة التطبيقات الجديدة. في المستقبل القريب، من المتوقع أن يكون برج الجوزاء موجودًا - أو حتى يعمل على تشغيل - معظم منتجات وخدمات Google.




على مدار العام الماضي، اندلعت حرب الذكاء الاصطناعي (AI) بين OpenAI ، Microsoft، Google، وآخرون قد ساهموا في تعزيز هذا المجال المبتكر، حيث يتنافس كل منهم وجهًا لوجه ويطلقون نماذج جديدة وأكثر قوة.


على الرغم من أن جوجل لم تكن الأولى في ساحة الذكاء الاصطناعي، إلا أنها تعتزم الآن الصعود إلى القمة مع جيميني - الذي يُعتقد أنه أقوى نموذج للذكاء الاصطناعي على الإطلاق.


تم إطلاق Gemini يوم الأربعاء الموافق 6 ديسمبر 2023، لذلك سنرى الآن كيف ستسير الأمور على المدى الطويل.


هذه هي الطريقة التي يعمل بها برج الجوزاء، ومدى قوته، وما يمكنه القيام به - هذا كل ما نعرفه عن برج الجوزاء اليوم.


اقرأ المزيد: تم إطلاق Google Gemini! اكتشف المزيد


جوجل الجوزاء: الوسائط المتعددة من البداية

منذ البداية عندما تم الإعلان عن Gemini لأول مرة في 10 مايو خلال مؤتمر مطوري Google I/O من قبل الرئيس التنفيذي ساندر بيتشاي نفسه، هناك شيء واحد لقد تم التوضيح: كانت جوجل تبني الجيل التالي من الذكاء الاصطناعي. يعتمد المشروع، بقيادة فريقي Google Brain Team وDeepMind، على PaLM 2.


PaLM 2، أو Pathways Language Model 2، هي التقنية الأساسية التي تستخدمها Google لتعزيز قدرات الذكاء الاصطناعي عبر مجموعة منتجاتها. يتضمن ذلك منتجات وخدمات Google Cloud، وGmail، وGoogle Workspace، والأجهزة مثل هاتف Pixel الذكي أو Nest Thermostat، وبالطبع برنامج الدردشة الآلي الشهير AI chatbot Bard.


في ذلك الوقت، كان Gemini لا يزال في وضع التطوير والتدريب الكامل، لكن Pichai كشف ما الذي يجعل الذكاء الاصطناعي الجديد مختلفًا.


الجوزاء يأخذ الذكاء الاصطناعي متعدد الوسائط إلى ما هو أبعد من ذلك

"تم إنشاء برج الجوزاء من الألف إلى الياء ليكون متعدد الوسائط."

كانت تلك هي العبارة الرئيسية من Pichai، وإذا كانت هناك كلمة واحدة تصف برج الجوزاء، فهي بلا شك "متعدد الوسائط". في حين أن الكثيرين يخلطون بين الذكاء الاصطناعي متعدد الوسائط وأي ذكاء اصطناعي يمكنه العمل مع محتوى مختلف، مثل الصور أو النصوص، بالنسبة لشركة Google، فإن هذا المصطلح يعني أكثر من ذلك بكثير.


مؤخرًا، في 24 أكتوبر، خلال أرباح شركة Alphabet للربع الثالث من عام 2023، قدم بيتشاي إشارات واضحة عن نوع الذكاء الاصطناعي متعدد الوسائط الذي كانوا يبنونه .

وقال بيتشاي: "إننا نضع الأساس لما أعتقد أنه سلسلة الجيل التالي من النماذج التي سنطلقها طوال عام 2024".

"إن وتيرة الابتكار مثيرة للإعجاب للغاية."


الجوزاء هو ذكاء اصطناعي أكثر إنسانية

بطريقة أو بأخرى، شهدنا بالفعل الذكاء الاصطناعي متعدد الوسائط. تقدم شركات مثل OpenAI — المسؤولة عن ChatGPT — أو Microsoft تقنيات ذكاء اصطناعي توليدية مختلفة يمكنها العمل مع الصور والنصوص والبيانات وحتى التعليمات البرمجية. ومع ذلك، فإن جميع أنظمة الذكاء الاصطناعي المبكرة هذه لا تعدو أن تكون مجرد خدش سطح التكنولوجيا متعددة الوسائط، حيث إن دمج تنسيقات المحتوى والبيانات المختلفة ليس فعالاً.

السبب وراء النجاح الهائل الذي حققه الذكاء الاصطناعي التوليدي هو أنه، لأول مرة، أصبح بإمكان الآلة تقليد ما يفعله البشر. ولكن ما الذي يمكن للبشر أن يفعله بالضبط؟ لا يمكننا فقط الدردشة والبرمجة وكتابة التقارير وإنشاء الصور، بل يمكننا القيام بكل ذلك.

الدماغ البشري معقد ببراعة. ويمكنه تفسير وفهم تنسيقات البيانات المختلفة في وقت واحد، بما في ذلك النصوص والكلمات والأصوات والمرئيات. يتيح لنا ذلك فهم العالم من حولنا، والاستجابة للمحفزات، وحل المشكلات بطرق إبداعية ومبتكرة. وهذا هو ما يدور حوله الجوزاء من Google. ذكاء اصطناعي جديد يقترب مما يفعله البشر حقًا: ذكاء اصطناعي متعدد الوسائط ومتعدد المهام.

برج الجوزاء ليس نموذجًا واحدًا، بل إنه يحتوي على العديد من أنظمة الذكاء الاصطناعي مجتمعة

هناك طريقة واحدة فقط لإنشاء ذكاء اصطناعي متعدد الوسائط أنيق وفعال. وهذا يعني الجمع بين نماذج الذكاء الاصطناعي المختلفة في نموذج واحد. يجب دمج نماذج التعلم الآلي والذكاء الاصطناعي مثل معالجة الرسوم البيانية، ورؤية الكمبيوتر، ومعالجة الصوت، ونماذج اللغة، والتشفير والبرمجة، والنماذج ثلاثية الأبعاد لتحقيق التآزر عند تطوير الذكاء الاصطناعي متعدد الوسائط. 

إنها مهمة ضخمة ومليئة بالتحديات، وتريد Google الارتقاء بهذا المفهوم إلى مستوى جديد غير مسبوق.

اقرأ ايضا:ردود أفعال Google Gemini AI - مدح قوي، ولكن أسئلة تحتاج إلى إجابة من هنا

أطلق العنان للمطورين

هناك اختلاف كبير آخر بين Gemini والنماذج الأخرى مثل ChatGPT أو Bing Chat وهو المستوى المحدود حاليًا من الوصول الممنوح للمطورين لهذه التكنولوجيا.

ولكن مباشرة من البوابة، سوف يكسر الجوزاء هذا الاتجاه.

وأضاف يتشاي أن Gemini سيكون "عالي الكفاءة مع الأدوات وتكاملات واجهة برمجة التطبيقات".


وهذا يعني أن Google لا تعمل فقط على ذكاء اصطناعي جديد ليكون بمثابة عرض مهر للويب، ولكنها تعمل أيضًا على إنشاء إصدارات خفيفة الوزن وقوية من Gemini للمطورين لاستخدامها وتخصيصها لإنشاء تطبيقات الذكاء الاصطناعي وواجهات برمجة التطبيقات الخاصة بهم.


الذكاء الاصطناعي لبناء الذكاء الاصطناعي

ليس من المبكر جدًا فهم كيفية استخدام المطورين لـ Gemini لإنشاء تطبيقات الذكاء الاصطناعي وواجهات برمجة التطبيقات الجديدة. في منتصف سبتمبر، ظهرت أخبار تفيد بأن Google بدأت في منح المستخدمين إمكانية الوصول إلى إصدار مبكر من Gemini. وبطبيعة الحال، كما هو متوقع، جاءت التسريبات الأولى لبرج الجوزاء.


في 15 أكتوبر، صدم مهندس جافا سكريبت بيدروس بامبوكيان العالم بأول لقطات شاشة لما يبدو أنه Gemini مدمج في Makersuite. تم إصداره في أوائل عام 2023 وبدعم من PaLM 2، ويستخدم المطورون MakerSuite من Google لإنشاء تطبيقات الذكاء الاصطناعي.

MakerSuite هو في الأساس ذكاء اصطناعي لإنشاء الذكاء الاصطناعي. يحتوي على واجهة مستخدم بسيطة حيث يمكن للمطورين إنشاء أدوات إنشاء التعليمات البرمجية، وتطبيقات معالجة اللغة الطبيعية (NLP)، والمزيد.


كشف بامبوكيان - أول من سرب دمج Gemini في MarketSuite - عن قمة جبل الجليد من قدرات Gemini متعددة الوسائط. يوضح التسريب أن Gemini لديه بالفعل إمكانات التعرف على النصوص والأشياء ويمكنه التعليق وفهم المطالبات التي تجمع بين النص الحر والصور.


هل الجوزاء أقوى من ChatGPT؟

عند مقارنة Gemini مع ChatGPT، يتحدث العديد من الخبراء عن المعلمات. المعلمات في نظام الذكاء الاصطناعي هي المتغيرات التي يتم تعديل قيمها أو ضبطها أثناء مرحلة التدريب والتي يستخدمها الذكاء الاصطناعي لتحويل بيانات الإدخال إلى مخرجات. بشكل عام، كلما زاد عدد المعلمات التي يتمتع بها الذكاء الاصطناعي، كلما كان أكثر تعقيدًا.

يحتوي ChatGPT 4.0، وهو الذكاء الاصطناعي الأكثر تقدمًا في التشغيل، على 1.75 تريليون معلمة. في المقابل، تشير التقارير إلى أن برج الجوزاء سيتجاوز هذا العدد، حيث تزعم التقارير أنه سيحتوي على 30 تريليون أو حتى 65 تريليون معلمة.

لكن قوة نظام الذكاء الاصطناعي لا تتعلق فقط بأرقام المعلمات الكبيرة.

تؤكد لنا دراسة أجرتها SemiAnalogy أن سوف "يسحق" برج الجوزاء ChatGPT 4.0. وتتوقع شركة SemiAnalys أنه بحلول نهاية عام 2023، يمكن لـ Gemini أن يتجاوز ChatGPT 4.0 بعامل خمسة، وربما أقوى 20 مرة.


الجوزاء والرقائق وبيانات التدريب

المفهوم الكامن وراء نموذج الذكاء الاصطناعي ذو صلة أيضًا.

في حين أنه، كما ذكرنا سابقًا، لا تزال سعة الوسائط المتعددة لـ ChatGPT في حدها الأدنى - يمكنها العمل مع اللغة والأكواد ولكن ليس مع الصور - ستجمع Gemini كل ذلك.

"Google Gemini متعدد الوسائط، مما يعني أنه يمكنه معالجة وإنشاء النصوص والصور وأنواع البيانات الأخرى. وهذا يجعله أكثر تنوعًا من ChatGPT، القادر فقط على معالجة النص،” كما جاء في تقرير SemiAnalys.


وأضافت SemiAnalys أن Google "استثمرت قوة حسابية غير مسبوقة" لتدريب Gemini، بما يتجاوز GPT-4. لتدريب برج الجوزاء، تستخدم Google شرائح التدريب المتطورة المعروفة باسم TPUv5. يُقال إن هذه الرقائق هي التقنية الوحيدة في العالم القادرة على تنسيق 16384 شريحة تعمل معًا. هذه الرقائق الفائقة هي السر الذي يسمح لشركة Google بتدريب مثل هذا النموذج الضخم.


يقول نصف التحليل:

"في الوقت الحاضر، لا تمتلك أي كيانات أخرى في هذا المجال القدرة على القيام بمثل هذه المساعي التدريبية."

لكن تدريب نموذج الذكاء الاصطناعي لا يقتصر على الرقائق فحسب، بل يتعلق أيضًا بالبيانات. وعندما يتعلق الأمر بالبيانات، فإن جوجل هو أحد الملوك الحاكمين. وأضاف SemiAnalies: "تمتلك Google مجموعة واسعة من بيانات التعليمات البرمجية فقط، والتي تقدر بحوالي 40 تريليون رمز، وهي حقيقة تم التحقق منها".


أربعون تريليون رمز يعادل مئات البيتابايت أو محتوى ملايين الكتب. وفقًا لـ SemiAnalogy، فإن مجموعة بيانات Google وحدها أكبر بأربع مرات من مجمل البيانات المستخدمة لتدريب ChatGPT 4.0، والتي تتضمن بيانات التعليمات البرمجية والبيانات غير البرمجية.


خلاصة القول: لعبة جوجل النهائية للجوزاء

تمامًا كما تعمل PaLM 2 على تشغيل كل ما تحمله علامة Google التجارية، من المتوقع أن تفعل Gemini نفس الشيء بالنسبة للذكاء الاصطناعي. تقوم Google برعاية Gemini وتتوقع أن تنمو لتصبح العمود الفقري لجميع ذكاء الذكاء الاصطناعي المضمن والمدمج في كل منتج وخدمة من منتجات Google.


ما هي المنتجات والخدمات النهائية التي سنراها مدعومة من جيميني؟ إذا حل محل PaLM 2، فسوف يقوم Gemini بتشغيل كل شيء بدءًا من الخرائط وحتى المستندات والترجمة، وجميع بيئات وخدمات Google Workplace والسحابة، بالإضافة إلى البرامج والأجهزة والمنتجات الجديدة.


تلتزم Google تمامًا ببناء نظام ذكاء اصطناعي أكثر قوة وتنوعًا ووعيًا بالسياق وقادرًا على فهم العالم والتفاعل معه بطرق جديدة وغير مسبوقة.


سيستخدم المبرمجون برنامج Gemini لبرمجة العمليات السحابية والحافة وأتمتتها وتعزيزها، وزيادة المبيعات، ودمجها في روبوتات الدردشة والمساعدين الافتراضيين داخل الهواتف الذكية والتطبيقات وواجهات برمجة التطبيقات التي يمكن ارتداؤها من Google، وغير ذلك الكثير.


إذا انتهى الأمر بأن يُنظر إلى عام 2023 على أنه العام الذي يصل فيه الذكاء الاصطناعي إلى مستوى الوعي والاستخدام السائد، فقد يكون عام 2024 حقًا عام الجوزاء.


تعليقات



    حجم الخط
    +
    16
    -
    تباعد السطور
    +
    2
    -