حصاد 2024.. أهم نماذج الذكاء الاصطناعي التي أُطلقت خلال العام

16 ديسمبر 2024 - 10:37 م

قوقل

شهد عام 2024 تطورات غير مسبوقة في مجال الذكاء الاصطناعي، إذ واصلت الشركات التقنية الكبرى والمختبرات البحثية الرائدة سباقها لإطلاق نماذج جديدة تتحدى حدود الابتكار، ابتداءً من النماذج التي أعادت تعريف التفاعل بين الإنسان والآلة، ووصولًا إلى تلك التي أسهمت في تحسين قطاعات مثل الصحة، والتعليم، والصناعة، فقد كان هذا العام غنيًا بالإبداعات التي رسّخت مكانة الذكاء الاصطناعي كعامل رئيسي في تشكيل المستقبل.

لذلك سنعرض في هذا المقال أهم نماذج الذكاء الاصطناعي التي أُطلقت خلال عام 2024، مع تسليط الضوء على قدراتها، وكيف أثّرت في حياتنا؟ فإذا كنت من محبي التقنية أو من المهتمين بمواكبة الثورة الرقمية، فإن هذا التقرير سيأخذك في جولة شاملة بين أهم الإنجازات والابتكارات التي شهدها هذا العام:

1- نموذج (AlphaFold 3) من جوجل:

طورت شركة جوجل ديب مايند في عام 2020 النموذج الثوري (ألفا فولد) AlphaFold، للتنبؤ ببنية البروتين، وقد حقق في مسابقة (CASP13) آنذاك مستويات لا مثيل الخليج إنسايت من الدقة، وفي عام 2022، أطلقت الشركة الإصدار الثاني من النموذج وهو (AlphaFold 2)، الذي استطاع التنبؤ بدقة مذهلة بهياكل 200 مليون بروتين، وقد حقق دقة تنبؤ تضاهي تلك التي تُحقَّق في التجارب المعملية المعقدة.

ويمثل هذا الإنجاز قفزة نوعية في علوم الأحياء الحاسوبية والهندسة الحيوية، إذ كان تحديد بنية بروتين واحد يستغرق عادةً عامًا أو أكثر، في حين يستطيع نموذج (AlphaFold) القيام بذلك في دقائق معدودة.

وبفضل نشر تنبؤات بنية البروتين في قاعدة بيانات مجانية، تمكن العلماء حول العالم من تسريع وتيرة الأبحاث في مجالات حيوية، مثل: تطوير أدوية جديدة، ومكافحة مقاومة المضادات الحيوية، والتصدي لتحدي التلوث البلاستيكي.

ولم يتوقف الأمر عند هذا الحد، ففي شهر مايو 2024، أطلقت شركة جوجل ديب مايند الإصدار الثالث من النموذج وهو (AlphaFold 3) الذي يتميز بقدرته على التنبؤ بهياكل البروتينات، وبتفاعلاتها مع الحمض النووي (DNA) أيضًا، والحمض النووي الريبوزي (RNA)، والجزيئات الأخرى.

ويصف جون جامبر، رئيس فريق ألفا فولد، هذا التطور بقوله: “إذا كان نموذج (AlphaFold 2) قد ركز في فهم بنية البروتينات بحد ذاتها، فإن نموذج (AlphaFold 3) يتعدى ذلك ليغوص في عالم التفاعلات المعقدة بين البروتينات والجزيئات الأخرى، وكأننا انتقلنا من دراسة الكلمات المنفردة إلى فهم الجمل والعبارات”. ويرى الخبراء أن هذه القفزة النوعية ستساهم بنحو كبير في تسريع وتيرة اكتشاف الأدوية وتطوير علاجات أكثر فعالية.

وتجدر الإشارة إلى أن مبتكري نموذج (AlphaFold) فازوا بجائزة نوبل في الكيمياء هذا العام، فقد حصل ديفيد بيكر من جامعة واشنطن على نصف الجائزة بفضل إسهاماته في تصميم البروتينات باستخدام الحاسوب، في حين حاز ديميس هاسابيس وجون جامبر من شركة ديب مايند النصف الآخر من الجائزة، وذلك تقديرًا لإسهاماتهم البارزة في مجال تصميم البروتينات والتنبؤ بهياكلها.

2- نموذج (Runway Gen-3 Alpha) لتوليد الفيديو:

أطلقت شركة (Runway) في شهر يونيو 2024، الجيل الثالث من نموذجها الذي يحمل اسم (Runway Gen-3 Alpha)، والذي يتميز بقدرته على توليد مقاطع فيديو بدقة عالية بناءً على النصوص أو الصور أو مقاطع فيديو أخرى.

كما يمتاز هذا النموذج بقدرته على فهم الديناميكيات الثلاثية الأبعاد للمشاهد بصورة مذهلة،وفهم المصطلحات السينمائية المعقدة وتطبيقها بشكل دقيق، مما يتيح له إنشاء مقاطع فيديو واقعية بدقة عالية.

ويتفوق الجيل الثالث من النموذج في توليد شخصيات بشرية معبرة بمجموعة واسعة من الأفعال والإيماءات والعواطف، مما يفتح فرصًا جديدة لسرد القصص. ويتوقع أنستاسيس جيرمانيديس، المؤسس المشارك والمدير التنفيذي للتكنولوجيا في شركة (Runway)، أن النموذج سيشهد تطورًا سريعًا خلال السنوات القليلة القادمة، مما سيؤدي إلى إنتاج صور ومقاطع فيديو لا يمكن تمييزها عن الواقع.

Frames is our newest image generation model. It’s an incredibly versatile model, built in close partnership between our research and creative teams, with a focus on precise control over style and aesthetics. https://t.co/RZBsHwdPvO

— Anastasis Germanidis (@agermanidis) November 25, 2024

3- نموذج (+Cohere Command R):

أطلقت شركة (Cohere) – التي تأسست في عام 2019 على يد باحثين سابقين في مختبر (Google Brain) – في شهر أبريل 2024، نموذج (+Command R) المصمم خصوصًا لتلبية احتياجات الشركات، إذ يتميز بقدرته على أداء المهام المعقدة وأتمتة العديد من المهام الروتينية.

ويتفوق نموذج (+Command R) على النماذج المنافسة في السوق بفضل قدرته الفائقة على تلبية احتياجات سير العمل المؤسسي، كما يمتاز بمرونتة العالية والتكلفة التنافسية، مما يجعله حلًا مثاليًا لمجموعة واسعة من التطبيقات، فهو قادر على التعامل بفعالية مع مهام مثل التصنيف، وأتمتة العمليات، وتحليل البيانات، وغيرها الكثير، مما يساهم في زيادة كفاءة المؤسسات وتحسين أدائها.

ويتميز نموذج (+Command R) بمجموعة واسعة من القدرات التي تمكنه من:

الفهم العميق للغة الطبيعية: يتفوق النموذج في فهم النصوص المعقدة وتلخيصها، مما يسهل عملية اتخاذ القرارات.
التكامل مع أدوات العمل: يمكن لنموذج (+Command R) التفاعل مع تطبيقات أخرى مثل برامج البريد الإلكتروني وجداول البيانات، مما يتيح أتمتة العديد من المهام، مثل: إدارة علاقات العملاء، والمساهمة في خدمة العملاء، وإكمال الطلبات بكفاءة. وعلاوة على ذلك، يتميز النموذج بمرونة عالية، إذ يمكنه التعامل مع المهام المعقدة التي تتطلب تنفيذ سلسلة من الخطوات المترابطة، بما يشمل: القدرة على التعامل مع الأخطاء المحتملة وإيجاد حلول بديلة.
التعلم المستمر: يمكن تدريب نموذج (+Command R) على بيانات الشركة الخاصة لتعزيز دقته في التعامل مع المهام المحددة.
الاسترجاع المتقدم: يعتمد نموذج (+Command R) على تقنية الاسترجاع المتقدم (RAG)، التي تمكنه من الوصول إلى مصادر معلومات خارجية لتوفير إجابات أكثر دقة وشاملة .
الدعم اللغوي المتعدد: يدعم النموذج مجموعة واسعة من اللغات التي تشمل: الإنجليزية والفرنسية والإسبانية والإيطالية والألمانية والبرتغالية واليابانية والكورية والعربية والصينية، مما يجعله مثاليًا للشركات العالمية.

ومع ذلك، فإن هذا النموذج يركز بشكل أساسي في تحسين الكفاءة والفعالية في المهام المهنية، وليس على توليد محتوى إبداعي أو إجراء محادثات ترفيهية.

4- نموذج (LLAMA 3) من ميتا:

أطلقت شركة ميتا في شهر أبريل 2024 نموذج (LLAMA 3)، الذي يُعدّ واحدًا من أفضل نماذج الذكاء الاصطناعي المفتوحة المصدر، ثم أطلقت في شهر يوليو 2024 إصدار (Llama 3.1)، الذي يُعدّ أول نموذج لغوي كبير مفتوح المصدر يمكنه منافسة النماذج الأخرى المشابهة في المعرفة العامة والمهارات الرياضية والترجمة عبر لغات متعددة.

ثم أطلقت الشركة في شهر سبتمبر 2024 إصدار (Llama 3.2)، الذي يُعدّ أول نموذج لشركة ميتا يسمح بتشغيل الكثير من التطبيقات التي تتطلب فهمًا بصريًا، إذ يسمح هذا النموذج للمطورين بإنشاء تطبيقات ذكاء اصطناعي متقدمة، مثل تطبيقات الواقع المعزز، التي توفر فهمًا لحظيًا للفيديو، أو محركات البحث المرئية، التي تفرز الصور بناءً على المحتوى، أو مزية تحليل المستندات التي تلخص أجزاء طويلة من النص لك.

5- نموذج (فالكون 2) الإماراتي:

أطلق معهد الابتكار التكنولوجي الإماراتي، خلال شهر مايو 2024 الإصدار الثاني من نموذجه اللغوي الكبير (فالكون 2) Falcon 2، الذي يتميز بقدرات متطورة وإمكانيات ضخمة تفوق نماذج الذكاء الاصطناعي الأخرى، ومنها نموذج (LLAMA 3) من شركة ميتا.

ويتضمن نموذج (فالكون 2) نسختين متطورتين رئيسيتين، وهما:

فالكون 2 11 بي: وهو نموذج لغوي ضخم دُرب على 5.5 تريليونات رمز توكن و 11 مليار عامل متغير، مما يجعله أكثر كفاءة ودقة في معالجة اللغة، ويحقق هذا النموذج أداءً على قدم المساواة مع نموذج Gemma 7B من جوجل.
فالكون 2 11 بي (في إل إم): وهو نموذج يتميز بقدرات (الرؤية إلى اللغة) vision-to-language، التي تتيح إمكانية تحويل المدخلات المرئية إلى مُخرجات نصية بكل فعالية.

ولمعرفة كافة التفاصيل عن نموذج (فالكون 2) الإماراتي ومزاياه، يمكنك الاطلاع على مقال: “الإمارات تطلق نموذج الذكاء الاصطناعي “فالكون 2” الذي يتفوق على “لاما 3” من ميتا“.

6- نموذج (Ernie 4.0 Turbo) الصيني:

أطلقت شركة بايدو الصينية خلال شهر يونيو الماضي نموذج (Ernie 4.0 Turbo)، الذي يحمل تحسينات كبيرة في الأداء والكفاءة. إذ يوفر (Ernie 4.0 Turbo) قدرات إضافية ملحوظة مقارنةً بنموذج (Ernie 4) – الذي أطلقته الشركة في أكتوبر 2023 – مع استجابات سريعة وقدرات تفكير معززة.

ويشغل هذا النموذج روبوت (Ernie Bot)، وهو روبوت محادثة بالذكاء الاصطناعي مصمم لمنافسة ChatGPT من OpenAI، ويتمتع بقاعدة مستخدمين ضخمة تصل إلى 300 مليون مستخدم.

وقبل إطلاق إصدار (Ernie 4.0 Turbo) من النموذج قالت بايدو إن إصدار (Ernie 4.0) قد وصل إلى مستوى أداء يضاهي نموذج (GPT-4) من OpenAI، إذ يتميز بقدرات قوية في الفهم والمنطق، ويعني ذلك أن إصدار (Ernie 4.0 Turbo) يتفوق على نموذج (GPT-4) ونماذج الذكاء الاصطناعي الأخرى المشابهة.

🚀 In case you missed it! At #WAIC2024, Baidu Vice President Guangjun Xie revealed that ERNIE 4.0 Turbo is now fully available to enterprise clients, along with lowered pricing for flagship models ERNIE 4.0 and ERNIE 3.5. Check out the pictures for more details. ⬇️#BaiduAI… pic.twitter.com/WZjuYHvtut

— Baidu Inc. (@Baidu_Inc) July 8, 2024

7- نموذج (o1) من شركة (OpenAI):

أطلقت شركة (OpenAI) نموذج (o1) المتطور المُصمم لقضاء المزيد من الوقت في التفكير قبل الرد على استفسارات المستخدم، للمعانية في شهر سبتمبر الماضي، ثم أطلقته يوم 6 من ديسمبر 2024 رسميًا مع تحسينات شاملة.

ويتميز الإصدار الجديد من النموذج بقدرته المحسّنة على التفكير العميق قبل الرد، مما يعزز أداءه في حل المشكلات المعقدة في مجالات مثل العلوم والبرمجة والرياضيات وغيرها.

ومقارنةً بالنسخة التجريبية السابقة، يقدّم نموذج o1 بإصداره النهائي استجابةً أسرع وأداءً محسّنًا في البرمجة والرياضيات والكتابة، كما أضاف دعمًا لرفع الصور، مما يتيح للمستخدمين تحميل الصور، والحصول على ردود تفصيلية من النموذج.

ولمعرفة كافة التفاصيل عن نموذج (o1)، يمكنك الاطلاع على مقال: “نموذج o1 الجديد.. هل وصل الذكاء الاصطناعي إلى مستوى التفكير البشري؟“

8- نموذج (GenCast) من جوجل:

أطلقت جوجل يوم 4 ديسمبر 2024 نموذج جديد يُسمى (GenCast) للتنبؤ بالطقس، الذي يمتاز بقدرته على تقديم تنبؤات جوية دقيقة لمدة قدرها 15 يومًا، والذي تفوق بفارق كبير عن كافة أنظمة التنبؤ بالطقس التقليدية.

فقد تفوق نموذج (GenCast) على نظام المركز الأوربي (ECMWF) في مجال التنبؤات الطويلة المدى، وذلك في اختبارات للمقارنة شملت توقعات لمدة قدرها 15 يومًا في عام 2019، تفوق نموذج GenCast من ناحية الدقة على نظام المركز الأوروبي بنسبة قدرها 97.2% في المتوسط، ووصلت دقته إلى 99.8% في التنبؤات التي تتجاوز مدتها 36 ساعة، وتجعل هذه النتائج من GenCast أداة قوية لاتخاذ القرارات التي تتطلب توقعات دقيقة على المدى الطويل.

ولمعرفة المزيد عن نموذج (GenCast)، يمكنك الاطلاع على مقال: “جوجل تكشف عن نموذج GenCast .. قفزة نوعية في توقعات الطقس بالذكاء الاصطناعي“.

9- نموذج (Sora) من OpenAI:

أطلقت شركة (OpenAI) يوم 9 من ديسمبر 2024 نموذج (سورا) Sora، لتوليد الفيديو بالذكاء الاصطناعي، وذلك بعد تقديم النموذج بشكل تجريبي خلال شهر فبراير 2024.

وقد أصبح نموذج (Sora) متاحًا الآن عبر موقع (Sora.com)، للمشتركين في إصداري ChatGPT Plus، و ChatGPT Pro، إذ يمكنهم إنشاء مقاطع فيديو عالية الجودة بدقة تصل إلى 1080 بكسلًا، ومدة تصل إلى 20 ثانية بناءً على وصف نصي بسيط.

ولا تتوقف إمكانيات (Sora) عند هذا الحد، بل يتيح لك أيضًا إنشاء مقاطع الفيديو من الصور، أو تعديل مقاطع الفيديو الموجودة بطرق مبتكرة، مثل إعادة مزجها وتعديلها وتحسينها، فعلى سبيل المثال، يمكنه إصلاح الأجزاء التالفة في مقطع فيديو أو إنشاء نهايات جديدة له، مما يفتح آفاقًا جديدة في مجال تعديل الفيديو.

ولمعرفة كافة التفاصيل عن نموذج (Sora) وكيفية استخدامه، يمكنك الاطلاع على مقال: “كل ما تحتاج إلى معرفته عن نموذج Sora لتوليد الفيديو بالذكاء الاصطناعي“.

10- نموذج (Gemini 2.0) من جوجل:

أطلقت جوجل يوم 11 من ديسمبر 2024، نموذج (Gemini 2.0)، الذي يمثل قفزة طموحة نحو نماذج الذكاء الاصطناعي التي يمكنها إنجاز المهام المعقدة بشكل مستقل. إذ يمتاز هذا النموذج بأنه مصمم لعصر جديد قائم على الوكلاء، فبدلًا من تقديم استجابات مباشرة للمستخدمين، يمكن لوكلاء الذكاء الاصطناعي فهم السياق بنحو أعمق، والتخطيط لسلسلة من الإجراءات، وحتى اتخاذ قرارات محددة نيابة عن المستخدم.

وقد وصف ساندرا بيتشاي، الرئيس التنفيذي لجوجل، لحظة إطلاق هذا النموذج بأنها بداية حقبة جديدة للوكلاء، مشيرًا إلى مساعدين افتراضيين يمكنهم أداء المهام بنحو مستقل.

ويمتاز هذا النموذج بقدرته على فهم اللغات المتعددة وإجراء محادثات سلسة، ويستطيع توليد صور أصلية وأصوات بشرية بلغات مختلفة، كما يمكنه المساعدة في عمليات البحث ومشاريع البرمجة.

ولمعرفة كافة التفاصيل عن (Gemini 2.0) الجديد من جوجل، يمكنك الاطلاع على مقال: “Gemini 2.0 من جوجل.. هل سيكون بداية عصر الذكاء الاصطناعي المستقل؟“.

الوسوم

AlphaFold AlphaFold 3 Ernie Gemini Gemini 2.0 GenCast Llama 3 OpenAI Runway Sora الإمارات الشركات التقنية الصين النماذج اللغوية الكبيرة جوجل حصاد 2024 ديب مايند فالكون 2 فالكون 2 11 بي معهد الابتكار التكنولوجي ميتا نموذج o1

نسخ الرابط تم نسخ الرابط

تابعنا على قوقل

تابعنا على تلغرام

تابعنا على تويتر