الإثنين - 29 ديسمبر / كانون الأول 2025
الطقس
تكنولوجيا

غولدمان ساكس: تنفيذ بيانات يستطيع الذكاء الاصطناعي التدرب عليها

تابع آخر الأخبار على واتساب

بيانات الذكاء الاصطناعي: غولدمان ساكس تكشف عن تحديات التدريب المستقبلية

الـخـلاصـة

📑 محتويات:

بيانات الذكاء الاصطناعي تواجه تحدياً جديداً حسب غولدمان ساكس، حيث نفدت البيانات الأصلية المتاحة للتدريب. نيما رافائيل يشير إلى أن هذا يؤثر على كيفية بناء النماذج، مع الإشارة إلى نموذج ‘ديب سيك’ الصيني كبديل يعتمد على البيانات المولدة. الاعتماد على هذه البيانات يثير مخاوف حول الجودة، بينما تملك الشركات كنوزاً من البيانات الخاصة التي قد تكون الحل. إيليا سوتسكيفر يتفق مع هذا الرأي، مؤكداً استهلاك البيانات المفيدة عبر الإنترنت. جودة البيانات المستخدمة في التدريب تبقى نقطة محورية لمستقبل الذكاء الاصطناعي.

ℹ️ خلاصة مختصرة لأهم ما جاء في الخبر قبل التفاصيل

أكد نيما رافائيل كبير مسؤولي البيانات ورئيس هندسة البيانات في "غولدمان ساكس" أن العالم وصل إلى مرحلة نفذت فيها البيانات الأصلية المتاحة التي يمكن تدريب الذكاء الاصطناعي عليها، وذلك وفق تقرير نشره موقع "بيزنس إنسايدر".



وأوضح أن هذا الأمر أثر بالفعل في الآلية التي تبنى بها نماذج الذكاء الاصطناعي، مشيرا إلى نموذج "ديب سيك" الصيني الذي تم تدريبه بتكلفة أقل من بقية النماذج.

ويتوقع رافائيل أن كلفة تدريب "ديب سيك" المنخفضة جاءت لاعتماده على البيانات التي تولدها نماذج الذكاء الاصطناعي الموجودة بالفعل، وليس على البيانات الأصلية المتاحة عبر الإنترنت.

ورغم أن الاعتماد على البيانات المولدة من أدوات الذكاء الاصطناعي يوفر حجما لا محدودا من البيانات، فإنه لا يضمن جودة هذه البيانات التي قد تكون أضعف من البيانات الأصلية الموجودة بالإنترنت، وبالتالي يؤثر على جودة النموذج الذي يتم تدريبه عليها.

ويشير رافائيل أثناء حديثه إلى أن البيانات التي نفذت هي المتاحة عبر الإنترنت المفتوح لجميع المستخدمين، ولكن يختلف الأمر تماما عندما يتعلق بالبيانات الخاصة التي تحتفظ بها الشركات.

ويعني هذا أن المرحلة القادمة لتدريب نماذج الذكاء الاصطناعي ستعتمد بشكل مباشر على البيانات الخاصة الموجودة لدى الشركات، سواء كانت بيانات لعمليات تداول أو تفاعلات بين المستخدمين وموظفي الشركة، وفي هذا السياق تملك "غولدمان ساكس" كنوزا من البيانات يمكنها أن تجعل أدوات الذكاء الاصطناعي أكثر قوة إن تم استخدامها بشكل صحيح.

ويتفق إيليا سوتسكيفر المؤسس المشارك في "أوبن إيه آي" مع رؤية رافائيل، إذ قال سابقا في أحد المؤتمرات إن الشركات استهلكت كافة البيانات المفيدة المتاحة عبر الإنترنت مما يضع حدا لعصر التطور السريع في نماذج الذكاء الاصطناعي.

وتظل النقطة المحورية في تدريب نماذج الذكاء الاصطناعي هي نوعية البيانات المستخدمة بالتدريب وجودتها، فالاعتماد على البيانات المصنعة من النماذج الأخرى أو البيانات ذات الجودة المنخفضة يثير تساؤلات أعمق حول مسار الذكاء الاصطناعي من وجهة نظر رافائيل.

تحليل وتفاصيل إضافية

يشير تقرير غولدمان ساكس إلى تحول حاسم في مجال الذكاء الاصطناعي، حيث يواجه نقصاً في البيانات الأصلية المتاحة للتدريب. هذا النقص يفرض على الشركات البحث عن مصادر بديلة، مثل البيانات المولدة من نماذج الذكاء الاصطناعي الأخرى أو البيانات الخاصة التي تحتفظ بها. الاعتماد على البيانات المولدة يثير تساؤلات حول جودتها وتأثيرها على دقة النماذج المدربة. في المقابل، تملك الشركات بيانات قيمة قد تساهم في تطوير نماذج أكثر قوة، لكن استخدام هذه البيانات الخاصة يطرح تحديات تتعلق بالخصوصية والأمان. هذا التحول يستدعي إعادة تقييم استراتيجيات تدريب الذكاء الاصطناعي والتركيز على جودة البيانات المستخدمة لضمان تطور فعال ومستدام.

أسئلة شائعة حول بيانات الذكاء الاصطناعي

ما هو التحدي الذي تواجهه نماذج الذكاء الاصطناعي حسب غولدمان ساكس؟
نقص البيانات الأصلية المتاحة للتدريب.
ما هو البديل الذي يتم اللجوء إليه لتدريب نماذج الذكاء الاصطناعي؟
البيانات المولدة من نماذج الذكاء الاصطناعي الأخرى أو البيانات الخاصة بالشركات.
ما هي المخاوف المتعلقة بالاعتماد على البيانات المولدة؟
انخفاض جودة البيانات وتأثيرها على دقة النماذج المدربة.
ما هي الميزة التي تتمتع بها الشركات في هذا السياق؟
امتلاكها بيانات خاصة قيمة يمكن استخدامها لتدريب نماذج أكثر قوة.
ما هي التحديات المتعلقة باستخدام البيانات الخاصة؟
تحديات تتعلق بالخصوصية والأمان.
ما هي النقطة المحورية في تدريب نماذج الذكاء الاصطناعي؟
جودة البيانات المستخدمة في التدريب.

تابع صوت الغد على مواقع التواصل الاجتماعي : نبض | فيسبوك | تيك توك | إنستغرام | واتساب | تويتر × | تيلغرام

×

🧥 شو نلبس بكرا؟