الصور الزائفة قديمة قِدَم التصوير نفسه، انظر على سبيل المثال إلى الصور الخادعة الشهيرة لجنِّيَّات كوتينجلي أو وحش بحيرة لوخ نِسْ. ثم أَدخَلَ برنامج فوتوشوب التلاعب بالصور إلى العصر الرقمي، والآن الذكاء الاصطناعي متأهب لنقل تزييف الصور إلى مستوى جديد من التطور والتعقيد، وذلك بفضل الشبكات العصبية الاصطناعية التي تستطيع خوارزمياتها تحليل الملايين من صور الأشخاص والأماكن الحقيقية واستخدامها في تكوين صور غير حقيقية مقنِعة.

تتألف هذه الشبكات من أجهزة كمبيوتر متَّصلة ببعض ومرتَّبة في نظام قائم على بنية الدماغ البشري إلى حدٍّ ما. وقد استخدمت شركتا جوجل وفيسبوك وغيرهما هذا النوع من المصفوفات على مدار سنوات من أجل مساعدة برامجها على تحديد الأشخاص في الصور. وثمة نهج جديد يتضمن ما يُسمى بالشبكات المولِّدة المتنافسة (’Generative Adversarial Networks ‘GAN) التي تتألف من شبكة "مولِّدة" تكوِّن صورًا، وشبكة "مُميِّزة" تعمل على تقييم مدى مصداقية تلك الصور وصحتها.

يقول أورين إتزيوني، الرئيس التنفيذي لمعهد آلن للذكاء الاصطناعي في سياتل: «تحتاج الشبكات العصبية إلى ملايين الأمثلة من الصور للتعلُّم منها، والشبكات المولِّدة المتنافسة هي طريقة جديدة نسبيًّا للإنتاج التلقائي لهذه الأمثلة».

وتُمكِّن الشبكات المولِّدة المتنافسة أيضًا الذكاء الاصطناعي من تكوين صور واقعية زائفة بسرعة. تستخدم الشبكة المولِّدة التَعلُّم الآلي لدراسة أعداد هائلة من الصور التي تُعلِّمها كيفية تكوين صور تبدو واقعيةً بصورة خادعة، وترسل تلك الصور إلى الشبكة المُميِّزة المُدربة على تحديد ما تبدو عليه صورة شخص حقيقي. وتُقيِّم الشبكة المُميِّزة كلَّ صورة من الصور التي ولَّدتها الشبكة المولِّدة بناءً على مدى واقعيتها. وبمرور الوقت، تتحسن كفاءة الشبكة المولِّدة في إنتاج الصور الزائفة، وتتحسن كفاءة الشبكة المُميِّزة في اكتشافها، وهذا هو السبب وراء تسميتها "المتنافسة".

وقد لقيت الشبكات المولدة المتنافسة استحسانًا وترحيبًا كبيرًا بصفتها واحدة من طفرات الذكاء الاصطناعي؛ لأنها تستمر بعد تدريبها الأولي بالتعلُّم دون إشراف بشري. وقد كان إيان جودفيلو -الذي يعمل الآن باحثًا لدى "جوجل برين" (مشروع الذكاء الاصطناعي التابع لشركة جوجل)- المؤلف الرئيسي للدراسة التي أُجريت عام 2014 وطرحت هذا النهج الجديد. ومنذ ذلك الحين، أجرى عشرات الباحثين في العالم تجارب على الشبكات المولِّدة المتنافسة من أجل استخدامات متنوعة، مثل التحكُّم بالروبوتات وترجمة اللغات.

غير أن تطوير هذه الأنظمة غير الخاضعة للإشراف يمثل تحديًا. فالشبكات المولِّدة المتنافسة تفشل أحيانًا في التحسُّن بمرور الوقت، فإذا لم تتمكن الشبكة المولِّدة من إنتاج صور أقرب إلى الواقع يومًا بعد يوم، فإن ذلك يمنع الشبكة المُميِّزة من التحسُّن أيضًا.

لكن شركة إنفيديا المصنِّعة للرقائق الإلكترونية طورت طريقةً لتدريب الشبكات المتنافسة تساعدها على تجنُّب توقُّف عملية التطور. ومفتاح ذلك هو التدريب التدريجي لكلٍّ من الشبكتين المولِّدة والمُميِّزة، وذلك بتلقيمهما صورًا منخفضة الدقة، ثم إضافة طبقات جديدة من البكسلات التي تُدخِل تفاصيل عالية الدقة في أثناء تقدُّم التدريب. ويقلِّص هذا الأسلوب التدريجي في التعلُّم الآلي مدة التدريب إلى النصف أيضًا، وذلك وفق دراسة يخطط باحثو شركة إنفيديا لتقديمها في مؤتمر دولي للذكاء الاصطناعي في ربيع عام 2018. وقد استعرض فريق العمل طريقته باستخدام قاعدة بيانات تحتوي على أكثر من 200 ألف صورة من صور المشاهير، وذلك لتدريب شبكته المولِّدة المتنافسة التي أنتجت بعد ذلك صورَ وجوهٍ واقعية عالية الدقة لأشخاص لا وجود لهم.

لا تعرف الآلة تلقائيًّا ما إذا كانت الصورة التي تولِّدها واقعية. يقول جاكو لِتينِن، باحث لدى شركة إنفيديا يشارك في هذا المشروع: «لقد اخترنا الوجوه لتكون المثال الرئيسي لأنه من السهل علينا نحن البشر أن نحكم على نجاح نموذج الذكاء الاصطناعي المولِّد؛ فالبشر لديهم آلية عصبية مدمجة في أدمغتهم تتلقى مزيدًا من التدريب على مدار حياتهم لتمييز الوجوه وتفسيرها». ويتمثل التحدي هنا في جعل الشبكات المولِّدة المتنافسة تحاكي هذه القدرات البشرية.

وترى شركة فيسبوك أن الشبكات المتنافسة طريقة لمساعدة منصتها الاجتماعية على التنبؤ بشكل أفضل بما يريد المستخدمون رؤيته، وذلك بناءً على سلوكهم السابق، وفي النهاية تكوين ذكاء اصطناعي يتصف بالحس السليم والقدرة على التمييز. وقد وصف رئيس أبحاث الذكاء الاصطناعي لدى الشركة يان لِكون، والمهندس الباحث سوميث شينتالا نظامَهما المثالي بأنه «قادر، ليس فقط على التعرف على النصوص والصور، ولكن أيضًا على القيام بمُهمَّات أعلى مستوى وتعقيدًا مثل الاستدلال والتنبؤ والتخطيط، بطريقة تضاهي الطريقة التي يفكر ويتصرف بها البشر». وقد اختبر لِكون وشينتالا القدرات التنبؤية للشبكة بتلقيمها أربعة إطارات فيديو وجعلها تولِّد الإطارين التاليين باستخدام الذكاء الاصطناعي، وكانت النتيجة الاستمرار في تركيب الأحداث، سواء أكان شخصًا يمشي أو يؤدي بعض الحركات برأسه.

إن الصور والفيديوهات شديدة الواقعية التي يولِّدها الذكاء الاصطناعي تَعِد منتجي الأفلام ومصنِّعي ألعاب الفيديو، الذين يحتاجون إلى محتوى غير مرتفع التكلفة، بتحقيق نجاحات كبيرة. ويقول أليك رادفورد -الذي يعمل في الوقت الحالي باحثًا لدى شركة أبحاث الذكاء الاصطناعي "أوبن إيه آي"، والمؤلف الرئيسي لدراسة يقوم عليها عمل شركة فيسبوك (قُدِّمت في المؤتمر الدولي للذكاء الاصطناعي في عام 2016)-: إنه على الرغم من أن الشبكات المولِّدة المتنافسة تستطيع إنتاج صور "تبدو واقعيةً للوهلة الأولى"، فلا يزال أمامها طريقٌ طويلٌ تقطعه قبل الوصول إلى إنتاج صور حقيقية، بل ولا يزال الطريق أطول أمام إنتاج مقاطع فيديو عالية الجودة.

وعلينا الانتظار أيضًا لنرى ما إذا كان مثيرو المتاعب على الإنترنت، الذين يُنتجون بالفعل محتوى مزيفًا ينتشر كالنار في الهشيم، سوف يستخدمون الصور أو الفيديوهات التي ينتجها الذكاء الاصطناعي لأغراض دنيئة. ففي الوقت الذي يتزايد فيه تساؤل المستخدمين حول صحة ما يرونه على شبكة الإنترنت وصدقه، فإن هذه التكنولوجيا يمكن أن تؤجِّج أكثر مشاعر الارتياب وعدم اليقين.