ماذا لو كان مساعدك الرقمي يستطيع أن يشارك في منافسات أغاني الراب؟ قد يبدو ذلك ضربًا من الخيال، لكن جيل واينبرج، المختص بتقنيات الموسيقى في معهد جورجيا للتقنية، قام بتهيئة روبوت موسيقي، أطلق عليه اسم شيمون، لتأليف الأغاني وأدائها في الزمن الحقيقي، وهذا يعني أن الروبوت يستطيع المشاركة في نظم "الحوارات" مع البشر غناءً على طريقة فن الراب، وربما يستطيع أيضًا مساعدتهم في تأليف كلمات أغانيهم الخاصة، كان الغرض من صنع شيمون أن يكون معاونًا موسيقيًّا متفردًا ليس له مثيل، أو منافسًا غير بشري في منافسات فن الراب، وقد صُمم ليبدو صوته مثل الآلة (يمكنك الاستماع إليه من خلال الرابط).

يعود تاريخ إنتاج الموسيقى بواسطة الكمبيوتر إلى خمسينيات القرن الماضي، عندما كانت بواكير الحواسب تستخدم خوارزميات لتأليف الألحان، تستطيع الروبوتات الحديثة الاستفادة من تقنية تعلُّم الآلة في ارتجال العزف على آلات موسيقية، منها الناي والطبول، وكان أحد هذه الروبوتات نسخةً سابقة من شيمون، وكان يستطيع الغناء والعزف على آلة الماريمبا، وتبدو نسخة الروبوت المحدّثة مؤخرًا مثل سابقتها، فهي لا تزال ذات رأس كروي الشكل، وحاجبين جريئين قادرين على الحركة فوق عينين مزوّدتين بغطاء، ويرتكز الرأس على طرف ذراع ميكانيكية، لكن واينبرج يقول إن شيمون هو أول روبوت مرتجِل يغزو مجال منافسات فن الراب، وذلك لما يتمتع به من خواص تميّز أسلوبه، وتفرض تحدياتٍ فريدةً من نوعها في عالم البرمجة.

يمثل ابتداع القوافي قمة سُلّم المجد في فن الراب، فبالإضافة إلى المحتوى الدلالي، تحتاج الكلمات إلى الارتباط بنغمة وإيقاع مبهجين من الناحية الجمالية، بالتزامن مع إلقاء طبقات متعددة من التعقيدات الشعرية، في بحث حديث نُشر ضمن وقائع المؤتمر الدولي الحادي عشر للإبداع الحاسوبي في عام 2020، حدد فريق واينبرج البحثي أبرز ملامح التطوّرات التقنية التي أسهمت في إنجاح تصميم شيمون كمغني راب.

عندما ينخرط شيمون في غناء منافسات الراب مع مغنٍّ آخر، تقوم برمجياته بتحويل الكلمات الشعرية التي ينطقها منافسه البشري إلى نصوص، ويحدد نظام الروبوت الكلمات المفتاحية في ذلك النص، ثم يقوم بتوليد كلمات شعرية جديدة منها، اعتمادًا على العديد من مجموعات البيانات المُخصصة من كلمات تم تدريب شيمون عليها (باستخدام نماذج التعلّم العميق)، يمكن استقاء مجموعات البيانات هذه من أي نص، كأن تُؤخذ من أعمال ليل وين مثلًا، أو جاي-زي، أو غيرهما من مغنّي الراب، أو تُستقى من الكلمات الشعرية لفنون غنائية أخرى، أو حتى من أعمال أدبية غير موسيقية، ولك أن تتخيل كيف ستبدو أعمال شكسبير أو جين أوستن إذا سمعتها على غرار فن الراب؛ فالروبوت شيمون يستطيع أن يحاكي هذه الأعمال لك.

أحد العناصر الجديدة في تصميم شيمون، وفق ما يقول صانعوه، هو الاستخدام الإضافي لمجموعات بيانات الوحدات الصوتية (الصُّوَيت أو الفونيم) بهدف ابتكار قوافٍ جديدة، الوحدات الصوتية هي وحدات متفردة من النطق تصنع الصوت الخاص بالكلمة، ويُعتبر تفكيك الكلمات المفتاحية إلى هذه الوحدات أكثر الطرق فاعليةً لدمج القافية مع النغمة، وفق ما يقول ريتشارد سيفري، المؤلف الأول للبحث المنشور حول شيمون، والمختص بتقنيات الموسيقى في معهد جورجيا للتقنية، ويشرح سيفري قائلًا: "طريقة ربط الوحدات الصوتية بين الكلمات بالغة الأهمية"، ويضيف أن طريقة الربط تكون أحيانًا "أكثر أهميةً من المعنى الفعلي للكلمات"، تعمل مجموعة بيانات التدريب المحتوية على الوحدات الصوتية على تمكين شيمون من أن ينتج بغزارة صيغًا إيقاعيةً مبنيةً على الكلمات المفتاحية، ثم يقوم الروبوت بعد ذلك بإدراج النغمة الإيقاعية في ثنايا حديثه.

يتحتم أن تكون أنظمة شيمون سريعةً بما يكفي للاستجابة في الزمن الحقيقي، ومن دون المساس بجودة الأداء، لتحقيق ذلك، اتخذ الباحثون عدة قرارات صارمة في البرمجة، مثل الوصول بمفردات الاستجابة لدى شيمون إلى حوالي ثلاثة آلاف كلمة، وتقليص الفترة الزمنية التي "سيصغي" فيها شيمون إلى منافسه، حتى الآن، يستطيع شيمون أن يرد بالقافية في أقل من سبع ثوانٍ، وأن يرتجل في الوقت ذاته إيماءات من قبيل هزّ الرأس أو تحريك الحاجبين، ومن شأن تحديث المكوّنات المادية في شيمون -كتزويده بوحدة أقوى لمعالجة الصور- أن يجعل أداءه في النهاية أسرع.

ليس من بين مكوّنات شيمون مكوّن واحد جديد بالكلية من الناحية التقنية، لكن تجميع الأجزاء على هذا النحو تحديدًا هو الجديد، وفق بريم سيتارامان، الباحث العلمي بالشركة التقنية الناشئة «دسكريبت» Descript، الذي لم يشارك في مشروع شيمون، ويضيف سيتارامان: "ينغلق مجال الروبوتات الناطقة بوجه عام على بضعة تخصصات مختلفة، مثل تحويل الكلام المنطوق إلى نص، وتحويل النص إلى كلام منطوق، أي موسيقى، ويقترب المجال من تحقيق مستوى مناسبٍ [كافٍ] من التعقيد، بحيث يصبح الأشخاص قادرين على ربط هذه [المكوّنات] معًا؛ لتكوين أنظمة تفاعلية بديعة حقًّا".

بالإضافة إلى القيمة المتمثلة في أن شيمون ابتكارٌ غير مسبوق، يريد واينبرج لروبوته أن يتيح للأشخاص فرص تجربة أنواع جديدة من الموسيقى، فيقول: "لا أجد أمرًا استثنائيًّا في أن يؤدي [شيمون] ما يؤديه دون البشر… باعتباره نظامًا موسيقيًّا مستقلًّا بالكامل"، ويضيف أن ما يطمح إليه هو أن يشهد روبوتاته "تتواصل وتتفاعل مع [البشر] وتلهمهم بطرق مدهشة"، لم يسبق لواينبرج قَط أن كتب كلمات الأغاني من قبل، لكنه يقول إن شيمون مكَّنه للمرة الأولى من إنتاج الأغاني، ويضيف أيضًا أنه تلقى طلبات للمساعدة من شعراء الأغاني الذين أصابهم النضوب الأدبي.

يقول سيتارامان -وهو نفسه موسيقي ترويحي- إنه متحمس بشأن الإمكانات التي من شأن تقنية شيمون أن توفرها لغير الموسيقيين، ويستطرد شارحًا: "تستطيع الأجهزة التي تستخدم الذكاء الاصطناعي أن تذلل العقبات التي تحول دون الدخول… إلى عالم صناعة الفن؛ فالناس ينتجون فنًّا طوال الوقت، فتراهم يصنعون قصص الإنستجرام و[فيديوهات] التيك توك".

بيد أن المحترفين المختصين لديهم بعض التحفظات، يقول ريس لانجستون -وهو مغنّي راب وفنان وسائط متعددة لم يشارك في مشروع شيمون- إنه متشوق لغناء الراب بصحبة شيمون، خصوصًا وأن جائحة كوفيد-19 قد حدّت من التفاعلات بين الأشخاص، وهي التفاعلات التي استلهم منها معظم أعماله، ويضيف لانجستون أن ما يستطيع الذكاء الاصطناعي تحقيقه مبهر فعلًا، لكنه يشير أيضًا إلى أن الروبوتات لا تستطيع ببساطة التقاط بنات أفكار الإلهام التي تنشأ أحيانًا بالصدفة من أمور مثل الأخطاء البشرية، يشرح لانجستون ذلك قائلًا: إن الأخطاء التي تنشأ بالصدفة في أثناء جلسة التسجيل عادةً ما تجد طريقها إلى الألبوم الفنّي النهائي؛ لأنها تبدو رائعة إلى درجة مدهشة، يقول لانجستون في النهاية إن المصادفات "تطلق العنان للإمكانيات، لأن جميع المكوّنات [في الألبوم الفنّي النهائي] لا تكون مخططة مسبقًا، هل تستطيع أن تعلّم الآلة ارتكاب أخطاء من هذا القبيل؟".