أسفر تحليل محتوى 100 مليار تغريدة عن رؤى جديدة فيما يتعلق باستخدام رواد التواصل الاجتماعي لـ"الكلمات الممتدة" عوضًا عن كتابة تلك الكلمات في صورتها التقليدية، ومنها استخدام (nooooo) بدلًا من (no)، أو (yeesss) بدلًا من (yes).

ووفق دراسة نشرتها دورية "بلوس وان" (PLOS ONE)، فقد  تمكن "تايلر جراي" -الباحث بجامعة "فيرمونت"- وفريقه البحثي من استكمال الدراسة الأكثر شمولًا حتى الآن لتحليل الكلمات الممتدة في وسائل التواصل الاجتماعي. ففي اللغة المنطوقة والمكتوبة، يمكن للكلمات الممتدة أن تعدل من معنى الكلمة، فتقوي المعنى أو تغيره، أو تعبر عن شعورٍ ما.

فعلى سبيل المثال، فإن إطالة كلمة "بالتأكيد" لتصبح (suuuuure) بدلًا من (sure) قد تعطي إيحاءً بالسخرية لدى رواد التواصل الاجتماعي، أما إطالة كلمة (yeeeess) بدلًا من (yes) فتشير إلى الإحساس بالإثارة.

يقول "جراي": إذا كانت الكلمات الممتدة نادرة الوجود في الكتابة الرسمية، فإن تزايُد استخدامها في وسائل التواصل الاجتماعي يفتح المجال أمام دراستها بشكل أوسع.

عمل الباحثون على تطوير إستراتيجية جديدة أكثر دقةً لتعريف الكلمات الممتدة في التغريدات واستخدامها في تحليل مجموعة بيانات جرى اختيارها عشوائيًّا لنحو 10% من جميع التغريدات التي أُنشئت بين سبتمبر 2008 وديسمبر 2016، بإجمالي حوالي 100 مليار تغريدة، وقد حدد الباحثون آلاف الكلمات الممتدة في التغريدات مثل استخدام كلمة (ggoooooaall) عوضًا عن (goal)، وحددوا طريقتين رئيسيتين لقياس خصائص الكلمات القابلة للمط، وهي التوازن والتمدد.

توضح الدراسة أن "التوازن يشير إلى درجة الميل لتكرار الأحرف المختلفة. على سبيل المثال، فإن كلمة "ha" لها درجة عالية من التوازن عند مدها، فالحرفان (h) و(a)  يتمتعان بدرجة كبيرة من التوازن؛ لأنه عند إطالتهما يتكرران بالدرجة نفسها. أما كلمة (goal) فهي أقل توازنًا، ويتكرر حرف "o" أكثر من أي حرف آخر في الكلمة.

ويعكس التمدد مدى إمكانية إطالة الكلمة، على سبيل المثال، فإن الكلمة القصيرة أو الأصوات مثل "ha" (ها) تتمتع بدرجة عالية من التمدد؛ لأن الناس عادةً ما يكررونها عدة مرات "hahahahahahahaha" (هاهاهاهاهاهاهاهاها)، أما الكلمات العادية مثل "infinity" فيكون تمددها منخفضًا، فيتكرر الحرف الصائت الأخير فيها فقط "infinityyyy".

وقد قام الباحثون بتطوير أدوات متنوعة وطرق يمكن استخدامها في البحث العلمي مستقبلًا في شأن الكلمات الممتدة، ومنها البحث في الأخطاء الطباعية والأخطاء الإملائية. ويمكن استخدام الأدوات نفسها في معالجة اللغة ومحركات البحث ومرشحات البريد المزعج.

ويشير الباحثون إلى أنهم تمكنوا من جمع الكلمات الممتدة وإحصائها بشكل شامل، ورسمها عبر بُعدين هما التمدد الكلي وتوازُن التمدد، مع تطوير أدوات جديدة ستساعد أيضًا في استمرار الدراسة اللغوية وفي مجالات أخرى، مثل معالجة اللغة، وزيادة القواميس، وتحسين محركات البحث، وتحليل بناء التسلسلات، وأكثر. 

ويقول "بيتر شريدان دودز" -مدير مركز فيرمونت للأنظمة المعقدة بجامعة "فيرمونت"، والمشرف على الدراسة- في تصريحات لـ"للعلم": عملنا يشبه المعجم الحسابي. وستكون المساهمة الأكبر موجهة إلى القواميس الإلكترونية، فعند البحث عن كلمة ممتدة مثل (hahahahaha)، فإن التعريف يشير إلى أنها كلمة ممتدة لأصل كلمة "haha"، فالكلمات الممتدة كلمات حقيقية. وبالنسبة لمعالجة اللغة، سوف يساعد عملنا على إعادة الكلمة إلى أصلها ومساعدة المُدقق الإملائي على أداء عمله. وهناك كلمات ممتدة أكثر طولًا ولكنها نادرة، وإذا استطعنا حسابيًّا تحديد أصل الكلمة، أمكَنَ فهم معناها.

ويضيف "دودز": الخطوة القادمة في البحث تتمثل في تحليل الرموز التعبيرية "الإيموجي" (Emojis)، وهو مصطلح ياباني الأصل يشير إلى الصور الرمزية أو الوجوه الضاحكة، التي يشيع استخدامها في وسائل التواصل الاجتماعي.