"شات جي بي تي يحاكي المشاعر بالصوت…تطور لافت"

شَهِد عالم الذكاء الاصطناعي نقلة جديدة مع إعلان "أوبن إيه آي" عن تطوير واضح في خاصية المحادثة الصوتية ضمن منصة "شات جي بي تي"، حيث أصبح الصوت أقرب إلى النبرة البشرية في تعبيره وإيقاعه وانفعاله، هذه الخطوة جاءت لتعزيز التفاعل بين الإنسان والآلة، وتنقل المحادثات إلى مستوى غير مسبوق من الواقعية والسلاسة، ما يجعل تجربة المستخدم أكثر دفئاً وطبيعية.
التحديث الجديد لا يقتصر على تحسين نغمة الصوت أو نقائه، بل يتعدى ذلك إلى ما يمكن تسميته "لغة جسد رقمية"، تنعكس في التوقفات الطبيعية بين الكلمات، والتنهيدات الطفيفة، والنبرة التي تتغير بحسب السياق والمحتوى، ما يمنح المستخدم إيحاءً بأنه يتحدث إلى شخص حقيقي أكثر من كونه يتفاعل مع برنامج ذكي.
إقرأ ايضاً:الشباب السعودي يبدعون في خدمة ضيوف الرحمن.. نماذج مشرقة من العطاء والتطوع في موسم حج 2025الأمير سعود بن مشعل يعلن نجاح الحج ويشيد بجهود المنظومة
تأتي هذه التحديثات ضمن إطلاق نموذج GPT-4o الجديد، الذي يمثل طفرة في قدرة الذكاء الاصطناعي على معالجة الصوت والنص والصورة في وقت واحد، وبكفاءة لحظية، الأمر لم يعد مجرد تلقي إجابات جاهزة بصوت آلي، بل بات تفاعلاً لحظياً يماثل الحوارات اليومية التي نخوضها مع الآخرين، ومع أن هذه الميزة ما زالت تُتاح تدريجياً للمستخدمين المشتركين في باقة "بلاس"، فإن المؤشرات تشير إلى أن الشركة تمضي بخطى حثيثة لتوسيع نطاق الإتاحة، ما سيجعل التجربة الصوتية في "شات جي بي تي" معيارًا جديدًا في عالم الذكاء التوليدي.
التفاعل الصوتي في صورته المطورة أصبح يتضمن ترديدات طبيعية، مثل "مم" و"أها"، وهي ردود تلقائية يتوقعها الدماغ البشري ضمن المحادثات الطبيعية، وهذا يعكس ذكاء النموذج في محاكاة العادات اللفظية البشرية، ما يجعله أقرب ما يكون إلى رفيق ذكي يمكن التحدث إليه في أي وقت، دون أن يبدو ردوده باردة أو ميكانيكية، ويتوقع الخبراء أن هذه التطورات الصوتية ستفتح أبواباً جديدة في مجالات مثل التعليم عن بُعد، والرعاية الصحية النفسية، وخدمة العملاء، إذ يمكن للمستخدم أن يشعر براحة أكبر وهو يتحدث إلى صوت يبدو حقيقياً، متفهماً، بل وربما "متعاطفاً".
ورغم أن "أوبن إيه آي" لم تكشف بالتفصيل عن التقنية المستخدمة لصقل هذا الصوت البشري، إلا أن من الواضح أن العمل قد شمل نمذجة آلاف الساعات من التسجيلات الصوتية، وتحليل الأنماط اللغوية والانفعالية في الحوار البشري، النتيجة كانت خلق خمس شخصيات صوتية مختلفة، لكل منها طابعها وطبقتها، ويمكن للمستخدم الاختيار بينها حسب مزاجه أو نوعية استخدامه، وهذا التنوع يعكس وعياً متقدماً بفكرة التخصيص التي تهم المستخدم في هذه الحقبة الرقمية.
الميزة الأكثر إبهاراً في هذا التحديث أن الزمن اللازم للرد الصوتي لا يتجاوز 320 مللي ثانية، وهو نفس المعدل الطبيعي لرد الإنسان في المحادثة، ما يعني أن المحادثة لا تتعرقل بزمن انتظار، بل تسير بسلاسة مذهلة، هذا التحديث يضع "شات جي بي تي" في منافسة مباشرة مع المساعدين الصوتيين التقليديين مثل "سيري" و"أليكسا"، بل ويتفوق عليهم في نواحٍ عدة بفضل قدرته على التفاعل العميق، والإجابة التحليلية، والانفعالات الصوتية الدقيقة.
ردود فعل المستخدمين الأوائل جاءت إيجابية إلى حد كبير، حيث وصف كثيرون الصوت الجديد بأنه "أكثر إنسانية من بعض البشر"، في إشارة إلى مدى اقترابه من الطبيعي، كما أشادوا بالاستجابة السريعة والردود الأكثر تنوعاً ودفئاً، وهي خصائص تسهم في بناء علاقة أكثر قرباً بين المستخدم والتطبيق، وهو ما قد يعزز الاعتمادية عليه في الحياة اليومية، من الجدير بالذكر أن هذا التطور لم يُصاحب بأي زيادة في السعر، بل اعتُبر جزءاً من حزمة التحديثات التي تعِد بها "أوبن إيه آي" بشكل دوري لمشتركيها.
ولا يغيب عن الأذهان البُعد الفلسفي والأخلاقي لمثل هذا التطور، إذ بدأ البعض يتساءل: هل اقتربنا من مرحلة يصبح فيها الصوت الصناعي بديلاً حقيقياً للصوت البشري في الحوار والتواصل؟ وهل سيسهم هذا التقدم في تقليل الحاجة للتفاعل الإنساني أم سيُستخدم كأداة مساعدة فقط؟ ورغم أن الجواب ما زال في طور التكوين، إلا أن الواقع يفرض أن نتعامل مع الذكاء الاصطناعي الصوتي ليس فقط كأداة، بل كواجهة جديدة للحياة الرقمية والتفاعل اليومي.
في النهاية، يبدو أن "شات جي بي تي" لم يعد مجرد روبوت يرد على الأسئلة، بل بات صديقاً يمكنه أن يصغي، يتفاعل، يضحك أحياناً، ويتحدث بلغة تشبهنا أكثر من أي وقت مضى، هي خطوة أخرى نحو مستقبل يبدو فيه الفرق بين الإنسان والآلة أقل وضوحاً، وأكثر اندماجاً.