كانت فكرة مساعد إنساني للذكاء الاصطناعي الذي يمكنك التحدث به منذ نشر فيلم “هي” ، Spike Jonzes 2013 عن رجل وقع في حب الذكاء الاصطناعي الذي يشبه سيري يدعى سامانثا. في سياق الفيلم ، لم يكن بطل الرواية مع سامانثا ، كما قد تظهر ، إنسانًا ولن يكون بشريًا أبدًا.
بعد مرور اثني عشر عامًا ، لم يعد هذا الأمر الخيال العلمي. تساعد أدوات الذكاء الاصطناعى التوليدي مثل chatt ومساعدي الرقمية مثل Apple's Siri و Amazon الناس على الحفاظ على التعليمات ، وإنشاء قوائم البقالة وأكثر من ذلك بكثير. ولكن تمامًا مثل سامانثا ، لا تزال أنظمة التعرف على الكلام التلقائي لا تستطيع أن تفعل كل ما يمكن أن يفعله المستمع البشري.
من المحتمل أن تكون لديك تجربة محبطة للاتصال وتكرار مصرفك أو شركة التوريد حتى يتمكن روبوت خدمة العملاء الرقمي من فهمك في السطر الآخر. ربما تكون قد تملي ملاحظة على هاتفك فقط لقضاء بعض الوقت للعمل مع الكلمات المشوهة.
أظهر الباحثون اللغويون وعلوم الكمبيوتر أن هذه الأنظمة تعمل بشكل أسوأ بالنسبة لبعض الناس أكثر من الآخرين. إنهم يميلون إلى ارتكاب المزيد من الأخطاء إذا كان لديهم غير محلي أو لهجة إقليمية ، فهي سوداء ، باللغة الإنجليزية من أصل أفريقي في اللغة الإنجليزية ، مفتاح التعليمات البرمجية ، إذا كانت امرأة ، فهي صغار جدًا أو تعاني من إعاقة في اللغة.
القصدير
على عكس أنت أو أنا ، فإن أنظمة التعرف على الكلام التلقائي ليست ما يسميه الباحثون “مستمعين محبوبون”. بدلاً من محاولة فهمهم من خلال أخذ معلومات مفيدة أخرى مثل التجويد أو إيماءات الوجه ، فإنهم ببساطة يستسلمون. أو تقوم بتخمين احتمالي ، حركة يمكن أن تؤدي في بعض الأحيان إلى خطأ.
نظرًا لأن الشركات والسلطات العامة تعمل بشكل متزايد على تطبيق أدوات التعرف على الكلام التلقائي لتقليل التكاليف ، فإن الأشخاص ليس لديهم خيار من التفاعل معهم. كلما زاد استخدام هذه الأنظمة في المناطق الحرجة وتتراوح من مساعدي الطوارئ إلى الرعاية الصحية وسلطات إنفاذ القانون ، زاد احتمال وجود عواقب وخيمة إذا لم يتعرفوا على ما يقوله الناس.
تخيل أنك أصيبت في حادث سيارة في المستقبل القريب. يمكنك اختيار 911 لتحدي المساعدة ، ولكن بدلاً من الاتصال بمرسل بشري ، ستتلقى روبوتًا مصممًا لعدم تعليق أي مكالمات طارئة. تحتاج إلى عدة جولات لفهم الوقت ، وإهدار الوقت وزيادة خوفك من الخوف في أسوأ لحظة.
ما الذي يسبب هذا النوع من الخطأ؟ يتم دمج بعض التفاوتات الناتجة عن هذه الأنظمة في أطنان من البيانات اللغوية التي يقوم المطورون بإنشاء نماذج كبيرة. يقوم المطورون بتدريب أنظمة الذكاء الاصطناعي لفهم اللغة البشرية وتقليدها من خلال تغذية كميات كبيرة من الملفات النصية والصوتية بلغة إنسانية حقيقية. ولكن من خطابك تطعمهم؟
إذا حقق النظام معدلات دقة عالية في المحادثة مع الأميركيين البيض الأثرياء في منتصف 1930s ، فمن المعقول افتراض أنه تم تدريبه مع العديد من التسجيلات الصوتية للأشخاص الذين يتناسبون مع هذا الملف الشخصي.
مع الحصول على البيانات الصارمة من مجموعة متنوعة من المصادر ، يمكن لمطوري الذكاء الاصطناعي تقليل هذه الأخطاء. ومع ذلك ، من أجل بناء أنظمة الذكاء الاصطناعى التي يمكنها فهم الاختلافات اللانهائية في اللغة البشرية ، والتي تنجم عن أشياء مثل الجنس والعمر والعرق والأول ضد اللغة الثانية والحالة الاقتصادية والقدرة وأكثر من ذلك بكثير ، تتطلب موارد كبيرة ، و وقت.
اللغة الإنجليزية “الصحيح”
بالنسبة للأشخاص الذين لا يتحدثون الإنجليزية – أي أن معظم الناس في جميع أنحاء العالم – التحديات أكبر. تم بناء معظم أنظمة الذكاء الاصطناعى في العالم في اللغة الإنجليزية وتعمل بشكل أفضل في اللغة الإنجليزية أكثر من أي لغة أخرى. على الورق ، يتمتع الذكاء الاصطناعى بإمكانية ترجمة البرجوازية الرائعة والوصول إلى الأشخاص إلى المعلومات بلغات مختلفة ، ولكن في الوقت الحالي ، فإن معظم اللغات لديها بصمة رقمية أصغر ، مما يجعل من الصعب عليهم تشغيل نماذج لغة كبيرة.
حتى ضمن اللغات التي تدعمها نماذج صوتية كبيرة مثل اللغة الإنجليزية والإسبانية ، تختلف تجربتها اعتمادًا على لهجة لغتهم التي يتحدثون بها.
تعكس معظم أنظمة التعرف على الكلام ودردشة الذكاء الاصطناعي حاليًا التحيزات اللغوية لسجلات البيانات التي يتم تدريبها. وهي تعكس الأفكار الإلزامية ، وأحيانًا متحيزة عن “الصواب” في اللغة.
في الواقع ، أظهر الذكاء الاصطناعى التنوع اللغوي. يوجد الآن شركات منظمة العفو الدولية التي تقدم لحذف لهجات مستخدميها ولها تأثير على افتراض أن عملائها الأساسيين سيكونون مقدمي خدمات العملاء مع مراكز الاتصال في الخارج مثل الهند أو الفلبين. أدى العرض إلى خلد فكرة أن بعض اللهجات أقل وضوحًا من غيرها.
اتصال بشري
من المحتمل أن تكون الذكاء الاصطناعى أكثر قدرة على معالجة اللغة ومعالجة المتغيرات مثل اللهجات وتبديل الكود وما شابه. في الولايات المتحدة ، تلتزم الخدمات العامة بموجب القانون الفيدرالي بضمان الوصول العادل إلى الخدمات ، بغض النظر عن اللغة التي يتحدث بها الشخص. ومع ذلك ، ليس من الواضح ما إذا كان هذا وحده سيكون حافزًا كافيًا لصناعة التكنولوجيا للقضاء على عدم المساواة اللغوية.
يمكن أن يفضل الكثير من الناس التحدث إلى شخص حقيقي إذا طرحوا أسئلة حول قالب تشريعي أو مشكلة طبية أو على الأقل لديهم فرصة لاختيار التفاعل مع الأنظمة الآلية عند البحث عن الخدمات الرئيسية. هذا لا يعني أن سوء الفهم في التواصل الشخصي لا يحدث أبدًا ، ولكن عندما تتحدث إلى شخص حقيقي ، فأنت مستعد لتكون مستمعًا محبوبًا.
على الأقل في الوقت الراهن يعمل إما أم لا. إذا تمكن النظام من معالجة ما تقوله ، فيمكنك البدء. إذا لم يكن هذا هو الحال ، فإن المسؤولية هي أن تفهم نفسك.
روبرتو ري أغودو ، مساعد باحث في كلية دارتموث الإسبانية والبرتغالية
سيتم إصدار هذه المقالة من المحادثة بموجب ترخيص Creative Commons. اقرأ المقال الأصلي.