Вініт Савант уже два роки працює кур’єром на скутері в Мумбаї.
«Бути на дорозі завжди дуже стресово, особливо в таких містах, як Мумбат», – каже він.
Однак, коли він почав свою роботу, мовні бар’єри стали додатковою проблемою.
Його рідна мова – маратхі, а англійською Вініт говорить «дуже погано». «Я можу розуміти, але читати дуже важко», – пояснює він.
Це створювало проблеми на його новій роботі.
«Спочатку було складно. Все було англійською, а я міг зрозуміти частину інформації, але мені було комфортніше на маратхі. Я просив інших кур’єрів допомогти мені зрозуміти, що робити», – розповідає Савант.
Його роботодавець, Zepto, обіцяє «найшвидшу онлайн-доставку продуктів в Індії». Тому, коли водії стикаються з труднощами вчитанні інструкцій, це не найкраща ситуація.
Щоб полегшити цей процес, рік тому Zepto уклала партнерство з Reverie Language Technologies для впровадження служби перекладу на базі штучного інтелекту для своїх водіїв.
З цього часу кур’єри можуть обирати між шістьма мовами в застосунку Zepto.
«Тепер мені не доводиться нічого здогадуватися», – каже Вініт Савант.
«Раніше мені потрібно було більше часу, щоб прочитати інструкції, а іноді я навіть помилявся. Тепер, якщо клієнт пише ‘позвонити у дзвінок’, я отримую цю інструкцію маратхі. Тож мені не потрібно питати або перевіряти знову. Все зрозуміло», – пояснює він.
Складнощі Вініта є типовими.
«В Індії є 22 офіційні мови та сотні діалектів», – каже професор Пушпак Бхаттачар’я, один з провідних експертів у галузі використання штучного інтелекту в індійських мовах з IIT в Мумбаї.
«Без технологій, які розуміють і говорять цією мовою, мільйони людей виключаються з цифрової революції, особливо в освіті, управлінні, охороні здоров’я та банківництві», – зауважує він.
Впровадження нових генетичних систем штучного інтелекту, таких як ChatGPT, зробило цю задачу ще більш терміновою.
Величезні обсяги даних, наприклад веб-сторінок, книг або транскрипцій відео, використовуються для навчання штучного інтелекту.
У широко поширених мовах, таких як гінді та англійська, це відносно просто. Але для інших мов це більш важко.
«Головним викликом для створення моделей індійських мов є доступність даних. Я маю на увазі відфільтровані дані. Грубі дані є, але вони не мають високої якості, їх потрібно фільтрувати», – говорить професор Бхаттачар’я.
«Проблема в Індії полягає в тому, що для багатьох індійських мов, особливо племінних та регіональних діалектів, такі дані просто не існують або не оцифровані».
Reverie Language Technologies зараз впроваджує свою технологію перекладу на базі штучного інтелекту для ряду індійських компаній.
Співзасновник Вівекананда Пані зазначає, що, хоч технології перекладу і полегшать спілкування, існує «потенціал для менш поширених діалектів бути відсунутими на другий план».
«Викликом буде забезпечити, щоб чудові переваги мовних досягнень на основі штучного інтелекту випадково не зменшили багатство людської мови», – додає він.
Щоб допомогти вирішити цю проблему, професор Бхаттачар’я долучився до Bhashini, урядового проекту для розробки високоякісних наборів даних, необхідних для навчання штучного інтелекту.
Крім наборів даних, Bhashini також створила моделі мов на базі штучного інтелекту та послуги перекладу в 22 мовах.
Розпочата у 2022 році, це величезне підприємство вже показало значний прогрес.
Bhashini наразі володіє 350 мовними моделями на базі штучного інтелекту, які обробили більше мільярда завдань.
Більше 50 урядових відомств співпрацюють з Bhashini, разом з 25 державними урядами.
Наприклад, технології Bhashini використовуються для багато мовних чат-ботів у державних послугах та для перекладу урядових програм на місцеві мови.
«Bhashini забезпечує лінгвістичне та культурне представництво Індії, створюючи специфічні для Індії моделі штучного інтелекту замість того, щоб покладатися на глобальні платформи», – говорить Амітаб Наг, генеральний директор Digital India, підрозділу Bhashini.
Він сподівається, що протягом наступних двох-трьох років сільські користувачі матимуть доступ до голосових урядових послуг, фінансових інструментів та інформаційних систем на рідних мовах.
Ці індійські набори даних сподіваються в один день дати розробникам, які займаються створенням моделей на основі штучного інтелекту, інструменти для значного полегшення адаптації їх для всієї популяції.
На даний момент проектування будь-якої програми штучного інтелекту для роботи з складними процесами, такими як охорона здоров’я, може бути вкрай складним.
Кшитидж Ядава, асоційований професор Коіта Центру цифрового здоров’я в IIT Мумбаї, працює над програмою штучного інтелекту, яка допоможе людям кинути палити.
Він пояснює, що люди на різних етапах процесу потребують різних порад, і зазвичай необхідно мати добре підготовлену людину, яка може оцінити ситуацію.
Однак існує обмежена кількість практиків, які можуть допомогти, особливо тих, хто може спілкуватися кількома мовами, тому професор Ядава сподівається, що його модель штучного інтелекту зможе заповнити цю прогалину.
Штучний інтелект «спочатку ідентифікує, який вид спілкування потрібен людині, і відповідно формулює запитання, демонструє емпатію, емоції», – говорить професор Ядава.
І сподівається, що все це врешті-решт буде зроблено 22 мовами. Початкові експерименти вже проводяться англійською та гінді.
«Це буде дуже індивідуально, це не буде просто стандартне рішення», – підсумовує він.
Назад на вулицях міста, Вініт Савант збільшив кількість посилок, які він доставляє, з десяти до приблизно тридцяти на день, частково завдяки функції перекладу в застосунку для доставки.
Він вважає, що це допоможе ще більшій кількості людей, схожих на нього.
«Це дає нам відчуття приналежності. Не всі розуміють англійську. Коли застосунок говорить нашою мовою, ми відчуваємо себе впевненішими, і працюємо краще», – підсумовує він.