Кожен з нас стикався з такою ситуацією – стоячи в кімнаті, повній людей, тримаючи в руках напій, намагаючись почути, що говорить сусід. Це явище отримало назву “проблема коктейльної вечірки”. Люди неймовірно вправно ведуть бесіду з одним співрозмовником, але при цьому відфільтровують сторонні голоси. Проте, до недавнього часу, технології не могли відтворити цю навичку.
Це питання має велике значення, коли йдеться про використання аудіо доказів у судових справах. Фонові голоси можуть ускладнити визначення того, хто говорить, і що саме сказано, що робить записи фактично непридатними.
Зародження ідеї у судовій справі
Електротехнік Кіт МакЕлвін, засновник та технічний директор компанії Wave Sciences, зацікавився цією проблемою, коли працював на уряд США у справі про військові злочини.
“Ми намагалися з’ясувати, хто віддав наказ про масове вбивство мирних жителів. Однією з частин доказів були записи, де багато людей говорили одночасно – і ось тоді я дізнався, що таке “проблема коктейльної вечірки”, – розповідає він.
Використання штучного інтелекту
МакЕлвін зрозумів, що рішення полягає у використанні штучного інтелекту, щоб спробувати визначити і відфільтрувати всі конкурентні звуки залежно від їхнього походження в кімнаті.
Коли компанія Wave Sciences була заснована у 2009 році, її метою було розробити технологію, яка могла б відокремлювати накладені голоси. Спочатку фірма використовувала велику кількість мікрофонів у технології, відомій як «паралельне формування променів». Проте відгуки потенційних партнерів говорили про те, що система вимагала занадто багато мікрофонів і не завжди забезпечувала задовільні результати.
Досягнення успіху
Після десяти років досліджень, компанія нарешті знайшла розв’язання цієї проблеми та подала заявку на патент у вересні 2019 року. Технологія може аналізувати, як звук відбивається в кімнаті перед тим, як досягти мікрофона або вуха.
Результати досліджень виявили, що ця технологія може працювати навіть з лише двома мікрофонами так само добре, як і людське вухо, а з більшою кількістю мікрофонів – ще краще.
Використання в криміналістиці
Технологія вперше була використана в реальному судовому розслідуванні, де її результати стали вирішальними для засудження обвинувачених у вбивстві.
Після арешту двох кіллерів, ФБР підготувало операцію, щоб довести, що вони були найняті родиною, яка проходила через спір щодо опіки над дитиною. Суд дозволив використання алгоритму Wave Sciences, що перетворило до цього неприйнятний аудіоматеріал на вирішальний доказ.
Майбутнє технології
Сьогодні компанія пропонує свою технологію військовим США, а також планує розробити версії продукту для використання в автотехніці, смарт-колонках, augmented та virtual reality, а також у слухових апаратах.
Штучний інтелект вже використовується і в інших сферах криміналістики, так як достовірність аудіо доказів стає все більш актуальною у численних справах.