Як працює Skype Translator
Зміст:
- Технологія, яка робить це можливим
- З однієї розмовної мови на іншу за кілька секунд
- Тестова програма як відправна точка
Наукова фантастика сповнена посилань на технологічно просунуті пристрої, роботу яких, якщо перефразувати міфічний вислів, неможливо відрізнити від магії. Виходячи з творчого розуму їхніх авторів, важко уявити, коли такі винаходи можуть опинитись у наших руках, і ми зрештою визнаємо, що їх існування не стане частиною нашого життєвого циклу. Але час від часу хтось із них пробирається в наше життя передчасно. Це стосується перекладу в реальному часі, який Microsoft і Skype збираються зробити можливим
"Завдання зовсім не просте.Він включає можливість Skype для відеоконференцій, величезну мережу хмарних серверів Microsoft Azure, технологічні інновації Microsoft Research і останні досягнення в багатьох сферах, таких як статистика та машинне навчання. Усе це до ваших послуг, щоб, як тільки ви вимовляєте речення вашою мовою, система розпізнавала те, що ви говорите, перекладала його та передавала вашому контакту іншою мовою. Як це можливо?"
Технологія, яка робить це можливим
Skype Translator, назва, під якою відома нова функціональність, не є блискавкою, навіть через рік . Перекладач Skype є результатом десятиліть досліджень розпізнавання мовлення, машинного перекладу та методів машинного навчання. У всіх цих сферах функціонує система, яка була б неможливою без останніх досягнень у них.
Перекладач Skype є результатом десятиліть досліджень розпізнавання мовлення, машинного перекладу та машинного навчання.Починаючи з розпізнавання мовлення, технології, яка досліджувалася протягом деякого часу, але на впровадження якої завжди впливала велика кількість помилок і надмірної чутливості існуючих систем. Секунди сумніву, невеликих варіацій акценту або мінімального шуму було достатньо, щоб заплутати комп’ютер і змусити його зрозуміти, чого він хоче. Так було до тих пір, поки не почався розвиток методів «глибокого навчання» та створення штучних нейронних мереж, про які Microsoft Research дещо знає. Завдяки їм вдалося значно зменшити кількість помилок і підвищити надійність і стійкість розпізнавання мовлення, необхідного першого кроку для роботи Skype Translator.
машинний переклад — ще один очевидний стовп, на якому тримається Skype Translator. Тут Microsoft знову використовує власні технології та використовує механізм перекладу Bing для перекладу тексту з однієї мови на іншу.Його система використовує комбінацію методів розпізнавання синтаксису та статистичних моделей для уточнення результату. Крім того, з цієї нагоди механізм був спеціально навчений розпізнавати тип мови, який зустрічається в розмовах, далекий від правильності та охайності, яка зазвичай передбачається в письмовій формі. Таким чином, система Skype Translator поєднує в собі величезну базу мовних знань Bing Translator разом із великим набором слів і фраз, які зазвичай використовуються в розмовній мові.
Але мова та мови — це складна місцевість. Вони постійно змінюються, вони бувають різних смаків і різновидів, кожна людина має свій особливий стиль тощо. Перекладач Skype має все це встигати, вимагаючи постійного навчання та оптимізації як розпізнавання мовлення, так і машинного перекладу. Для цього систему було побудовано на надійній платформі «машинного навчання», галузі штучного інтелекту, яка спрямована на розробку методів, які дозволяють машинам і алгоритмам навчатися шляхом навчання із зразковими даними.Використання цих методів, поширених у сфері статистики, дозволяє покращувати службу в міру її використання, використовуючи дані, отримані під час її використання, для подальшого вдосконалення розпізнавання мовлення та автоматичного перекладу.
Деякі з цих тестових даних генеруються автоматично з різноманітних джерел, включаючи соціальні мережі, такі як Facebook, перекладені веб-сторінки, відео з субтитрами або навіть розмови, створені для цієї мети та транскрибовані та перекладені вручну . Але інша частина даних надходить із реальних розмов, що проводяться через сервіс. Це важливо, тому що, оскільки Microsoft сповіщає вас про кожен виклик, ви повинні знати, що Skype Translator може записувати розмови, зберігаючи їх анонімними, щоб потім їх можна було проаналізувати за допомогою його алгоритмів і впровадили в процес навчання їх статистичні моделі.
Перекладач Skype може працювати належним чином, лише якщо він здатний навчатися за допомогою процесу, заснованого на його використанні в реальних людських розмовах
"Система не могла б функціонувати без цього процесу навчання. Коли люди говорять, ми зупиняємось і повторюємо речі, робимо помилки та змінюємо наше мислення по ходу. Представляючи ahs, ehms, uhms>лише знання про їх фактичне використання може покращити його "
З однієї розмовної мови на іншу за кілька секунд
Підтримуючи всі ці досягнення, ключовим є те, що Skype Translator може виконувати весь процес розпізнавання та перекладу швидко та прозоро для користувача Кожного разу, коли ми говоримо, система повинна розпізнавати те, що ми говоримо, перекладати це на мову одержувача та повідомляти йому це таким чином, щоб залишатися вірним тому, що ми спочатку намагалися повідомити.Чим менше ми помічаємо проміжні кроки, тим краще.
Як тільки система виявляє, що ми говоримо, вона починає записувати те, що ми говоримо, і запускає процес розпізнавання мовлення Це не про те, щоб не тільки розпізнавати кожне слово, яке ми вимовляємо, але й виключати все зайве, видаляючи безглузді вирази та шуми, виявляючи поділ тексту на речення, з додаванням розділових знаків і великих літер, надаючи йому контекст. це допоможе вашій інтерпретації. Коли трохи подумаєш, то розумієш, як важко все це визначити з усної мови.
Перекладачу Skype потрібно, щоб розпізнавання мовлення було якомога точним, тому що далі йде підготовка зібраної інформації для порівняння зі статистичними моделями, які вдосконалюються через свою систему «машинного навчання».Тут процес полягає в пошуку подібності між тим, що система зрозуміла, що ми говоримо, і словами та контекстами, що містяться в моделях, щоб потім застосувати раніше вивчені перетворення, які перетворюватимуть аудіо на текст і перекладатимуть його на іноземну мову.
На завершальному етапі Skype підготував пару ботів із жіночим і чоловічим голосами, які виступають перекладачами під час розмови Після вибору користувачем одного з них він відповідатиме за передачу нашого перекладеного повідомлення одержувачу, щоб не лише письмові транскрипції та переклади з’являлися на екрані, але й він міг почути їх вголос, ніби третя людина посередник між нами.. Ці боти здатні швидко передати повідомлення, так що той, хто слухає по той бік екрана, отримає повідомлення через кілька секунд після того, як ми його вимовимо.
Тестова програма як відправна точка
Саме присутність ботів як сторонніх спікерів у розмові є однією з деталей, яку ще потрібно відшліфувати. Корпорація Майкрософт визнає, що адаптуватися до них легко для людей, які звикли говорити через перекладача, але для інших це вимагає періоду навчання. І це те, що Microsoft і Skype, можливо, мають намір створити найкращий досвід перекладу в реальному часі, який існує, але для цього їм потрібно, щоб ми навчилися як самі, так і машиниПопередній перегляд Skype Translator — це ще один крок у цьому процесі.
Програма тестування була запущена в середині грудня, запроваджуючи розмовний переклад між двома мовами: англійською та іспанською та письмовий переклад понад 40 Для доступу потрібне запрошення, яке ми можемо запросити, зареєструвавшись на веб-сайті програми. Якщо нам це сподобається, ми можемо спробувати Skype Translator із програм Skype для Windows 8.1 або Windows 10 Technical Preview. В іншому випадку нам доведеться чекати, поки послугу буде продовжено та офіційно опубліковано.
"Як би там не було, Перекладач Skype запрацював саме тоді, коли ми збираємося попрощатися з 2014 роком. Перш ніж закінчити, зупиніться тут на секунду і подумайте про рік, який ви щойно прочитали: дві тисячі чотирнадцять>"
Через | Skype Blogs I, II