Спрашивают: когда правильные переводчики станут электронными и их поставят на поток?

топ 100 блогов sergeiv03.10.2015 Задает вопрос drugman2013:

Кстати, Сергей

В Скайп заработал синхронный переводчик на 50 языков
Понятно, что сейчас он кривой и глючный как моя жизнь - но это только вопрос времени
Как по твоему экспертному мнению - когда правильные переводчики станут электронными и их поставят на поток, и на переводах можно будет заработать денег разве что на мороженку?


Тема интересная, отвечаю в посте. Я не знаю подробностей кто и как сейчас решает эту задачу, не встречал публикаций на тему, вижу только тоже, что и все, то есть результаты. Из того, что я вижу, вроде google translate, задачу пытаются решить чисто механическим путем, подставляя перевод отдельных слов. Похоже потом их как то пытаются дружить между собой, но не очень успешно. На мой взгляд, это тупиковый путь, речь и общение это не отдельные слова, а смысловые блоки, "перевести" их таким "тупым" способом нельзя.

С другой стороны, само появление электронных словарей сильно облегчило жизнь. Раньше надо было иметь кучу толстенных дорогущих книжек и листать их в поисках каждого слова, как это заёбывает - не передать.

Сейчас существуют различные профессиональные переводческие программы, типа Trados, которые "запоминают" куски текста и словосочетания, которые ты уже переводил, и их можно копировать из памяти, когда абзац повторяется, например, очень удобно и полезно.

Тем не менее, данный способ увы, сильно ограничен и возможности его исчерпаемы, требует наличия человека.

Если бы подобную систему делал я, я бы пошел по другому пути. Как известно перевод - это контекст, когда одно и тоже слово может иметь совершенно разные значения, в зависимости от того, в какой ситуации, теме, окружении других слов оно употребляется. Выше уже писал, что по сути общение состоит из "смысловых блоков", законченных посланий разной длины, которые люди пытаются друг другу отправить. Packet loss, кстати, очень нехилый в данном несовершенном процессе, есть над чем работать. Так вот. Довольно большое количество таких блоков весьма стандартны и так называемые "наивные носители языка", люди, для которых язык родной, о них даже не задумываются. Все эти "привет как дела", "пойдем выпьем пива", "сколько это стоит почему так дорого" абсолютно не уникальны и составляют процентов 90% необходимого общения. Кстати, этими блоками начинающие переводчики овладевают в первую очередь, очень смешно наблюдать как они немеют или начинают нести отсебятину, как только речь заходит о нестандартных вещах, чувствах, абстракциях, узкоспециальной лексике. В общем я бы шёл по пути big data, то есть собирал базу данных не отдельных слов, а смысловых блоков таких, базовый уровень общения получится довольно быстро, если мощности позволят, так как варианты весьма конечны. Ну а дальше задрачивать по темам, причём с привлечением конечных пользователей к затачиванию точности и количества возмонжных вариантов. В конце будет прикольно, если холодильники и мультиварки, когда наконец паработят человечество, смогут нормально острить.

В общем задача имеет решение и, думаю на базовом уровне будет решена довольно скоро, лет 10-15, а дальше вопрос потребности в замене живых переводчиков на автоматы. Выгодно это делать только на потоке, чем менее популярна область/лексика, тем больше плюсов у живого специалиста. Насчёт мороженки разочарую - расценки будут только дорожать плюс понты. А вот ряды малолетних долбоёбов в бизнесе резко поредеют это точно.

Для предметного обсуждения ниже тот же текст в переводе Google Translate на английский. Вы как хотите, но я вижу тот же перевод отдельных слов без контекста и постановки в правильную форму, он даже устойчивые выражения не берёт:



They ask (переводчик не знает примеров типа "спрашивают-отвечаем: When will be the right interpreters (вместо общего "переводчики" влеплены синхронисты, при этом ниже, где именно речь про синхронистов, влеплены несуществующие simultaneous translators) of electronic and put on stream (куда просран перевод слова "станут"? "поставить на поток" это устойчивое выражение, почему хваленый гугл его не знает?

No questions drugman2013 (Каким образом "задает вопрос" превратилось в No questions (нет вопросов")?:

By the way, Sergey (Чудо, чудо железяка справилась!)

Ну и дальше порнография по тексту.

Skype earned simultaneous translator into 50 languages
It is clear that he is now a curve and buggy as my life - but it's only a matter of time
As for your expert opinion - when the right translators will be electronic and put on stream, and transfers can be to earn money except on Morozhenko?


Interesting topic, reply to the post. I do not know the details of who and as it is now solves this problem does not occur publications on the subject, can only see the same thing as all that is results. From what I see, like google translate, try to solve the problem by purely mechanical means, substituting the translation of individual words. It looks like that then they are trying to be friends with each other, but not very successfully. In my opinion, this is a dead end road, speech and communication is not individual words and semantic blocks, "translate" them in such a "stupid" way it is impossible.

On the other hand, the very appearance of electronic dictionaries much easier life. Previously, it was necessary to have a thick pile of doroguschih books and flipping them in the search for each word as it zaёbyvaet - can not convey.

Now there are a variety of professional translation software such as Trados, which "remembers" pieces of text and phrases that you have already translated and can be copied from the memory, when a paragraph is repeated, for example, it is very convenient and useful.

However, this method is unfortunately greatly restricted and the possibility of exhaustible, requires human.

If such a system I did, I would have gone the other way. As known transfer - this context, when the same word may have entirely different meanings, depending on the situation in which, subject, environment other words it is used. We have already written that essentially consists of a dialogue "semantic units", complete letters of varying lengths that people are trying to send to each other. Packet loss, by the way, very sickly in this imperfect process, a lot of work. So. Quite a large number of such blocks is very standard and so-called "naive native speakers," people for whom the native language, of them did not even think. All of these "hello how are you", "let's go have a drink beer," "how much is it why so expensive" absolutely unique and make up 90% percent of the required communication. By the way, these blocks novice translators master in the first place is very funny to watch how they are numb and begin to bear gag as soon as it comes to non-standard things, feelings, abstract, highly specialized lexicon. In general, I would have walked the path of big data, ie collected database is not individual words and semantic units, such a basic level of communication happens fairly quickly if the power will allow, as options rather finite. Well, after zadrachivat clip art, and with the involvement of end users and the amount of sharpening precision vozmonzhnyh options. At the end it will be cool when refrigerators and Multivarki when finally parabotyat humanity will be able to fine island.

In general, the problem has a solution, and I think at the basic level will be resolved very soon, 10-15 years, and then the question needs to be replaced translators living machines. Is advantageous to do so only on the stream, the less popular areas / vocabulary, the greater the advantages of a living specialist. As for Morozhenko disappoint - prices will rise in price only plus Ponte. But the ranks of young stupid ass in the business dramatically thinned sure.

Дорогие эксперты в области машинного перевода, будьте добры, объясните, почему ваш переводчик так обосрался и пропускает слова, не говоря уже об учете контекста?

Как так получается, что вы специалисты, а косяки у вас детские до сих пор? И даже я, ни разу не специалист в "машинном переводе" знаю, как их забороть, а вы нет?




Оставить комментарий

Архив записей в блогах:
Сразу нужно сказать, что перед нами не совсем тридцатьчетверка, а его китайская версия-тип 58. Не секрет, что китайцы являются заядлыми копиистами чуть ли не всего и вся и военная техника тут не исключение. Но даже взяв за основу какой либо образец они, обычно, не делают абсолютно точную ...
Интересно, кремлёвские работники будут ходить в Ашан, который скоро откроется на Тверской улице у стен Кремля. Три этажа площадью более 750 квадратных метров. Здесь будет представлено все самое лучшее, что есть у сети, но с широким ассортиментом кулинарии и свежей продукции, так как ...
Если говорить о состоянии федеральной бюджетной системы, сразу налицо фактор дотационности некоторых субъектов федерации. В частности, дотационными являются такие национальные республики, как Марий-Эл, Сахалин, Ингушетия. О последней республике стоит упомянуть более развернуто. Итак, ...
Наши «друзья» берут у нас деньги двумя пальчиками, брезгливо морщатся и крутят своими чувствительными носиками. Они делают нам одолжение. А взяв деньги, перестают с нами здороваться. Очередная многоходовочка состоялась ..)) Больше всего удивляет позиция российских державников. Иран, оттал ...
YaromilaVolkova все записи автора Растительное масло (ореховое или подсолнечное) способно связывать и впитывать все вредные и ненужные организму вещества. При очищении маслом восстанавлива ...