Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Автор

Свет в окошке

Подписаться на RSS  |   На главную

Пентагон профинасировал разработку многоязычного автоматизированного переводчика

Управление перспективных исследовательских проектов (DARPA) США выделило компании Raytheon дополнительные 5,9 миллиона долларов на разработку программы автоматизированного анализа и перевода документов MADCAT (Multilingual Automatic Document Classification, Analysis and Translation). Об этом сообщается на сайте компании.
Целью программы является создание универсального продукта, способного оперативно переводить на английский язык содержание рукописных и печатных документов без необходимости последующей обработки лингвистами и аналитиками. Услуги последних допускаются лишь для более детального изучения содержания документов.

Как пояснил глава профильного подразделения Raytheon Прем Натараджан (Prem Natarajan), перевод с иностранных языков в полевых условиях является медленным, ненадежным, труднодоступным и затратным.

Программа MADCAT реализована на базе портативного компьютера (ноутбука) и оснащена модулем оптического распознавания изображений. Разработка программы ведется последние четыре года. Сколько средств на нее было выделено до сих пор, не отмечается.

В настоящее время на рынке коммерческих продуктов по распознаванию и автоматизированному переводу текстов, в частности, представлены такие программы как FineReader, Trados, Promt, а также онлайн-переводчик Google Translate. При этом FineReader способна только распознавать текст, а Trados является скорее ассистентом переводчика и работает с заложенными в базу языковыми парами. Возможностей работы программ Promt и Google Translate для понимания смысловых нюансов при переводе, зачастую, недостаточно.

Источник: Lenta.ru по мотивам Raytheon.

New technology to produce real-time English transcripts of foreign-language handwritten notes and printed documents

CAMBRIDGE, Mass., July 16, 2012 /PRNewswire/ — The Defense Advanced Research Projects Agency (DARPA) has awarded Raytheon BBN Technologies an additional $5.9 million in funding under the Multilingual Automatic Document Classification, Analysis and Translation (MADCAT) program. This award follows Raytheon BBN’s success during the first four years of the MADCAT program. BBN is a wholly owned subsidiary of Raytheon Company (NYSE: RTN).

The Raytheon BBN team’s goal is to create a prototype system that provides accurate, relevant, distilled, actionable information to military commands and personnel. If successful, the system will automatically convert foreign language text images, such as handwritten notes and machine-printed documents, into English transcripts without the use of linguists and analysts. When human analysis is necessary, linguists and analysts would be able to use the technology to more effectively and efficiently explore the content of documents of interest.

«Foreign language translation on the battlefield is slow, unreliable, difficult to access and expensive,» said Prem Natarajan, head of Speech and Language Processing at Raytheon BBN Technologies. «By putting translation capability directly in the hands of the end user, MADCAT technologies will help our troops understand handwritten and printed documents that could be of immediate importance to their safety and to the successful completion of their missions.»

Under the contract, Raytheon BBN will:

Advance previous work under the MADCAT program to refine a laptop-deployable prototype translation system.
Integrate optical character recognition with Raytheon BBN’s state-of-the-art translation and distillation techniques.
Develop novel methods to process handwritten text.
About Raytheon
Raytheon Company, with 2011 sales of $25 billion and 71,000 employees worldwide, is a technology and innovation leader specializing in defense, homeland security and other government markets throughout the world. With a history of innovation spanning 90 years, Raytheon provides state-of-the-art electronics, mission systems integration and other capabilities in the areas of sensing; effects; and command, control, communications and intelligence systems, as well as a broad range of mission support services. Raytheon is headquartered in Waltham, Mass. For more about Raytheon, visit us at www.raytheon.com and follow us on Twitter at @raytheon.

Approved for Public Release, Distribution Unlimited


25 июля 2012 eCat-Erina | Пока нет комментариев

DUDU: соцсеть-переводчик

11

Главная особенность социальной сети Dudu – продвинутая система машинного перевода Dudu Translate с функцией самообучения. Она запоминает слова и выражения, которыми пользуются люди на разных языках и использует их в работе. Система автоматически переводит пользователю все материалы в социальной сети на тот язык, который указан в его профиле в качестве «родного».

Статья на Википедии начинается фразой:

«Dudu» — мультиязычная социальная сеть, в которой пользователи из разных стран могут общаться друг с другом не задумываясь о языке собеседника. Это стало возможным благодаря встроенному в социальную сеть переводчику фраз с одного языка на другой.


14 июля 2012 eCat-Erina | Пока нет комментариев

Как же всем хочется бесплатного перевода!

Да еще силами обучающихся языку. Ядерная смесь!

008_smallИ, кажется, автор изобрел велосипед придумал краудсорсинг.

Дайте пять миллионов на стартап, а я вам расскажу, как выпить из лужицы и не стать козлёночком переводы бесплатно делать…

Создатель системы reCaptcha Луис фон Ан (Luis von Ahn) и Северин Хакер (Severin Hacker) из университета Карнеги-Меллон (Питтсбург, штат Пенсильвания) запустили новый веб-проект Duolingo. Ключевой концепцией сервиса является предоставление бесплатных услуг перевода текстов и параллельное обучение иностранным языкам. Пока поддерживается перевод на английский и обратно для испанского, французского и немецкого языков.

Это видео иллюстрирует схему работы сервиса Duolingo.

На первом этапе выполняется регистрация на сайте проекта или авторизация под уже существующим аккаунтом в Facebook или Twitter. Эта процедура требуется для выбора языка обучения и возможности отправлять задания на перевод.

Затем загружается документ, который необходимо перевести на указанный язык. Duolingo разбивается его на части в зависимости от уровня сложности текста.

Обучающиеся языку ранжируются по уровню языковой подготовки и переводят фрагменты загруженных другими пользователями текстов, получая их в качестве заданий.

Duolingo обеспечивает обучаемых подсказками и собирает части переведённых документов воедино, отдавая затем переведённый вариант загрузившему.

Все услуги принципиально сделаны совершенно бесплатными – без подписки, рекламы и скрытых платежей.

Автор: Андрей Васильков
Опубликовано 21.06.2012
http://blogs.computerra.ru/32537


22 июня 2012 eCat-Erina | 3 комментария

Вы полюбили меня. Здесь я

На Фейсбуке в группах стало модным использовать автоматический перевод. Видимо, внутренние контракты и условия обкатки машинного перевода на людях. Не удержалась, стащила пару образцов.

Однажды, зайдя в берлинский трамвай, Альберт Эйнштейн по привычке углубился в чтение. Потом, не глядя на кондуктора, вынул из кармана заранее отсчитанные на билет деньги.
— Здесь не хватает, — сказал кондуктор.
— Не может быть, — ответил ученый, не отрываясь от книжки
— Тогда считайте, вот — 15 пфеннигов. Не хватает еще пяти.
Эйнштейн пошарил рукой в кармане и действительно нашел нужную монету. Ему стало неловко, но кондуктор, улыбаясь, сказал:
— Ничего страшного, просто нужно выучить арифметику.

One day, going to the Berlin tram, Albert Einstein into the reading habit. Then, without looking at the driver, took out from his pocket money ticket at otsčitannye in advance.
—There is not enough, «said jig.
—Cannot be said the scientist, not torn from books — then count, here are 15 Pfennig. Five more are missing.
Einstein pošaril hand in your pocket and actually found the coin. It was embarrassing, but the conductor, smiling, said: — nothing to worry about, just need to learn arithmetic. (Translated by Bing)

008_small_2

Врачи удивляются, как при таком лечении больные еще живы. Больные удивляются, как при такой зарплате врачи еще живы

Наши отношения с женщинами складываются прекрасно, если они складываются. Женщин, которые не складываются, мы бросаем.

Она не сдержала себя, открыла прелестный ротик и испортила прекрасную фигурку и дорогой купальник.

Поделись улыбкою своей, и ее тебе не раз еще припомнят …

Только в день рожденья узнаешь, сколько в мире ненужных вещей.

Он старый дурак. Хотя возраст здесь ни при чем.

Правда второй половины ХХ века допускает некоторую ложь и называется подлинной.

Почему слушающий засыпает, а говорящий нет ? Тот больше устает.

Михаил Жванецкий

The doctors are surprised at how this treatment the patients are still alive. Patients are surprised when the salary of doctors still alive Our relationships with women are fine if they are folded. Women who did not develop, we throw.

She kept herself, opened an adorable little mouth and spoiled an excellent figure and expensive swimsuit.

Share your smile, and you don’t recall yet again …

Only birthday know how many in the world of unnecessary things.

He is an old fool. Although the age here at anything.

However the second half of the 20th century allowed some lies, and called authentic.

Why he falls asleep, and saying no? The more tired.

Mihail Zhvaneckiy (Translated by Bing)

Вариант с опечаточкой: 008_small

Никогда еще люди не относились друг к другу с таким лжесточением, никогда еще не были в такой степени ослеплены, как в наше время, когда они стали воображать, что знают все
Эмиль Золя

Never before have people had treated each other with such lžestočeniem, have never been so blinded as to the time when they began to imagine that they know all of Émile Zola (Translated by Bing)

И вот еще образец Промта 2009 года (спасибо коллеге esperantisto за это чудо!). Помнится, в семейном кругу мы изводили друг друга фразочкой «Ты моя мамочка?» (Are my mommy?), посмотрев очередную серию прекрасного британского сериала «Доктор Кто» (Doctor Who). Теперь доводим друг друга до истерики вопросом «Где вмятина?!» 🙂

Все это весело, но машины хоть медленно да учатся. На людях.


20 июня 2012 eCat-Erina | 8 комментариев

В Испании арестовали руководство БП…

…за то, что не расплатились с переводчиками. На данный момент исчисленная сумма долга около 20 тыс. евро, но расследование еще не завершено.

Статья на испанском: http://www.lavanguardia.com

Обсуждение на английском: http://www.linkedin.com (К слову о том, кто как пользуется этой СС.)


6 июня 2012 eCat-Erina | 2 комментария

Тестирование iTranslate Voice

Сказ о том, как я могу своими вопросами сломать даже кремниевые мозги. Прежде мы тестировали голосовую распознавалку для Андроида. Прознав о том, что Apple выпустила чудную программку с голосовым распознаванием и автоматическим переводом, захотела ее попробовать, ну и попробовала. Говорила всякие глупости, а машина старательно переводила, местами даже понятно. Однако я не зря, как правило, избегаю дискуссий с двуногими, оберегая их от своей нейроизвращенности (нейроотличности, ага), ибо результат может быть плачевным:

36521_10150828953692060_675027059_9807298_1022621207_n

UPD KatyaNicholas: «Поправочка: не все, что продается в App Store’е, выпускается Эпплом В данном случае это приложение некоей Sonico GmbH.»


23 мая 2012 eCat-Erina | 12 комментариев

Про демонизацию с канонизацией, или почему не все диалоги одинаково фантастичны

s640x480


18 мая 2012 eCat-Erina | 8 комментариев

Забава для знатоков «питерского» и «московского» языков

Альфа-банк объявил конккурс на сбор идей для рекламной кампании.

Конкурсные работы принимаются с 14 мая по 27 мая 2012 года. Публикация итогов Творческого конкурса состоится 4 июня.

Тематика конкурса — Альфа-Банк, объединяющий Москву и Санкт-Петербург. Таким образом, идеи рекламной кампании, которые будут предлагать участники конкурса, должны быть так или иначе связаны с двумя этими городами. Идею можно подавать в виде текстовых комментариев, например «Подъезд или Парадная? Две столицы. Две Точки зрения. Один банк» или в виде рекламных макетов. Желательно обыграть и сами носители, которые встречают и провожают пассажиров, и их уникальное расположение на перронах железнодорожных вокзалов, с которых отправляются поезда в Москву и Санкт-Петербург.

За 1-2-3 места дажют 100-50-25 тыс. рублей соответственно. 🙂

Подробности: http://www.adme.ru/contest/alfa2012// Там же забавные картинки и примеры:

examples


16 мая 2012 eCat-Erina | Пока нет комментариев

Смешное: математики рассчитали взаимное влияние писателей

Математики создали метод анализа литературных стилей и составили схему взаимного влияния писателей на основе употребления ими служебных слов. Оказалось, что разнообразие стилей со временем возрастает с увеличивающейся скоростью. Работа опубликована в журнале Proceedings of the National Academy of Sciences, ее краткое содержание приводит New Scientist.
Тексты 537 английских авторов, живших начиная с 1550 года и создавших как минимум пять произведений, исследователи почерпнули в электронной библиотеке “Гутенберг”.

В качестве маркера литературного стиля математики использовали характерные особенности употребления писателями служебных слов. Эти слова (такие как to, than, it, if, but, do, be и так далее) служат для грамматического скрепления предложений и включают в себя артикли, предлоги, вспомогательные глаголы. Использование только служебных слов в анализе позволило сравнивать между собой произведения разных жанров, которые сильно отличаются между собой лексически.

Всего было проанализировано употребление 307 слов. При этом авторы не учитывали контекст, в том числе не разделяли разные слова с одинаковым написанием.

Для каждого писателя исследователи выделяли наиболее статистически значимые сходства в стиле между данным автором и его коллегами, и строили граф взаимных влияний.

Как исследователи и ожидали, оказалось, что на литературный стиль авторов текстов больше всего влиял стиль их непосредственных предшественников. Неожиданным было то, что разнообразие индивидуальных стилей росло увеличивающимися со временем темпами.

Исследователи объясняют это тем, что раньше количество текстов было сравнительно небольшим, и большая часть из них прочитывалась всеми членами литературного цеха, таким образом, помещая писателей в единое «стилистическое поле». По мере того как число произведений увеличивалось, литераторам приходилось выбирать для чтения отдельные тексты, которые составляли все меньшую долю от общего объема, что вызывало все увеличивающуюся стилистическую фрагментацию литературы.

Источник: Lenta.ru


9 мая 2012 eCat-Erina | Пока нет комментариев

Шизорфографическое-3. Внезапно

Помимо этого, он (Березовский) придумал способ экспансии России в мире через экспорт главного и уникального достижения русской цивилизации – русской культуры и языка. «Каждый, кто сдаст экзамен на свободное владение русским языком и знание русской культуры, сможет стать гражданином России, независимо от места своего постоянного проживания», — предлагает он.

Источник: Newsru.com


24 апреля 2012 eCat-Erina | Пока нет комментариев



Страница 2 из 3123