<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0</id>
	<title>Качество машинного перевода - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0"/>
	<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0&amp;action=history"/>
	<updated>2026-05-05T20:16:21Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.38.4</generator>
	<entry>
		<id>https://wiki.dzmuh.com/index.php?title=%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0&amp;diff=12374&amp;oldid=prev</id>
		<title>Dzmuh: Новая страница: «В настоящее время, несмотря на большие достижения в разработке программ для автоматизации перевода, машинный перевод все ещё не способен выдавать адекватный и эквивалентный результат, поэтому возникает вопрос об оценке текстов, пе...»</title>
		<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%BE_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D0%B0&amp;diff=12374&amp;oldid=prev"/>
		<updated>2023-05-04T02:49:53Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «В настоящее время, несмотря на большие достижения в разработке программ для автоматизации перевода, &lt;a href=&quot;/index.php/%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4&quot; title=&quot;Машинный перевод&quot;&gt;машинный перевод&lt;/a&gt; все ещё не способен выдавать адекватный и эквивалентный результат, поэтому возникает вопрос об оценке текстов, пе...»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;В настоящее время, несмотря на большие достижения в разработке программ для автоматизации перевода, [[Машинный перевод|машинный перевод]] все ещё не способен выдавать адекватный и эквивалентный результат, поэтому возникает вопрос об оценке текстов, переведенных с помощью автоматизированного компьютерного перевода &amp;lt;ref&amp;gt;{{Cite web |url=http://vestnik.osu.ru/2017_2/18.pdf |title=Архивированная копия |access-date=2021-01-08 |archive-date=2021-01-11 |archive-url=https://web.archive.org/web/20210111155843/http://vestnik.osu.ru/2017_2/18.pdf |deadlink=no}}&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Оценка качества перевода ==&lt;br /&gt;
На сегодняшний день существуют различные системы машинного перевода, некоторые из них выполняют перевод на довольно высоком уровне. Но для того, чтобы выявить, какие именно системы подходят для работы с теми или иными языками или типами текстов, необходимо осуществлять тестирование этих систем и анализировать качество перевода на основе больших фрагментов текстов.&lt;br /&gt;
&lt;br /&gt;
Японский ученый Макато Нагао, специалист по компьтерным наукам, предложил шкалу оценки машинного перевода на основе лингвостилистического анализа, от пяти до одного балла &amp;lt;ref&amp;gt;{{iw|Maschinelle Übersetzung||de|Maschinelle Übersetzung}}&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
* 1 балл — смысл предложения понятен и не возникает никаких вопросов, грамматика, словоупотребление и стиль соответствуют общей структуре текста и не требуют постредактирования&lt;br /&gt;
* 2 балла — смысл предложения понятен, но возникают большие проблемы с грамматикой, словоупотреблением и стилем.&lt;br /&gt;
* 3 бала — общий смысл предложения понятен, но смысл некоторых его частей вызывает сомнение из-за неправильного грамматического строя.&lt;br /&gt;
* 4 балла — присутствуют ошибки словоупотребления и стилистики, требуется обращение к оригиналу.&lt;br /&gt;
* 5 баллов — в предложении имеется большое количество грамматических, словоупотребительных и стилистических ошибок, смысл предложения с трудом можно понять после внимательного изучения.&lt;br /&gt;
&lt;br /&gt;
Для автоматической оценки работы машинных переводчиков зачастую используются показатель Word Error Rate или WER, метрики BLEU и NIST. Эти инструменты позволяют успешно сравнивать работу разных систем МП и оценивать улучшения в работе конкретной системы &amp;lt;ref&amp;gt;[Vilar, 2006]&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== BLEU ===&lt;br /&gt;
Метрика BLEU (Bilingual Evaluation Understudy) на данный момент самая популярная в современной оценке МП. Позволяет учитывать не только точность перевода отдельных слов, но и цепочек слов ([[N-грамма|N-граммы]]) [МП: обзор методов].&lt;br /&gt;
&lt;br /&gt;
Метрика BLEU была разработана сотрудниками компании IBM и является одной из самых простых в использовании метрик оценки машинного перевода. Алгоритм BLEU оценивает качество перевода по шкале от 0 до 100 на основании сравнения машинного перевода с человеческим и поиска общих слов и фраз. Основная идея разработчиков метрики состоит в том, что чем лучше машинный перевод, тем больше он должен быть похож на человеческий &amp;lt;ref&amp;gt;[Молчанов, 2013]&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
Лучше всего такая метрика работает не на уровне предложений, а на уровне большого текста. На маленьком объёме текста метрика зачастую обнуляется из-за отсутствия совпадающих 4-грамм и работает некорректно. Существуют также доработанные варианты метрики, которые подходят для сравнения на уровне предложения.&lt;br /&gt;
&lt;br /&gt;
=== NIST ===&lt;br /&gt;
Метрика NIST была разработана на основе BLEU, но имеет одно фундаментальное отличие. Если для получения высокой оценки BLEU важнее правильный порядок слов, то NIST выше оценивает правильный выбор лексики &amp;lt;ref name=&amp;quot;автоссылка1&amp;quot;&amp;gt;[Zhang, 2004]&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
=== WER ===&lt;br /&gt;
Word Error Rate, или взвешенное расстояние Левенштейна, позволяет измерять расстояние между машинным и образцовым переводом так же, как мы измеряем расстояние между словарным словом и словом с опечаткой (считая символами не буквы, а целые слова) [МП: обзор методов]. По сути WER измеряет минимальное количество изменений, которые необходимо сделать, чтобы из результата работы МП получить эталонный перевод &amp;lt;ref&amp;gt;[Koehn, 2010]&amp;lt;/ref&amp;gt;. При этом WER может учитывать различные варианты эталонного перевода с разным порядком слов &amp;lt;ref name=&amp;quot;автоссылка1&amp;quot; /&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Примечания ==&lt;br /&gt;
{{примечания}}&lt;br /&gt;
&lt;br /&gt;
== Ссылки ==&lt;br /&gt;
{{википедия|Качество машинного перевода}}&lt;br /&gt;
* [http://vestnik.osu.ru/2017_2/18.pdf] {{Wayback|url=http://vestnik.osu.ru/2017_2/18.pdf |date=20210111155843 }}&lt;br /&gt;
* [https://de.wikipedia.org/wiki/Maschinelle_Übersetzung] {{Wayback|url=https://de.wikipedia.org/wiki/Maschinelle_%C3%9Cbersetzung |date=20220402195930 }}&lt;br /&gt;
* [Vilar D., Jia Xu, D’Haro L., Ney H. Error Analysis of Machine Translation Output. In International Conference on Language Resources and Evaluation, pages 697—702, Genoa, Italy, 2006.]&lt;br /&gt;
* [Машинный перевод: обзор методов и оценка качества. URL: http://lpcs.math.msu.su/~pentus/mfk2015/Lecture07_20151021.pdf {{Wayback|url=http://lpcs.math.msu.su/~pentus/mfk2015/Lecture07_20151021.pdf |date=20210109135936 }}]&lt;br /&gt;
* [Молчанов А. Статистические и гибридные методы перевода в технологиях компании ПРОМТ. М., 2013.]&lt;br /&gt;
* [Koehn, P. Statistical Machine Translation. Cambridge, UK, 2010.]&lt;br /&gt;
* [Zhang Y., Vogel S., Waibel A. Interpreting BLEU/NIST Scores: How Much Improvement do We Need to Have a Better System? // Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC-2004), Lisbon, Portugal, 2004.]&lt;br /&gt;
&lt;br /&gt;
[[Категория:машинный перевод]]&lt;/div&gt;</summary>
		<author><name>Dzmuh</name></author>
	</entry>
</feed>