<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_%28%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F%29</id>
	<title>Трансформер (модель машинного обучения) - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_%28%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F%29"/>
	<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_(%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)&amp;action=history"/>
	<updated>2026-05-05T16:30:00Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.38.4</generator>
	<entry>
		<id>https://wiki.dzmuh.com/index.php?title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_(%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)&amp;diff=14748&amp;oldid=prev</id>
		<title>Dzmuh: /* Ссылки */</title>
		<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_(%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)&amp;diff=14748&amp;oldid=prev"/>
		<updated>2026-01-26T07:37:57Z</updated>

		<summary type="html">&lt;p&gt;&lt;span dir=&quot;auto&quot;&gt;&lt;span class=&quot;autocomment&quot;&gt;Ссылки&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ru&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Предыдущая версия&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Версия от 07:37, 26 января 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l59&quot;&gt;Строка 59:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 59:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{{википедия|Трансформер (модель машинного обучения)}}&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;{{википедия|Трансформер (модель машинного обучения)}}&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Категория:&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Искусственные нейронные &lt;/del&gt;сети]]&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;[[Категория:&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;Нейронные &lt;/ins&gt;сети]]&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Dzmuh</name></author>
	</entry>
	<entry>
		<id>https://wiki.dzmuh.com/index.php?title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_(%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)&amp;diff=12384&amp;oldid=prev</id>
		<title>Dzmuh: Новая страница: «{{Значения|Трансформер}} '''Трансфо́рмер''' ({{lang-en|Transformer}}) — архитектура глубоких нейронных сетей, представленная в 2017 году исследователями из Google Brain&lt;ref name=&quot;paper&quot;&gt;{{source|Q30249683}}&lt;/ref&gt;.  По аналогии с Рекуррентная нейронная...»</title>
		<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%A2%D1%80%D0%B0%D0%BD%D1%81%D1%84%D0%BE%D1%80%D0%BC%D0%B5%D1%80_(%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)&amp;diff=12384&amp;oldid=prev"/>
		<updated>2023-05-04T03:18:39Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «{{Значения|Трансформер}} &amp;#039;&amp;#039;&amp;#039;Трансфо́рмер&amp;#039;&amp;#039;&amp;#039; ({{lang-en|Transformer}}) — архитектура &lt;a href=&quot;/index.php/%D0%93%D0%BB%D1%83%D0%B1%D0%BE%D0%BA%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5&quot; title=&quot;Глубокое обучение&quot;&gt;глубоких&lt;/a&gt; &lt;a href=&quot;/index.php/%D0%9D%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D0%B5%D1%82%D1%8C&quot; title=&quot;Нейронная сеть&quot;&gt;нейронных сетей&lt;/a&gt;, представленная в 2017 году исследователями из &lt;a href=&quot;/index.php?title=Google_Brain&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Google Brain (страница не существует)&quot;&gt;Google Brain&lt;/a&gt;&amp;lt;ref name=&amp;quot;paper&amp;quot;&amp;gt;{{source|Q30249683}}&amp;lt;/ref&amp;gt;.  По аналогии с Рекуррентная нейронная...»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{Значения|Трансформер}}&lt;br /&gt;
'''Трансфо́рмер''' ({{lang-en|Transformer}}) — архитектура [[Глубокое обучение|глубоких]] [[Нейронная сеть|нейронных сетей]], представленная в 2017 году исследователями из [[Google Brain]]&amp;lt;ref name=&amp;quot;paper&amp;quot;&amp;gt;{{source|Q30249683}}&amp;lt;/ref&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
По аналогии с [[Рекуррентная нейронная сеть|рекуррентными нейронными сетями]] (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как [[машинный перевод]] и [[автоматическое реферирование]]. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры [[Параллельные вычисления|распараллеливаются]] легче чем РНС и могут быть быстрее [[Машинное обучение|обучены]]&amp;lt;ref name=&amp;quot;paper&amp;quot; /&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
== Архитектура сети ==&lt;br /&gt;
&lt;br /&gt;
Архитектура трансформера состоит из кодировщика и декодировщика. Кодировщик получает на вход [[Векторное представление слов|векторизованую последовательность]] с позиционной информацией. Декодировщик получает на вход часть этой последовательности и выход кодировщика. Кодировщик и декодировщик состоят из слоев. Слои кодировщика последовательно передают результат следующему слою в качестве его входа. Слои декодировщика последовательно передают результат следующему слою вместе с результатом кодировщика в качестве его входа. &lt;br /&gt;
&lt;br /&gt;
Каждый кодировщик состоит из механизма самовнимания (вход из предыдущего слоя) и [[Нейронная сеть с прямой связью|нейронной сети с прямой связью]] (вход из механизма самовнимания). Каждый декодировщик состоит из механизма самовнимания (вход из предыдущего слоя), механизма внимания к результатам кодирования (вход из механизма самовнимания и кодировщика) и [[Нейронная сеть с прямой связью|нейронной сети с прямой связью]] (вход из механизма внимания).&lt;br /&gt;
&lt;br /&gt;
&amp;lt;gallery&amp;gt;&lt;br /&gt;
Файл:MLTransformerOverview.svg|Трансформер&lt;br /&gt;
Файл:MLTransformer-Encoder.svg|Кодирующий слой&lt;br /&gt;
Файл:MLTransformer-Decoder.svg|Декодирующий слой&lt;br /&gt;
&amp;lt;/gallery&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Внимание на основе скалярного произведения ==&lt;br /&gt;
&lt;br /&gt;
Каждый механизм внимания параметризован матрицами весов запросов &amp;lt;math&amp;gt;W_Q&amp;lt;/math&amp;gt;, весов ключей &amp;lt;math&amp;gt;W_K&amp;lt;/math&amp;gt;, весов значений &amp;lt;math&amp;gt;W_V&amp;lt;/math&amp;gt;. Для вычисления внимания входного вектора &amp;lt;math&amp;gt;X&amp;lt;/math&amp;gt; к вектору &amp;lt;math&amp;gt;Y&amp;lt;/math&amp;gt;, вычисляются вектора &amp;lt;math&amp;gt;Q=W_Q X&amp;lt;/math&amp;gt;, &amp;lt;math&amp;gt;K=W_K X&amp;lt;/math&amp;gt;, &amp;lt;math&amp;gt;V=W_V Y&amp;lt;/math&amp;gt;. Эти вектора используются для вычисления результата внимания по формуле:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;\text{Attention}(Q, K, V) = \text{softmax}\left(\frac{QK^\mathrm{T}}{\sqrt{d_k}}\right)V&amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Использование ==&lt;br /&gt;
&lt;br /&gt;
Трансформеры используются в [[Яндекс.Переводчик]]е&amp;lt;ref&amp;gt;{{cite web&lt;br /&gt;
 |author      = Семен Козлов&lt;br /&gt;
 |url         = https://habr.com/ru/post/341240/&lt;br /&gt;
 |title       = Transformer — новая архитектура нейросетей для работы с последовательностями&lt;br /&gt;
 |lang        = ru&lt;br /&gt;
 |website     = &lt;br /&gt;
 |publisher   = [[Хабр]]&lt;br /&gt;
 |date        = 2017-10-30&lt;br /&gt;
 |accessdate  = 2020-11-03&lt;br /&gt;
}}&amp;lt;/ref&amp;gt;, [[Яндекс.Новости|Яндекс.Новостях]]&amp;lt;ref&amp;gt;{{cite web&lt;br /&gt;
 |author      = Тимур Гаскаров&lt;br /&gt;
 |url         = https://habr.com/ru/company/yandex/blog/479662/&lt;br /&gt;
 |title       = Как Яндекс научил искусственный интеллект находить ошибки в новостях&lt;br /&gt;
 |lang        = ru&lt;br /&gt;
 |website     = &lt;br /&gt;
 |publisher   = [[Хабр]]&lt;br /&gt;
 |date        = 2019-12-12&lt;br /&gt;
 |accessdate  = 2020-11-03&lt;br /&gt;
}}&amp;lt;/ref&amp;gt;, [[Google Переводчик]]е&amp;lt;ref&amp;gt;{{cite web&lt;br /&gt;
 |author      = Isaac Caswell, Bowen Liang&lt;br /&gt;
 |url         = https://ai.googleblog.com/2020/06/recent-advances-in-google-translate.html&lt;br /&gt;
 |title       = Recent Advances in Google Translate&lt;br /&gt;
 |lang        = en&lt;br /&gt;
 |website     = &lt;br /&gt;
 |publisher   = Google AI Blog&lt;br /&gt;
 |date        = 2020-06-08&lt;br /&gt;
 |accessdate  = 2020-11-03&lt;br /&gt;
}}&amp;lt;/ref&amp;gt;, [[GPT-3]].&lt;br /&gt;
&lt;br /&gt;
== Примечания ==&lt;br /&gt;
{{примечания}}&lt;br /&gt;
&lt;br /&gt;
== Ссылки ==&lt;br /&gt;
{{википедия|Трансформер (модель машинного обучения)}}&lt;br /&gt;
&lt;br /&gt;
[[Категория:Искусственные нейронные сети]]&lt;/div&gt;</summary>
		<author><name>Dzmuh</name></author>
	</entry>
</feed>