<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0</id>
	<title>Обработка естественного языка - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.dzmuh.com/index.php?action=history&amp;feed=atom&amp;title=%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0"/>
	<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0&amp;action=history"/>
	<updated>2026-05-05T22:51:22Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.38.4</generator>
	<entry>
		<id>https://wiki.dzmuh.com/index.php?title=%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0&amp;diff=13853&amp;oldid=prev</id>
		<title>Dzmuh: Новая страница: «'''Обработка текстов на естественном языке''' (''Natural Language Processing, NLP'') — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и ...»</title>
		<link rel="alternate" type="text/html" href="https://wiki.dzmuh.com/index.php?title=%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0&amp;diff=13853&amp;oldid=prev"/>
		<updated>2024-06-30T10:31:30Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «&amp;#039;&amp;#039;&amp;#039;Обработка текстов на естественном языке&amp;#039;&amp;#039;&amp;#039; (&amp;#039;&amp;#039;Natural Language Processing, NLP&amp;#039;&amp;#039;) — общее направление &lt;a href=&quot;/index.php/%D0%98%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82&quot; title=&quot;Искусственный интеллект&quot;&gt;искусственного интеллекта&lt;/a&gt; и &lt;a href=&quot;/index.php?title=%D0%9C%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Математическая лингвистика (страница не существует)&quot;&gt;математической лингвистики&lt;/a&gt;. Оно изучает проблемы &lt;a href=&quot;/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;Компьютер (страница не существует)&quot;&gt;компьютерного&lt;/a&gt; анализа и ...»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;'''Обработка текстов на естественном языке''' (''Natural Language Processing, NLP'') — общее направление [[Искусственный интеллект|искусственного интеллекта]] и [[Математическая лингвистика|математической лингвистики]]. Оно изучает проблемы [[компьютер]]ного анализа и [[синтез]]а текстов на [[Естественный язык|естественных языках]]. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — [[Генератор текста|генерацию грамотного текста]].&lt;br /&gt;
&lt;br /&gt;
== Задачи и ограничения ==&lt;br /&gt;
Теоретически, построение [[Человеко-компьютерное взаимодействие|естественно-языкового интерфейса]] для компьютеров — очень привлекательная цель. Ранние системы, такие как [[SHRDLU]], работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.&lt;br /&gt;
&lt;br /&gt;
Понимание естественного языка иногда считают{{Кто}} [[AI-полный|AI-полной]] задачей, потому как распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова «[[Понимание|понимать]]» — одна из главных задач искусственного интеллекта {{Нет АИ|16|5|2022}}.&lt;br /&gt;
&lt;br /&gt;
== Сложности понимания ==&lt;br /&gt;
&lt;br /&gt;
=== В русском языке ===&lt;br /&gt;
Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот некоторые примеры сложностей, с которыми сталкиваются системы понимания текстов.&lt;br /&gt;
* Сложности с раскрытием [[Анафора (лингвистика)|анафор]] (распознаванием, что имеется в виду при использовании местоимений): предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелые» похожи по синтаксической структуре. В одном из них [[местоимение]] ''они'' относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны.&lt;br /&gt;
* [[Свободный порядок слов]] может привести к совершенно иному толкованию фразы: «Бытие определяет сознание» — что определяет что?&lt;br /&gt;
* В русском языке свободный порядок компенсируется развитой [[Морфология (лингвистика)|морфологией]], [[Служебное слово|служебными словами]] и [[Знак препинания|знаками препинания]], но в большинстве случаев для компьютера это представляет дополнительную проблему.&lt;br /&gt;
* В речи могут встретиться [[неологизм]]ы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от [[Опечатка|опечаток]] и правильно их понимать.&lt;br /&gt;
* Правильное понимание [[омоним]]ов — ещё одна проблема. При [[Распознавание речи|распознавании речи]], помимо прочих, возникает проблема фонетических омонимов. Во фразе «Серый волк в глухом ''лесу'' встретил рыжую ''лису''» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей, хотя и отчасти компенсируется морфологией — у прилагательных в данном предложении род явно разный).&lt;br /&gt;
&lt;br /&gt;
== Классификация задач ==&lt;br /&gt;
{{список примеров}}&lt;br /&gt;
Популярные задачи:&amp;lt;ref&amp;gt;{{Статья|ссылка=http://arxiv.org/abs/2004.03705|автор=Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu|заглавие=Deep Learning Based Text Classification: A Comprehensive Review|год=2020-04-05|издание=arXiv:2004.03705 [cs, stat]|archivedate=2020-06-24|archiveurl=https://web.archive.org/web/20200624082918/https://arxiv.org/abs/2004.03705}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Статья|ссылка=http://arxiv.org/abs/1708.02709|автор=Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria|заглавие=Recent Trends in Deep Learning Based Natural Language Processing|год=2018-11-24|издание=arXiv:1708.02709 [cs]|archivedate=2020-05-06|archiveurl=https://web.archive.org/web/20200506004013/https://arxiv.org/abs/1708.02709}}&amp;lt;/ref&amp;gt;&amp;lt;ref&amp;gt;{{Cite web|lang=Английский|url=https://www.cs.jhu.edu/~jason/465/|title=Курс по автоматической обработке текста|author=Prof. Jason Eisner|website=|date=|publisher=|access-date=2020-05-07|archive-date=2020-05-13|archive-url=https://web.archive.org/web/20200513162149/http://www.cs.jhu.edu/~jason/465/|deadlink=no}}&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
# [[Распознавание речи]]&lt;br /&gt;
# [[Анализ текста]]&lt;br /&gt;
#* [[Извлечение информации]]&lt;br /&gt;
#* [[Информационный поиск]]&lt;br /&gt;
#* [[Анализ высказываний]]&lt;br /&gt;
#* [[Анализ тональности текста]]&lt;br /&gt;
#* [[Вопросно-ответная система|Вопросно-ответные системы]]&lt;br /&gt;
# [[Генератор текста|Генерирование текста]]&lt;br /&gt;
# [[Синтез речи]]&lt;br /&gt;
&lt;br /&gt;
Задачи анализа и синтеза в комплексе:&lt;br /&gt;
&lt;br /&gt;
* [[Машинный перевод]]&lt;br /&gt;
* Автоматическое [[Реферат|реферирование]], [[Аннотация|аннотирование]] или упрощение текста&lt;br /&gt;
&lt;br /&gt;
Общая классификация:&lt;br /&gt;
&lt;br /&gt;
# Категоризация текстов&lt;br /&gt;
# Классификация последовательностей символов&lt;br /&gt;
## Распознавание именованных сущностей&lt;br /&gt;
## Определение [[Часть речи|частей речи]] слов&lt;br /&gt;
# Распознавание фраз&lt;br /&gt;
# Извлечение информации из текста&lt;br /&gt;
# Синтаксическая аннотация&lt;br /&gt;
# Семантическая аннотация&lt;br /&gt;
# [[Генератор текста|Генерирование текста]]&lt;br /&gt;
## Генерация текста на основе распознанной речи&lt;br /&gt;
## [[Машинный перевод]]&lt;br /&gt;
## Обобщение текста&lt;br /&gt;
&lt;br /&gt;
== Программное обеспечение ==&lt;br /&gt;
{{main|Программное обеспечение для обработки естественного языка}}&lt;br /&gt;
&lt;br /&gt;
* [[AlchemyAPI]]&lt;br /&gt;
* [[Expert System S.p.A.]]&lt;br /&gt;
* [[GATE (программа)|General Architecture for Text Engineering]] (GATE)&lt;br /&gt;
* [[Modular Audio Recognition Framework]]&lt;br /&gt;
* [[MontyLingua]]&lt;br /&gt;
* [[Natural Language Toolkit]] (NLTK)&lt;br /&gt;
&lt;br /&gt;
== См. также ==&lt;br /&gt;
* [[Математическая лингвистика]]&lt;br /&gt;
* [[Информационный поиск]]&lt;br /&gt;
* [[Виртуальный собеседник]]&lt;br /&gt;
* [[Робот (программа)]]&lt;br /&gt;
&lt;br /&gt;
== Примечания ==&lt;br /&gt;
{{примечания}}&lt;br /&gt;
&lt;br /&gt;
== Ссылки ==&lt;br /&gt;
{{Википедия|Обработка естественного языка}}&lt;br /&gt;
&lt;br /&gt;
{{Обработка естественного языка}}&lt;br /&gt;
{{Искусственный интеллект}}&lt;br /&gt;
&lt;br /&gt;
[[Категория:Прикладная лингвистика]]&lt;br /&gt;
[[Категория:Обработка естественного языка|*]]&lt;br /&gt;
[[Категория:Распознавание речи]]&lt;/div&gt;</summary>
		<author><name>Dzmuh</name></author>
	</entry>
</feed>