Огласовки в арабском письме

(перенаправлено с «Фатха»)

Огласо́вки (араб. حركات‎ «движения», ед.ч. حركةха́рака) — система надстрочных и подстрочных диакритических знаков, используемых в арабском письме для обозначения кратких гласных звуков и других особенностей произношения слова, не отображаемых буквами. Расстановку огласовок в тексте называют ташки́ль (араб. تشكيل‎). Поскольку буквами арабского алфавита обозначаются только согласные и долгие гласные (матрес лекционис)[1], то неогласованный текст невозможно «читать вслух»: можно лишь «угадывать произношение» записанных в нём слов. Текст с расставленными огласовками, напротив, содержит всю необходимую для его прочтения информацию.

Чёрным цветом изображены буквы арабского алфавита, серым — огласовки.

Употребление

Обычно в текстах огласовки не проставляются. Исключением являются: Коран, случаи, когда это нужно для различения смысла, огласовки обычно ставятся над одной или несколькими буквами слова, детские и учебные книги, словари и т. д.[1], — подобно расстановке ударений в текстах на русском языке. Когда нужно точно передать звучание незнакомого слова, огласовки ставятся над всеми согласными этого слова. Для сравнения: русский текст, из которого удалены обозначения гласных звуков (например, вкпдй свбднй нцклпдй), невозможно прочитать человеку, не владеющему в достаточной степени русским языком, однако этот текст легко читается человеком, знающим все «зашифрованные» в этом тексте слова. С другой стороны, если известно произношение слова, то его запись однозначно определяется этим произношением — в этом состоит отличие консонантного письма от идеографического, в котором запись и произношение слова не имеют связи.

Кроме того, текст с пропущенными гласными на семитских языках, где гласные несут в основном грамматическую и словообразовательную информацию, читается носителем языка легче, чем в случае, когда пропускаются гласные в словах индоевропейских языков, где они являются такими же равноправными, как и согласные, элементами корня. С содержательной точки зрения соответствием арабского текста без огласовок в европейских языках является сокращённая запись слов без окончаний или даже некоторых суффиксов (свобод. многоязыч. энциклопед., в котор. кажд. мож. измен. или дополн. люб. стат.). Разумеется, это не относится к несемитским языкам, использующим арабскую графику (например, индоевропейскому персидскому или тюркскому уйгурскому); для них огласовки могут в ряде случаев играть бо́льшую роль.

Знаки

Знаки гласных

Знаки
фатхакясрадаммасукун
◌َ◌ِ◌ُ◌ْ

Когда за согласным звуком следует гласный (краткий или долгий), над согласным ставится знак-огласовка, соответствующая следующему гласному. Если этот гласный долгий, то он дополнительно обозначается буквой (т. н. харф мад — буква удлинения), следующей за согласной[2].

Если после согласного звука нет гласного (перед следующим согласным либо в конце слова), то над ним ставится огласовка сукун.

При полной огласовке текста (например, в Коране) при каждой букве, обозначающей согласный, должен стоять один из 4 знаков, приведённых ниже. Эти знаки не могут стоять при буквах, обозначающих удлинение гласных.

Дамма, фатха, кясра
Черта над буквой (◌َ, фатх̣а, араб. فتحة‎ «раскрывание») обозначает звук а. Соответствующая буква удлинения — ا (алиф).
()
Черта под буквой (◌ِ, кясра, араб. كسرة‎ «ломание») обозначает звук и. Соответствующая буква удлинения — ﻱ (йа').
Крючок над буквой (◌ُ, д̣амма, араб. ضمة‎ «соединение») обозначает звук у. Соответствующая буква удлинения — و (уау).
Кружок над буквой (◌ْ, сукӯн, араб. سكون‎ «тишина») обозначает отсутствие гласного звука.

Танвин

Сукун, шадда, шадда, танвин-кясра

Удвоение в конце слова одной из трёх огласовок, обозначающих гласные звуки (танвӣн, араб. تنوين‎), образует падежное окончание (’и‘ра̄б, араб. إﻋﺮﺍﺏ‎), обозначающее неопределённое состояние этого слова и произносящееся ан, ин либо ун в зависимости от удваиваемой огласовки. Танвин в качестве и`раб присутствует также в некоторых именах собственных, например مُحَمَّدٌмухаммадун, «Мухаммад». В классическом арабском языке падежное окончание не произносится в конце фразы или перед паузой; в разговорной речи он не произносится вовсе[2].

Танвин-фатха может стоять только над буквами алиф, хамза и та-марбута. В остальных случаях в конце слова пишется непроизносимая буква алиф, и танвин-фатха пишется над ней.

Шадда

Шадда представляет собой W-образный знак над буквой (шадда, араб. شدة‎ «усиление») и обозначает удвоение буквы[3]. Она ставится в двух случаях: для обозначения удвоенного согласного (то есть сочетания вида X-сукун-X) либо в сочетаниях из долгой гласной и согласной, обозначаемых одной и той же буквой (таких сочетаний два: ӣй и ӯв). Огласовка удвоенного согласного фатхой или даммой изображается над шаддой, кясрой — под буквой или под шаддой[1].

Васла, мадда

Мадда

Волнистая линия над буквой алиф (мадда, араб. مدة‎ «удлинение») обозначает комбинацию хамза-алиф либо хамза-хамза, когда по правилам написания хамзы она пишется с подставкой алиф[4]. Правила арабской орфографии запрещают следование в одном слове двух букв алиф подряд, поэтому в случаях, когда возникает такая комбинация букв, она заменяется буквой алиф-мадда. По той же причине в комбинации алиф-мадда (алиф-хамза-алиф) алиф-мадда не пишется — вместо этого хамза пишется без подставки.

Мадда обязательна к использованию даже в неогласованных текстах — как и хамза, которую она заменяет. Поэтому можно спорить, относится ли она к огласовкам, или, подобно хамзе, является самостоятельным знаком арабского письма.

Васла

Знак, похожий на букву сад (ٱ), над алифом в начале слова (вас̣ла, араб. وصلة‎ «объединение») обозначает, что этот алиф не произносится, если предыдущее слово заканчивалось на гласный звук[5]. Буква алиф-васла встречается в небольшом количестве слов, а также в приставке аль-. Поскольку в нередуцированном положении алиф-васла обозначает хамзу, то другое название этой буквы — хамзату-ль-васл (араб. همزة الوصل‎, «хамза объединения»).

Надстрочный алиф

Надстрочный алиф над шаддой в слове Аллах

Знак в форме буквы алиф над текстом (араб. ألف خنجرية’алиф х̮анджарӣйя, «кинжальный алиф») обозначает долгий звук а̄ в словах, где обычный алиф не пишется по орфографической традиции. Сюда относятся в основном имена собственные (включая слово Аллах), а также несколько указательных местоимений (например, هٰذَاха̄з̱а̄ «этот»). При полной огласовке надстрочный алиф ставится также над буквой алиф-максура, чтобы показать, что она читается как долгий а̄[1].

Надстрочный алиф — очень редкий знак, и кроме как в Коране, он обычно не употребляется. Более того, в Коране надстрочный алиф встречается иногда даже в тех словах, в которых по правилам пишется обычный алиф. Например, во фразе араб. بسم الله الرحمن الرحيم‎ («бисмилляхи р-рахмани р-рахим»), с которой начинается каждая сура, в слове «рахман» пишется надстрочный алиф (رَحْمٰن‎) — несмотря на то, что во всех остальных случаях это слово пишется с обычным алифом (رَحْمَان‎)[6].

Хамза

Надстрочный алиф, формы хамзы (с разными подставками и без подставки)

Хотя хамза (араб. همزة‎ «сжимание») не относится к огласовкам и обозначает согласный звук (гортанную смычку), она обычно пишется как диакритический знак, и была введена в употребление одновременно с огласовками. Таким образом, она занимает промежуточное положение между буквами арабского алфавита и вспомогательными знаками арабского письма. В частности, написание хамзы обязательно даже в неогласованном тексте.

Способ написания хамзы задаётся правилами арабской орфографии[1]:

  • если за хамзой в начале слова следует алиф, то вместо обеих этих букв пишется алиф-мадда;
  • иначе хамза в начале слова пишется над буквой алиф (с огласовкой фатха или дамма) или под ней (с огласовкой кясра);
  • иначе, если одна из огласовок, смежных с хамзой, — кясра, то хамза ставится над буквой йа, которая в этом случае пишется без диакритических точек;
  • иначе, если одна из огласовок, смежных с хамзой, — дамма, то хамза пишется над буквой вав;
  • иначе, если за хамзой следует алиф, то вместо обеих этих букв пишется алиф-мадда;
  • иначе, если перед хамзой идёт алиф, то хамза пишется на строке (без подставки);
  • иначе хамза пишется над буквой алиф.

Из этих правил есть ряд исключений, в которых сохраняется традиционный способ написания хамзы: до того, как для неё появился собственный знак, она изображалась в виде буквы алиф, либо вовсе не записывалась.

Все слова в классическом арабском языке начинаются с согласных звуков; поэтому не возникает проблемы с написанием огласовки без базовой согласной. Поскольку в разговорной речи начальная хамза не произносится, такие слова в транслитерации начинаются с гласных букв. На самом же деле часть таких слов (например, имена Ахмад и Усама) начинаются с хамзы, и огласовка, соответствующая начальному гласному звуку слова, ставится над этой хамзой. Кроме того, ряд слов, начинающихся в транслитерации с гласных букв (например, имена Иса и Али), начинаются на самом деле со звука, обозначаемого буквой `айн и не имеющего аналогов в европейских языках. Хотя в большинстве арабских диалектов этот звук произносится, для него нет устоявшегося способа транслитерации, и поэтому он при транслитерации часто опускается.

История

Коран X века с ташкилем Насра и Яхьи (красные точки)

Изначально в арабском письме не использовались точки над и под буквами; алфавит состоял из 15 букв, восходящих к финикийскому алфавиту, и большинство из букв обозначало сразу несколько звуков. По легенде, первый ташкиль, состоящий в добавлении к омографичным буквам разноцветных точек для обозначения их звучания, был изобретён куфийцем Абу аль-Асвадом ад-Ду’али по указанию халифа Али, когда тот увидел копию Корана с ошибками и потребовал кодифицировать правила арабского языка. Добавление точек к основным формам букв для их разделения по звучанию (нак̣т̣, араб. نقط‎) не является, видимо, собственным изобретением ад-Ду’али, поскольку известен папирус, датируемый 643 годом, в котором такие точки уже используются[7].

Коран с современными огласовками (начало XX века)

Отдельные знаки для огласовок появились позже, во второй половине VII века, когда по указанию правителя Ирака Аль-Хаджжаджа ибн Юсуфа (661714), переведшего делопроизводство в Ираке с пехлеви на арабский язык, была создана система обозначения кратких гласных маленькими красными точками. Для обозначения хамзы, как и в системе ад-Ду’али, использовались жёлтые точки. Создателями новой системы были двое учеников ад-Ду’али: Наср ибн `Асым (ум. 707) и Яхья ибн Я`мур (ум. 746). Неудобство их системы состояло в необходимости использования трёх цветов для записи огласованного текста, чтобы точки-огласовки можно было отличать от накта — точек-элементов букв.

Система огласовок в современном виде была создана к 786 году оманцем Халилем ибн Ахмадом аль-Фарахиди (718791), составителем первого словаря арабского языка. Он же придумал современный знак для обозначения хамзы. К началу XI века использование системы аль-Фарахиди стало общепринятым[8].

Компьютерная обработка

Представление в Юникоде

В Юникоде огласовки представлены как в виде комбинируемых диакритических знаков, так и в виде монолитных символов. Монолитные символы делятся на три класса: комбинация буквы и огласовки; комбинация пробела и огласовки; комбинация кашиды (горизонтальной черты) и огласовки[9].

Арабская пишущая машинка

В таблицах приведены также соответствия кодов Юникода позициям наиболее распространённых арабских кодовых страниц: ASMO-708, DOS-720, DOS-864, ISO 8859-6 (она же ECMA-114 и CP-28596), Windows-1256 и Macintosh Arabic (она же CP-10004). Позиции базовых арабских букв и огласовок в страницах ASMO, ISO/ECMA и Macintosh совпадают, поэтому в таблице они совокупно обозначены как ISO. Остальные из названных кодовых страниц обозначены в таблице как DOS-720, DOS-864 и Windows соответственно.

Кодовые страницы ASMO и DOS относятся к OEM-кодировкам, включающим символы псевдографики. При этом DOS-864 уникальна тем, что кодирует не буквы, а графические элементы арабского письма — позиционные формы букв и их отдельных частей. В этой кодовой странице не хватило места для кодировки большей части огласовок. Представление текста в DOS-864 аналогично его набору на арабской пишущей машинке, имеющей отдельные клавиши для всех элементов арабского письма, и не позволяющей огласовывать печатаемый текст.

Модифицирующие знаки

В качестве базового символа здесь использован буллит (•).

ЗнакКодНазваниеСоответствия в кодовых страницах
ً• Танвин-фатхаU+064BArabic FathatanEB (ISO), F1 (DOS-720), F0 (Windows)
ٌ• Танвин-даммаU+064CArabic DammatanEC (ISO), F2 (DOS-720), F1 (Windows)
ٍ• Танвин-кясраU+064DArabic KasratanED (ISO), F3 (DOS-720), F2 (Windows)
َ• ФатхаU+064EArabic FathaEE (ISO), F4 (DOS-720), F3 (Windows)
ُ• ДаммаU+064FArabic DammaEF (ISO), F5 (DOS-720, Windows)
ِ• КясраU+0650Arabic KasraF0 (ISO), F6 (DOS-720, Windows)
ّ• ШаддаU+0651Arabic ShaddaF1 (ISO, DOS-864), 91 (DOS-720), F8 (Windows)
ْ• СукунU+0652Arabic SukunF2 (ISO), 92 (DOS-720), FA (Windows)
ٓ• МаддаU+0653Arabic Maddah Above
ٰ• Надстрочный алифU+0670Arabic Letter Superscript Alef

Комбинации с буквами

КомбинацияКодНазваниеКомментарий, разложение, соответствия
آАлиф-маддаU+0622Arabic Letter Alef With Madda Above= U+0627 U+0653; = С2 (ISO, Windows), 99 (DOS-720)
ٱАлиф-васлаU+0671Arabic Letter Alef Wasla
Алиф-васлаU+FB50Arabic Letter Alef Wasla Isolated Formначальное начертание, ≈U+0671
Алиф-васлаU+FB51Arabic Letter Alef Wasla Final Formсрединное начертание, ≈U+0671
Заль, надстрочный алифU+FC5BArabic Ligature Thal With Superscript Alef Isolated Formизолированное/начальное начертание, ≈U+0630 U+0670
Ра, надстрочный алифU+FC5CArabic Ligature Reh With Superscript Alef Isolated Formизолированное/начальное начертание, ≈U+0631 U+0670
Алиф-максура, надстрочный алифU+FC5DArabic Ligature Alef Maksura With Superscript Alef Isolated Formизолированное начертание, ≈U+0649 U+0670
Алиф-максура, надстрочный алифU+FC90Arabic Ligature Alef Maksura With Superscript Alef Final Formконечное начертание, ≈U+0649 U+0670
Ха, надстрочный алифU+FCD9Arabic Ligature Heh With Superscript Alef Initial Formначальное начертание, ≈U+0647 U+0670
Алиф, танвин-фатхаU+FD3CArabic Ligature Alef With Fathatan Final Formконечное начертание, ≈U+0627 U+064B
Алиф, танвин-фатхаU+FD3DArabic Ligature Alef With Fathatan Isolated Formизолированное начертание, ≈U+0627 U+064B
Алиф-маддаU+FE81Arabic Letter Alef With Madda Above Isolated Formизолированное/начальное начертание, ≈U+0622; =C2 (DOS-864)
Алиф-маддаU+FE82Arabic Letter Alef With Madda Above Final Formсрединное/конечное начертание, ≈U+0622; =A2 (DOS-864)
Лям, алиф-маддаU+FEF5Arabic Ligature Lam With Alef With Madda Above Isolated Formизолированное/начальное начертание, ≈U+0644 U+0622; =F9 (DOS-864)
Лям, алиф-маддаU+FEF6Arabic Ligature Lam With Alef With Madda Above Final Formсрединное/конечное начертание, ≈U+0644 U+0622; =FA (DOS-864)

Комбинации с пробелом

ЗнакКодНазваниеРазложение
Шадда, танвин-даммаU+FC5EArabic Ligature Shadda With Dammatan Isolated Form= U+0020 U+064C U+0651
Шадда, танвин-кясраU+FC5FArabic Ligature Shadda With Kasratan Isolated Form= U+0020 U+064D U+0651
Шадда, фатхаU+FC60Arabic Ligature Shadda With Fatha Isolated Form= U+0020 U+064E U+0651
Шадда, даммаU+FC61Arabic Ligature Shadda With Damma Isolated Form= U+0020 U+064F U+0651
Шадда, кясраU+FC62Arabic Ligature Shadda With Kasra Isolated Form= U+0020 U+0650 U+0651
Шадда, надстрочный алифU+FC63Arabic Ligature Shadda With Superscript Alef Isolated Form= U+0020 U+0651 U+0670
Танвин-фатхаU+FE70Arabic Fathatan Isolated Form= U+0020 U+064B
Танвин-даммаU+FE72Arabic Dammatan Isolated Form= U+0020 U+064C
ФатхаU+FE76Arabic Fatha Isolated Form= U+0020 U+064E
Танвин-кясраU+FE74Arabic Kasratan Isolated Form= U+0020 U+064D
ДаммаU+FE78Arabic Damma Isolated Form= U+0020 U+064F
КясраU+FE7AArabic Kasra Isolated Form= U+0020 U+0650
ШаддаU+FE7CArabic Shadda Isolated Form= U+0020 U+0651
СукунU+FE7EArabic Sukun Isolated Form= U+0020 U+0652

Комбинации с кашидой

ЗнакКодНазваниеРазложение
Шадда, фатхаU+FCF2Arabic Ligature Shadda With Fatha Medial Form= U+0640 U+064E U+0651
Шадда, даммаU+FCF3Arabic Ligature Shadda With Damma Medial Form= U+0640 U+064F U+0651
Шадда, кясраU+FCF4Arabic Ligature Shadda With Kasra Medial Form= U+0640 U+0650 U+0651
Танвин-фатхаU+FE71Arabic Tatweel With Fathatan Above= U+0640 U+064B
ФатхаU+FE77Arabic Fatha Medial Form= U+0640 U+064E
ДаммаU+FE79Arabic Damma Medial Form= U+0640 U+064F
КясраU+FE7BArabic Kasra Medial Form= U+0640 U+0650
ШаддаU+FE7DArabic Shadda Medial Form= U+0640 U+0651; =F0 (DOS-864)
ﹿСукунU+FE7FArabic Sukun Medial Form= U+0640 U+0652

Ввод с клавиатуры

Арабская раскладка клавиатуры (огласовки выделены красным цветом)

В скобках указаны клавиши стандартной латинской раскладки (QWERTY), соответствующие называемым клавишам.

  • Знаки гласных (в том числе с танвином) набираются в верхнем регистре клавишами, расположенными в левой части блока буквенных клавиш. (Q, W, E, R, A, S, X)
  • Шадда набирается в верхнем регистре клавишей, расположенной слева блока цифровых клавиш. (тильда)
  • Алиф-мадда и лям-алиф-мадда набираются в верхнем регистре клавишами, расположенными в нижней части блока буквенных клавиш. (B, N)
  • Ввод мадды (отдельно от алифа), васлы (с алифом или отдельно) и надстрочного алифа при помощи стандартной раскладки невозможен.

Символы, которые невозможно ввести с клавиатуры непосредственно, можно ввести, используя их коды, приведённые выше. В Windows для этого используется комбинация Alt+[шестнадцатеричный код символа в Юникоде], например Alt+653 для ввода мадды, Alt+670 для ввода надстрочного алифа, Alt+671 для ввода алиф-васла. Цифры можно набирать на основной или на дополнительной клавиатуре, независимо от состояния NumLock. Остальные способы ввода символов по их кодам приведены в статье Unicode.

См. также

Примечания

Ссылки