Татарский форум

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Татарский форум » Компьютеры (железо, софт и т.п.) » Синтез татарской речи


Синтез татарской речи

Сообщений 1 страница 10 из 10

1

=================================================================================

Программа: Xeo-Voice
Версия: 1.5
Сборка: Express

Автор: Ronald Sp4rk
E-mail: sp4rk@myway.com

---------------------------------------------------------------------------------

Xeo-Voice - это бесплатная программа для синтеза речи с функцией записи звука в файл.

Язык: tat (Татарский)
Сайт: http://sp4rk.qc.to/rus/xeo-voice/tat/

=================================================================================

Лицензия: Freeware

---------------------------------------------------------------------------------

Документация: http://sp4rk.qc.to/rus/xeo-voice/tat/doc/

=================================================================================

ДОКУМЕНТАЦИЯ Xeo-Voice 1.x

---------------------------------------------------------------------------------

Xeo-Voice - это бесплатная программа для синтеза речи с функцией записи звука в файл. Поддерживается татарский язык (кириллица 1939 г.).

По умолчанию ударение ставится на последний слог слова, иначе добавляйте апостроф (или обратный апостроф) после ударной гласной, например: алма = яблоко, а'лма = не бери.

Тексты на татарском языке (кириллица 1939 г.) смотрите на tatar.com.ru, tt.wikipedia.org, и т.д.

Код:
=================================================================================

Для ввода текста через клавиатуру программа Xeo-Voice 1.x использует две стандартные раскладки: английскую и англо-русскую. На базе таблицы UTF-8 для татарского языка разработан специальный алфавит.

---------------------------------------------------------------------------------

ТАТАРСКИЙ АЛФАВИТ 2013 для Xeo-Voice 1.x

Автор: Ronald Sp4rk
E-mail: sp4rk@myway.com
Сайт: http://sp4rk.qc.to/rus/xeo-voice/tat/doc/
Дата создания (v1.0): 18.09.2013
Дата редактирования (v1.1): 11.11.2013
Дата редактирования (v1.2): 01.02.2014
Дата редактирования (v1.3): 02.05.2014
Дата редактирования (v1.4): 27.07.2014
Дата редактирования (v1.5): 31.10.2014

---------------------------------------------------------------------------------

Татарский алфавит 2013 содержит символы, необходимые для корректной записи, чтения и произношения текстов на татарском языке. Поддерживаются 4 кодировки.

Кодировка cyr-2013 полностью базируется на кириллице, кодировка lat-2013 - на латинице. В кодировке eng-rus-2013 (англо-русская раскладка) вместо кириллических символов, которых нет в русском алфавите, берутся буквы из английского алфавита. В кодировке eng-2013 (английская раскладка) все символы заменяются на английские буквы и их сочетания.

Все кодировки 2013 полностью конвертируемы между собой. Можно ввести символы в английской или англо-русской раскладке, а затем перекодировать текст в кириллицу или латиницу, и наоборот.

Буквы Ё ё, Ю ю, Я я были ликвидированы. Вместо них используются сочетания буквы Й й с соответствующей гласной по фонетической транскрипции. Изменено написание 3 старых букв: Е е на Ě ě, И и на Ӥ ӥ, Ы ы на Ӹ ӹ. Добавлено 4 буквы: Ғ ғ, Қ қ, Ў ў и новая Ы ы. Более подробно читайте в примечаниях ниже.

=================================================================================

cyr-1939      ipa    cyr-2013      eng-rus-2013  lat-2013      eng-2013
кириллица     мфа    кириллица     англо-рус.    латиница      англ.

А а       01. a~ɑ    А а           А а           A a           A a
Ә ә       02. æ      Ә ә           Я я           Ä ä           A'/Ah a'/ah [11]
Б б       03. b      Б б           Б б           B b           B b
В в       04. v      В в           В в           V v           V v
Г г       05. g~ɢ    Г г           Г г           G g           G g
          06. ɣ~ʁ    Ғ ғ [2]       G g           Ğ ğ           Gh gh
Д д       07. d      Д д           Д д           D d           D d
Е е       08. e      Ě ě [6]       Е е           E e           E e
Ё ё                  Йо/Йө йо/йө   Йо/Йё йо/йё   Yo/Yö yo/yö   Yo/yo' yo/yo'
Ж ж       09. ʒ      Ж ж           Ж ж           Ž ž           Zh zh
Җ җ       10. ʑ      Җ җ           Z z           Ȥ ȥ           Vh vh
З з       11. z      З з           З з           Z z           Z z
И и       12. i      Ӥ ӥ [5]       И и           I i           I i
Й й       13. j      Й й           Й й           Y y           Y y
К к       14. k      К к           К к           K k           K k
          15. q      Қ қ [3]       Q q           Q q           Q q
Л л       16. l      Л л           Л л           L l           L l
М м       17. m      М м           М м           M m           M m
Н н       18. n      Н н           Н н           N n           N n
Ң ң       19. ŋ~ɴ    Ң ң           N n           Ň ň           Nh nh
О о       20. o~ɔ    О о           О о           O o           O o
Ө ө       21. ø      Ө ө           Ё ё           Ö ö           O'/Oh o'/oh [11]
П п       22. p      П п           П п           P p           P p
Р р       23. r      Р р           Р р           R r           R r
С с       24. s      С с           С с           S s           S s
Т т       25. t      Т т           Т т           T t           T t
У у       26. u      У у           У у           U u           U u
Ү ү       27. y      Ү ү           Ю ю           Ü ü           U'/Uh u'/uh [11]
          28. w      Ў ў [4]       W w           W w           W w
Ф ф       29. f      Ф ф           Ф ф           F f           F f
Х х       30. x      Х х           Х х           Ȟ ȟ           Kh kh
Һ һ       31. h      Һ һ           Y h [10]      H h           X x
Ц ц       32. ts     Ц ц           Ц ц           C c           C c
Ч ч       33. tɕ     Ч ч [9]       Ч ч           Ç ç           Ch ch
Ш ш       34. ʃ      Ш ш           Ш ш           Š š           Sh sh
Щ щ       35. ɕ      Щ щ [9]       Щ щ           Ş ş           Xh xh
Ъ ъ       36. ʔ      Ъ ъ [7]       Ъ ъ           ^ ^           ^ ^
          37. ɯ~ɨ    Ы ы [1]       Ы ы           Ǐ ǐ ı [12]    I'/Ih i'/ih [11]
Ы ы       38. ɤ      Ӹ ӹ [1]       I i           Ÿ ÿ           Y'/Yh y'/yh [11]
Ь ь       39. ʲ      Ь ь           Ь ь           ' '           ' '
Э э       40. ɛ      Э э [8]       Э э           Ě ě           E'/Eh e'/eh [11]
Ю ю                  Йу/Йү йу/йү   Йу/Йю йу/йю   Yu/Yü yu/yü   Yu/yu' yu/yu'
Я я                  Йа/Йә йа/йә   Йа/Йя йа/йя   Ya/Yä ya/yä   Ya/ya' ya/ya'

Замечание: Также поддерживается кодировка arab-2013. Таблицу с арабицей смотрите в Меню -- Помощь -- Руководство, или на сайте: http://sp4rk.qc.to/rus/xeo-voice/inter/doc/
Необходимо учитывать, что при перекодировке в арабицу теряется регистр букв.

---------------------------------------------------------------------------------

Примечания:
[1] Написание старой татарской буквы Ы ы изменено на Ӹ ӹ. На её место добавлена новая буква Ы ы в качестве русской буквы Ы ы, например: музыка, балӹк (рыба), и т.д.
[2] Добавлена новая буква Ғ ғ в качестве старой татарской буквы Гъ гъ, например: мәғлүмат (сведения), сәғәт (час), и т.д.
[3] Добавлена новая буква Қ қ в качестве старой татарской буквы Къ къ, например: шәфқәт (милосердие), пақ (чистый), и т.д. Перед буквами А а, О о, У у, Ы ы, Ӹ ӹ, Э э можно писать К к, буква по умолчанию автоматически заменяется на Қ қ, например: кар (снег) = қар, но Нәфкәт <> Нәфқәт.
[4] Добавлена новая буква Ў ў в качестве английской буквы W w. Является полугласной, например: таў (гора), аўӹл (деревня), дөў (большой), и т.д.
[5] Написание старой татарской буквы И и изменено на Ӥ ӥ, например: кӥт (уходи), тӥр (пот), и т.д.
[6] Написание старой татарской буквы Е е изменено на Ě ě. Буква Ě ě используется только в качестве гласной, не диграфа, например: ěш (работа), йěгěт (парень), и т.д.
[7] Татарская буква Ъ ъ используется только в качестве арабской или русской хамзы (короткая пауза), например: Көръән, нěъа, и т.д.
[8] Татарская буква Э э используется только в качестве русской буквы Э э, например: Эмма, экскаватор, и т.д.
[9] Татарская буква Ч ч соответствует только русской букве Ч ч, а татарская буква Щ щ соответствует только русской букве Щ щ, например: почта, чěмпӥон, щӹг (выходи), өщ (три), и т.д.

[10] В кодировке eng-rus-2013 заглавная H (h) занята кириллической Н (н), поэтому вместо латинской H взята буква Y, например: Yям (и), Yяр (каждый), и т.д.
[11] В кодировке eng-2013 гласные A' a', O' o', U' u', I' i', Y' y', E' e' можно писать и как Ah ah, Oh oh, Uh uh, Ih ih, Yh yh, Eh eh соответственно. Такое написание используется перед гласными, а также в словах с указанными ударениями, например: uh`tma' (не проходи), tuh`gel (не), и т.д.
[12] В кодировке lat-2013 допускается писать ı вместо ǐ, но запрещается писать I вместо Ǐ.

=================================================================================

В татарском алфавите 2013 нет русских букв е, ё, и, ю, я, но имеется возможность писать русские имена, фамилии и иные слова с палатализацией (со смягчением). Для этого в кодировках eng-rus-2013 и eng-2013 используется мягкий знак. Вместо е пишется диграф ье ('e), вместо ё - ьо ('o), вместо и - ьи ('i), вместо ю - ьу ('u), вместо я - ьа ('a). Необходимо помнить, что в русском алфавите нет букв переднего ряда, поэтому, для исключения использования переднерядных согласных, перед гласными е (e), и (i) следует писать мягкий знак. Примеры:

---------------------------------------------------------------------------------

                cyr-2013      eng-rus-2013  lat-2013      eng-2013
Артём           Артём         Артьом        Artôm         Art'om
Вася            Вася          Васьа         Vasâ          Vas'a
Татьяна         Татьйана      Татьйана      Tat'yana      Tat'yana
Степан          Степан        Стьепан       Stêpan        St'epan
Рюрик           Рюрик         Рьурьик       Rûrîk         R'ur'ik
...
гель для волос  щәщ гелӭ      щящ гьельi    şäş gêlŷ      xha'xh g'el'y'

Замечание: В кодировках cyr-2013 и lat-2013 поддерживается автоматическая замена сочетаний букв ьě ('e) на е (ê), ьо ('o) на ё (ô), ьӥ ('i) на и (î), ьӹ ('y') на ӭ (ŷ), ьу ('u) на ю (û), ьа ('a) на я (â). Символы Е е (Ê ê), Ё ё (Ô ô), И и (Î î), Ӭ ӭ (Ŷ ŷ), Ю ю (Û û), Я я (Â â) являются диграфами, отсутствуют в кодировках eng-2013 и eng-rus-2013, выполняют исключительно декоративную функцию, самостоятельными буквами не считаются, используются только при палатализации (при смягчении), не при йотировании.

---------------------------------------------------------------------------------

Также поддерживается 3 татарских диалекта: казанский, мишарский и сибирский.

=================================================================================


Скачать: http://sp4rk.qc.to/rus/xeo-voice/tat/

=================================================================================

Мнения?

Отредактировано Sp4rk (2015-01-22 09:17:47)

0

2

Таблица с арабицей:

Код:
=================================================================================

Для ввода текста через клавиатуру программа Xeo-Voice 1.x использует две стандартные раскладки: английскую и англо-русскую. На базе таблицы UTF-8 для различных языков разработан специальный алфавит.

---------------------------------------------------------------------------------

АЛФАВИТ 2013 для Xeo-Voice 1.x

Автор: Ronald Sp4rk
E-mail: sp4rk@myway.com
Сайт: http://sp4rk.qc.to/rus/xeo-voice/inter/doc/
Дата создания (v1.5): 31.10.2014
Дата редактирования (v1.6): 16.01.2015

---------------------------------------------------------------------------------

Алфавит 2013 содержит символы, необходимые для корректной записи, чтения и произношения текстов на различных языках. Поддерживается 5 кодировок.

Кодировка cyr-2013 полностью базируется на кириллице, кодировка lat-2013 - на латинице. В кодировке eng-rus-2013 (англо-русская раскладка) вместо кириллических символов, которых нет в русском алфавите, берутся буквы из английского алфавита. В кодировке eng-2013 (английская раскладка) все символы заменяются на английские буквы и их сочетания. Кодировка arab-2013 базируется на арабском алфавите.

Все кодировки 2013 полностью конвертируемы между собой. Можно ввести символы в английской или англо-русской раскладке, а затем перекодировать текст в кириллицу, латиницу или арабицу, и наоборот. Необходимо учитывать, что при перекодировке в арабицу теряется регистр букв.

=================================================================================

    ipa    cyr     eng-rus lat     eng     arab

01. a~ɑ    А а     А а     A a     A a     ا
02. æ      Ә ә     Я я     Ä ä     A' a'   أ
03. b      Б б     Б б     B b     B b     ب
04. v~β    В в     В в     V v     V v     ۋ‎
05. g~ɢ    Г г     Г г     G g     G g     گ
06. ɣ~ʁ    Ғ ғ     G g     Ğ ğ     Gh gh   غ
07. d      Д д     Д д     D d     D d     د
    ʲe     Е е     ЬЕ ье   Ê ê     'E 'e   ٶ
08. e      Ě ě     Е е     E e     E e     ۏ
    ʲo     Ё ё     ЬО ьо   Ô ô     'O 'o   ۊ
09. ʒ      Ж ж     Ж ж     Ž ž     Zh zh   ژ‎
10. dʒ     Ӂ ӂ     & b     Ĵ ĵ     Jh jh   ڃ
11. ʑ      Җ җ     Z z     Ȥ ȥ     Vh vh   ڒ
12. dʑ     Ӝ ӝ     J j     J j     J j     ج
13. z      З з     З з     Z z     Z z     ز
14. ð~dð   Ҙ ҙ     D d     Đ đ     Dh dh   ذ
    ʲi     И и     ЬИ ьи   Î î     'I 'i   إ
15. i      Ӥ ӥ     И и     I i     I i     ێ
16. j~ɪ    Й й     Й й     Y y     Y y     ي
17. k      К к     К к     K k     K k     ك
18. q      Қ қ     Q q     Q q     Q q     ق
19. l      Л л     Л л     L l     L l     ل
20. m      М м     М м     M m     M m     م
21. n      Н н     Н н     N n     N n     ن
22. ŋ~ɴ    Ң ң     N n     Ň ň     Nh nh   ڭ
23. o~ɔ    О о     О о     O o     O o     ۆ
24. ø~œ    Ө ө     Ё ё     Ö ö     O' o'   ۉ
25. º      Ǒ ǒ     U u     Ǒ ǒ     Wh wh   ۄ
26. p      П п     П п     P p     P p     پ
27. r~ɾ    Р р     Р р     R r     R r     ر
28. s      С с     С с     S s     S s     س
29. θ~tθ   Ҫ ҫ     S s     Ŧ ŧ     Th th   ث
30. t      Т т     Т т     T t     T t     ت
31. u      У у     У у     U u     U u     ۇ
32. y      Ү ү     Ю ю     Ü ü     U' u'   ۈ
33. w      Ў ў     W w     W w     W w     و
34. f~ɸ    Ф ф     Ф ф     F f     F f     ف
35. x~χ    Х х     Х х     Ȟ ȟ     Kh kh   خ
36. h      Һ һ     Y h     H h     X x     ه
37. ts     Ц ц     Ц ц     C c     C c     څ
38. dz     Ӟ ӟ     V v     Ƶ ƶ     Bh bh   ځ
39. tɕ     Ч ч     Ч ч     Ç ç     Ch ch   چ
40. tʃ     Ӵ ӵ     L t     Č č     Ph ph   ڿ
41. ʃ      Ш ш     Ш ш     Š š     Sh sh   ش
42. ɕ      Щ щ     Щ щ     Ş ş     Xh xh   ۺ
43. ʔ      Ъ ъ     Ъ ъ     ^ ^     ^ ^     ء
44. ɯ~ɨ    Ы ы     Ы ы     Ǐ ǐ ı   I' i'   ئ
45. ɤ~ə    Ӹ ӹ     I i     Ÿ ÿ     Y' y'   ې
    ʲɤ     Ӭ ӭ     ЬI ьi   Ŷ ŷ     'Y' 'y' ۑ
46. ʲ      Ь ь     Ь ь     ' '     ' '     '
47. ɛ      Э э     Э э     Ě ě     E' e'   ؤ
    ʲu     Ю ю     ЬУ ьу   Û û     'U 'u   ٷ
    ʲa     Я я     ЬА ьа   Â â     'A 'a   ٵ

---------------------------------------------------------------------------------

Примечания:
1) В кодировке eng-rus-2013 заглавная T (t) занята кириллической Т (т), поэтому вместо латинской T взята буква L.
2) В кодировке eng-rus-2013 заглавная H (h) занята кириллической Н (н), поэтому вместо латинской H взята буква Y.
3) В кодировке eng-2013 гласные A' a', O' o', U' u', I' i', Y' y', E' e' можно писать и как Ah ah, Oh oh, Uh uh, Ih ih, Yh yh, Eh eh соответственно. Такое написание используется перед гласными, а также в словах с указанными ударениями.
4) В кодировке lat-2013 допускается писать ı вместо ǐ, но запрещается писать I вместо Ǐ.

=================================================================================

В алфавите 2013 для записи слов с палатализацией (со смягчением) в кодировках eng-2013 и eng-rus-2013 используется мягкий знак. Вместо е/ê/ٶ пишется диграф 'e (ье), вместо ё/ô/ۊ - 'o (ьо), вместо и/î/إ - 'i (ьи), вместо ю/û/ٷ - 'u (ьу), вместо я/â/ٵ - 'a (ьа). Примеры:

---------------------------------------------------------------------------------

              cyr-2013      eng-rus-2013  lat-2013      eng-2013      arab-2013
Артём         Артём         Артьом        Artôm         Art'om        ارتۊم
Вася          Вася          Васьа         Vasâ          Vas'a         ۋاسٵ
Татьяна       Татьйана      Татьйана      Tat'yana      Tat'yana      تات'يانا
Степан        Степан        Стьепан       Stêpan        St'epan       ستٶپان
Рюрик         Рюрик         Рьурьик       Rûrîk         R'ur'ik       رٷرإك

Замечание: В кодировках cyr-2013, lat-2013 и arab-2013 поддерживается автоматическая замена сочетаний букв 'e (ьě) на е/ê/ٶ, 'o (ьо) на ё/ô/ۊ, 'i (ьӥ) на и/î/إ, 'u (ьу) на ю/û/ٷ, 'a (ьа) на я/â/ٵ. Символы е/ê/ٶ, ё/ô/ۊ, и/î/إ, ю/û/ٷ, я/â/ٵ являются диграфами, отсутствуют в кодировках eng-2013 и eng-rus-2013, выполняют исключительно декоративную функцию, самостоятельными буквами не считаются, используются только при палатализации (при смягчении), не при йотировании.

=================================================================================

Поддерживается 3 стиля речи: русский, английский и французский. В английском стиле альвеолярная [r] автоматически заменяется на аппроксимант [ɹ], альвеолярная [l] заменяется на велярную [ʟ], дентальные [t], [d] и [n] заменяются на альвеолярные [t], [d] и [n] соответственно. Во французском стиле [r] заменяется на увулярную [ʀ].

=================================================================================

Отредактировано Sp4rk (2015-01-22 09:19:19)

0

3

Исходный текст:

cyr-1939: Татар теле — татарларның милли теле, Татарстанның дәүләт теле, Русиядә таралу буенча икенче тел. Төрки телләрнең кыпчак төркеменә керә. ЮНЕСКО игълан иткән 14 тел исемлегенә керә. Лексика ягыннан татар теленә иң якын тел — башкорт теле, аннары ногай, каракалпак, казакъ, балкар, үзбәк һәм комык телләре бара. Дөньяда татарча белгәннәрнең саны мәгълүм түгел. Бу сан якынча 6 миллионнан 8 миллионга кадәр. Татар теле Үзбәкстан, Казакъстан, Азәрбайҗан, Кыргызстан, Таҗикстан һәм Төрекмәнстан илләрендә таралган. Татарча сөйләшкәннәр хәтта Австралиядә дә бар.

Отредактировано Sp4rk (2015-01-22 09:20:43)

0

4

Пример перекодировки текста (на мишарском диалекте):

eng-rus-2013: Татар теле - татарларнin милли теле, Татарстаннin дяwлят теле, Русийядя таралу буйiнча икенче тел. Тёрки теллярнеn кiпчак тёркеменя керя. Йунеско иgлан иткян 14 тел исемлегеня керя. Лексика йагiннан татар теленя иn йакiн тел - башкорт теле, аннарi ногай, каракалпак, казаq, балкар, юзбяк hям комiк телляре бара. Дёньйада татарча белгяннярнеn санi мяgлюм тюгел. Бу сан йакiнча 6 миллионнан 8 миллионга кадяр. Татар теле Юзбякстан, Казаqстан, Азярбайjан, Кiргiзстан, Таjикстан hям Тёрекмянстан иллярендя таралган. Татарча сёйляшкянняр хятта Австралийядя дя бар.

cyr-2013: Татар тěлě - татарларнӹң мӥллӥ тěлě, Татарстаннӹң дәўләт тěлě, Русӥйәдә таралу буйӹнча ӥкěнчě тěл. Төркӥ тěлләрнěң кӹпчак төркěмěнә кěрә. Йунěско ӥғлан ӥткән 14 тěл ӥсěмлěгěнә кěрә. Лěксӥка йагӹннан татар тěлěнә ӥң йакӹн тěл - башкорт тěлě, аннарӹ ногай, каракалпак, казақ, балкар, үзбәк һәм комӹк тěлләрě бара. Дөньйада татарча бěлгәннәрнěң санӹ мәғлүм түгěл. Бу сан йакӹнча 6 мӥллӥоннан 8 мӥллӥонга кадәр. Татар тěлě Үзбәкстан, Казақстан, Азәрбайӝан, Кӹргӹзстан, Таӝӥкстан һәм Төрěкмәнстан ӥлләрěндә таралган. Татарча сөйләшкәннәр хәтта Австралӥйәдә дә бар.

eng-2013: Tatar tele - tatarlarny'nh milli tele, Tatarstanny'nh da'wla't tele, Rusiya'da' taralu buyy'ncha ikenche tel. To'rki tella'rnenh ky'pchak to'rkemena' kera'. Yunesko ighlan itka'n 14 tel isemlegena' kera'. Leksika yagy'nnan tatar telena' inh yaky'n tel - bashkort tele, annary' nogay, karakalpak, kazaq, balkar, u'zba'k xa'm komy'k tella're bara. Do'n'yada tatarcha belga'nna'rnenh sany' ma'ghlu'm tu'gel. Bu san yaky'ncha 6 millionnan 8 millionga kada'r. Tatar tele U'zba'kstan, Kazaqstan, Aza'rbayjan, Ky'rgy'zstan, Tajikstan xa'm To'rekma'nstan illa'renda' taralgan. Tatarcha so'yla'shka'nna'r khahtta Avstraliya'da' da' bar.

lat-2013: Tatar tele - tatarlarnÿň milli tele, Tatarstannÿň däwlät tele, Rusiyädä taralu buyÿnça ikençe tel. Törki tellärneň kÿpçak törkemenä kerä. Yunesko iğlan itkän 14 tel isemlegenä kerä. Leksika yagÿnnan tatar telenä iň yakÿn tel - baškort tele, annarÿ nogay, karakalpak, kazaq, balkar, üzbäk häm komÿk telläre bara. Dön'yada tatarça belgännärneň sanÿ mäğlüm tügel. Bu san yakÿnça 6 millionnan 8 millionga kadär. Tatar tele Üzbäkstan, Kazaqstan, Azärbayjan, Kÿrgÿzstan, Tajikstan häm Törekmänstan illärendä taralgan. Tatarça söyläškännär ȟätta Avstraliyädä dä bar.

arab-2013: تاتار تۏلۏ - تاتارلارنېڭ مێللێ تۏلۏ, تاتارستاننېڭ دأولأت تۏلۏ, رۇسێيأدأ تارالۇ بۇيېنچا ێكۏنچۏ تۏل. تۉركێ تۏللأرنۏڭ كېپچاك تۉركۏمۏنأ كۏرأ. يۇنۏسكۆ ێغلان ێتكأن 14 تۏل ێسۏملۏگۏنأ كۏرأ. لۏكسێكا ياگېننان تاتار تۏلۏنأ ێڭ ياكېن تۏل - باشكۆرت تۏلۏ, اننارې نۆگاي, كاراكالپاك, كازاق, بالكار, ۈزبأك هأم كۆمېك تۏللأرۏ بارا. دۉن'يادا تاتارچا بۏلگأننأرنۏڭ سانې مأغلۈم تۈگۏل. بۇ سان ياكېنچا 6 مێللێۆننان 8 مێللێۆنگا كادأر. تاتار تۏلۏ ۈزبأكستان, كازاقستان, ازأربايجان, كېرگېزستان, تاجێكستان هأم تۉرۏكمأنستان ێللأرۏندأ تارالگان. تاتارچا سۉيلأشكأننأر خأتتا اۋسترالێيأدأ دأ بار.

Отредактировано Sp4rk (2015-01-22 09:22:00)

0

5

Пример перекодировки текста (на казанском диалекте):

eng-rus-2013: Татар теле - татарларнin милли теле, Татарстаннin дяwлят теле, Русийядя таралу буйiнща икенще тел. Тёрки теллярнеn кiпщак тёркеменя керя. Йунеско иgлан иткян 14 тел исемлегеня керя. Лексика йагiннан татар теленя иn йакiн тел - башкорт теле, аннарi ногай, каракалпак, казаq, балкар, юзбяк hям комiк телляре бара. Дёньйада татарща белгяннярнеn санi мяgлюм тюгел. Бу сан йакiнща 6 миллионнан 8 миллионга кадяр. Татар теле Юзбякстан, Казаqстан, Азярбайzан, Кiргiзстан, Таzикстан hям Тёрекмянстан иллярендя таралган. Татарща сёйляшкянняр хятта Австралийядя дя бар.

cyr-2013: Татар тěлě - татарларнӹң мӥллӥ тěлě, Татарстаннӹң дәўләт тěлě, Русӥйәдә таралу буйӹнща ӥкěнщě тěл. Төркӥ тěлләрнěң кӹпщак төркěмěнә кěрә. Йунěско ӥғлан ӥткән 14 тěл ӥсěмлěгěнә кěрә. Лěксӥка йагӹннан татар тěлěнә ӥң йакӹн тěл - башкорт тěлě, аннарӹ ногай, каракалпак, казақ, балкар, үзбәк һәм комӹк тěлләрě бара. Дөньйада татарща бěлгәннәрнěң санӹ мәғлүм түгěл. Бу сан йакӹнща 6 мӥллӥоннан 8 мӥллӥонга кадәр. Татар тěлě Үзбәкстан, Казақстан, Азәрбайҗан, Кӹргӹзстан, Таҗӥкстан һәм Төрěкмәнстан ӥлләрěндә таралган. Татарща сөйләшкәннәр хәтта Австралӥйәдә дә бар.

eng-2013: Tatar tele - tatarlarny'nh milli tele, Tatarstanny'nh da'wla't tele, Rusiya'da' taralu buyy'nxha ikenxhe tel. To'rki tella'rnenh ky'pxhak to'rkemena' kera'. Yunesko ighlan itka'n 14 tel isemlegena' kera'. Leksika yagy'nnan tatar telena' inh yaky'n tel - bashkort tele, annary' nogay, karakalpak, kazaq, balkar, u'zba'k xa'm komy'k tella're bara. Do'n'yada tatarxha belga'nna'rnenh sany' ma'ghlu'm tu'gel. Bu san yaky'nxha 6 millionnan 8 millionga kada'r. Tatar tele U'zba'kstan, Kazaqstan, Aza'rbayvhan, Ky'rgy'zstan, Tavhikstan xa'm To'rekma'nstan illa'renda' taralgan. Tatarxha so'yla'shka'nna'r khahtta Avstraliya'da' da' bar.

lat-2013: Tatar tele - tatarlarnÿň milli tele, Tatarstannÿň däwlät tele, Rusiyädä taralu buyÿnşa ikenşe tel. Törki tellärneň kÿpşak törkemenä kerä. Yunesko iğlan itkän 14 tel isemlegenä kerä. Leksika yagÿnnan tatar telenä iň yakÿn tel - baškort tele, annarÿ nogay, karakalpak, kazaq, balkar, üzbäk häm komÿk telläre bara. Dön'yada tatarşa belgännärneň sanÿ mäğlüm tügel. Bu san yakÿnşa 6 millionnan 8 millionga kadär. Tatar tele Üzbäkstan, Kazaqstan, Azärbayȥan, Kÿrgÿzstan, Taȥikstan häm Törekmänstan illärendä taralgan. Tatarşa söyläškännär ȟätta Avstraliyädä dä bar.

arab-2013: تاتار تۏلۏ - تاتارلارنېڭ مێللێ تۏلۏ, تاتارستاننېڭ دأولأت تۏلۏ, رۇسێيأدأ تارالۇ بۇيېنۺا ێكۏنۺۏ تۏل. تۉركێ تۏللأرنۏڭ كېپۺاك تۉركۏمۏنأ كۏرأ. يۇنۏسكۆ ێغلان ێتكأن 14 تۏل ێسۏملۏگۏنأ كۏرأ. لۏكسێكا ياگېننان تاتار تۏلۏنأ ێڭ ياكېن تۏل - باشكۆرت تۏلۏ, اننارې نۆگاي, كاراكالپاك, كازاق, بالكار, ۈزبأك هأم كۆمېك تۏللأرۏ بارا. دۉن'يادا تاتارۺا بۏلگأننأرنۏڭ سانې مأغلۈم تۈگۏل. بۇ سان ياكېنۺا 6 مێللێۆننان 8 مێللێۆنگا كادأر. تاتار تۏلۏ ۈزبأكستان, كازاقستان, ازأربايڒان, كېرگېزستان, تاڒێكستان هأم تۉرۏكمأنستان ێللأرۏندأ تارالگان. تاتارۺا سۉيلأشكأننأر خأتتا اۋسترالێيأدأ دأ بار.

Отредактировано Sp4rk (2015-01-22 09:23:13)

0

6

Пример перекодировки текста (на сибирском диалекте):

eng-rus-2013: Татар теле - татарларнin милли теле, Татарстаннin дяwлят теле, Русийядя таралу буйiнца икенце тел. Тёрки теллярнеn кiпцак тёркеменя керя. Йунеско иgлан иткян 14 тел исемлегеня керя. Лексика йагiннан татар теленя иn йакiн тел - башкорт теле, аннарi ногай, каракалпак, казаq, балкар, юзбяк hям комiк телляре бара. Дёньйада татарца белгяннярнеn санi мяgлюм тюгел. Бу сан йакiнца 6 миллионнан 8 миллионга кадяр. Татар теле Юзбякстан, Казаqстан, Азярбайvан, Кiргiзстан, Таvикстан hям Тёрекмянстан иллярендя таралган. Татарца сёйляшкянняр хятта Австралийядя дя бар.

cyr-2013: Татар тěлě - татарларнӹң мӥллӥ тěлě, Татарстаннӹң дәўләт тěлě, Русӥйәдә таралу буйӹнца ӥкěнцě тěл. Төркӥ тěлләрнěң кӹпцак төркěмěнә кěрә. Йунěско ӥғлан ӥткән 14 тěл ӥсěмлěгěнә кěрә. Лěксӥка йагӹннан татар тěлěнә ӥң йакӹн тěл - башкорт тěлě, аннарӹ ногай, каракалпак, казақ, балкар, үзбәк һәм комӹк тěлләрě бара. Дөньйада татарца бěлгәннәрнěң санӹ мәғлүм түгěл. Бу сан йакӹнца 6 мӥллӥоннан 8 мӥллӥонга кадәр. Татар тěлě Үзбәкстан, Казақстан, Азәрбайӟан, Кӹргӹзстан, Таӟӥкстан һәм Төрěкмәнстан ӥлләрěндә таралган. Татарца сөйләшкәннәр хәтта Австралӥйәдә дә бар.

eng-2013: Tatar tele - tatarlarny'nh milli tele, Tatarstanny'nh da'wla't tele, Rusiya'da' taralu buyy'nca ikence tel. To'rki tella'rnenh ky'pcak to'rkemena' kera'. Yunesko ighlan itka'n 14 tel isemlegena' kera'. Leksika yagy'nnan tatar telena' inh yaky'n tel - bashkort tele, annary' nogay, karakalpak, kazaq, balkar, u'zba'k xa'm komy'k tella're bara. Do'n'yada tatarca belga'nna'rnenh sany' ma'ghlu'm tu'gel. Bu san yaky'nca 6 millionnan 8 millionga kada'r. Tatar tele U'zba'kstan, Kazaqstan, Aza'rbaybhan, Ky'rgy'zstan, Tabhikstan xa'm To'rekma'nstan illa'renda' taralgan. Tatarca so'yla'shka'nna'r khahtta Avstraliya'da' da' bar.

lat-2013: Tatar tele - tatarlarnÿň milli tele, Tatarstannÿň däwlät tele, Rusiyädä taralu buyÿnca ikence tel. Törki tellärneň kÿpcak törkemenä kerä. Yunesko iğlan itkän 14 tel isemlegenä kerä. Leksika yagÿnnan tatar telenä iň yakÿn tel - baškort tele, annarÿ nogay, karakalpak, kazaq, balkar, üzbäk häm komÿk telläre bara. Dön'yada tatarca belgännärneň sanÿ mäğlüm tügel. Bu san yakÿnca 6 millionnan 8 millionga kadär. Tatar tele Üzbäkstan, Kazaqstan, Azärbayƶan, Kÿrgÿzstan, Taƶikstan häm Törekmänstan illärendä taralgan. Tatarca söyläškännär ȟätta Avstraliyädä dä bar.

arab-2013: تاتار تۏلۏ - تاتارلارنېڭ مێللێ تۏلۏ, تاتارستاننېڭ دأولأت تۏلۏ, رۇسێيأدأ تارالۇ بۇيېنڅا ێكۏنڅۏ تۏل. تۉركێ تۏللأرنۏڭ كېپڅاك تۉركۏمۏنأ كۏرأ. يۇنۏسكۆ ێغلان ێتكأن 14 تۏل ێسۏملۏگۏنأ كۏرأ. لۏكسێكا ياگېننان تاتار تۏلۏنأ ێڭ ياكېن تۏل - باشكۆرت تۏلۏ, اننارې نۆگاي, كاراكالپاك, كازاق, بالكار, ۈزبأك هأم كۆمېك تۏللأرۏ بارا. دۉن'يادا تاتارڅا بۏلگأننأرنۏڭ سانې مأغلۈم تۈگۏل. بۇ سان ياكېنڅا 6 مێللێۆننان 8 مێللێۆنگا كادأر. تاتار تۏلۏ ۈزبأكستان, كازاقستان, ازأربايځان, كېرگېزستان, تاځێكستان هأم تۉرۏكمأنستان ێللأرۏندأ تارالگان. تاتارڅا سۉيلأشكأننأر خأتتا اۋسترالێيأدأ دأ بار.

Отредактировано Sp4rk (2015-01-22 09:24:29)

0

7

Программа Xeo-Voice 1.x поддерживает вокализацию музыки. VOCAL TEXT может содержаться отдельно, либо вместе с речевым монологом.

-- BEGIN VOCAL TEXT --
DATA-FORMAT: Xeo-Voice 1.9
LYRICS-ENCODING: cyr-2013
BIT-PER-MINUTE: 130
SYLLABLE-PER-TACT: 2
-- LYRICS --
# ТАЛА ТАЛА (Татар халык җыры)
Э'х, та'ла, та'ла, та'ла,
Та'ла ӥ'кě бěләгě'м.
Нӥ'гә та'ла, нӥ'гә йа'на,
Ӥ'кән, мӥ'нěм йөрәгě'м?
-- MUSIC --
2D,D,D,A,A,A,A
A,A,C2,C2,A,A,2A
F,F,G,G,D,D,D,D
F,F,G,G,D,D,2D
--- END VOCAL TEXT ---

ПОЯСНЕНИЯ:

DATA-FORMAT: Xeo-Voice 1.9
Используемый формат данных. Определяет поддерживаемые настройки и структуру блока VOCAL TEXT.
LYRICS-ENCODING: cyr-2013
Код написания стихов. Поддерживаются кодировки cyr-2013, eng-rus-2013, lat-2013, eng-2013 и arab-2013. Самые доступные для ввода кодировки - eng-2013 и eng-rus-2013.
BIT-PER-MINUTE: 130
Количество ударов в минуту. Соответствует числу тактов в минуте. Допустимые значения - от 40 (очень медленно) до 208 (очень быстро) включительно.
SYLLABLE-PER-TACT: 2
Количество слогов слов в одном такте. Допустимые значения - 1..16 включительно. Обычно 2. Поддерживается слияние слогов в один.

Блок LYRICS содержит стихи (слова), написанные в кодировке LYRICS-ENCODING (см. выше). Допускается комментирование строк символом "#" (решёткой) слева, разрешаются пустые строки.

Блок MUSIC включает буквенные обозначения согласно следующей нотации: C, C#, D, Eb, E, F, F#, G, Ab, A, Bb, B. Вместо Bb и B разрешается писать Hb и H соответственно.
Для увеличения ноты на октаву добавляется цифра "2" справа, например: C2, C#2, Eb2. Для уменьшения - цифра "0", например: C0, C#0, Eb0.
Для увеличения длительности ноты добавляются цифры "2..9" слева, например: 2C, 4C#, 3Eb, 4C2, 3C#0, 4Eb2.
Для пропуска ноты (для создания тишины) используется символ "." (точка). Ноты разделяются символом "," (запятой) или " " (пробелом).

Вокализация музыки может быть использована для создания акапелл с последующим наложением их на инструментальные треки при аранжировках.

0

8

Пример вокализации музыки одной из татарских народных песен:

Текст (в кодировке cyr-2013):

----

# ТАЛА ТАЛА (Татар халык җыры)

Сандуга'щлар ӥ'йәләшкән
Су' ěщě'ргә мӥләштә'н.
Сагнула'рӹм бě'тәр ӥ'дě,
Сӥ'нě кү'рěп, сөйләшсә'м.

Э'х, та'ла, та'ла, та'ла,
Та'ла ӥ'кě бěләгě'м.
Нӥ'гә та'ла, нӥ'гә йа'на,
Ӥ'кән, мӥ'нěм йөрәгě'м?

А'гӥдěлгә ба'сма са'лдӹм,
Кайӹннӹ' сайла'п кӹна'.
Йаннарӹ'ңа ба'рӹр ӥ'дěм,
Ко'ш булӹ'п, сайра'п кӹна'.

Э'х, та'ла, та'ла, та'ла,
Та'ла ӥ'кě бěләгě'м.
Нӥ'гә та'ла, нӥ'гә йа'на,
Ӥ'кән, мӥ'нěм йөрәгě'м?

А'гӥдěл суӹ' тӥрбә'лӥ,
Уртасӹ'нда са'й булса'.
Су'га са'лсаң - ка'лкӹп щӹ'гар,
Бě'згә на'сӹйп йа'р булса'.

Э'х, та'ла, та'ла, та'ла,
Та'ла ӥ'кě бěләгě'м.
Нӥ'гә та'ла, нӥ'гә йа'на,
Ӥ'кән, мӥ'нěм йөрәгě'м?

----

Скачать синтезированный MP3-файл (~1МБ):
http://sp4rk.qc.to/xeo-voice/tat/vocal/express_tala/

Поёт не человек, поёт компьютер.

0

9

Программа Xeo-Voice 1.x поддерживает чтение стихов. Реализовано через вокализацию музыки, но используется малый диапазон нот. Пример чтения стиха Мажита Гафури на татарском языке:

-- BEGIN VOCAL TEXT --

DATA-FORMAT: Xeo-Voice 1.9
LYRICS-ENCODING: cyr-2013
BIT-PER-MINUTE: 120
SYLLABLE-PER-TACT: 4

-- LYRICS --

# Мәҗит Гафури - Татар байрагы

Дүрт йө'з йӹл буйӹ'
Тәхқӹ'йр ӥтěлгә'н,
Тата'рнӹң туӹ'
Бу' кө'н ěлěнгә'н.

Дүрт йө'з йӹл буйӹ'
Хәбě'стә торга'н,
Тата'рнӹң уйӹ'
Бу' кө'н котӹлга'н.

Дүрт йө'з йӹл буйӹ'
Нӥлә'р күрмәдě'к.
Түздě'к, щӹдадӹ'к,
Һама'н үлмәдě'к.

Сакла'нӹп ěщтә'
Сӹнмӹ'й кӥ'лдě у'л,
Бу' кө'н ěлěнгә'н
Байра'к ә'нә шу'л.

Канлӹ' бәгěрě'бěз
Йандӹ', сӹзладӹ',
Өмӥ'д байрагӹ'
Һама'н сӹнмадӹ'.

Тәкра'р ěлěнгә'н
Байра'к ӥ'ндě а'ўмас.
Тата'рнӹң ӥсмě'
Мә'ңгě йуга'лмас.

Башка' байракла'р
Бěлә'н бě'р сафта'
Барсӹ'н бу' байра'к,
Алсӹ'н бě'тмәс да'н.

-- MUSIC --

2Hb0,3C,H0,2Hb0,3H0.
2C,3C#,H0,2Hb0,3A0.
2Hb0,3H0,Hb0,2Hb0,3H0.
2H0,3C,H0,2Hb0,3A0..

2Hb0,3C,H0,2Hb0,3H0.
2C,3C#,H0,2Hb0,3A0.
2Hb0,3H0,Hb0,2Hb0,3C.
2H0,3C,H0,2Hb0,3A0..

2Hb0,3C,H0,2Hb0,3H0.
2Hb0,3C,Hb0,2Hb0,3A0.
2Hb0,3H0.H0,2Hb0,3H0.
2H0,3C,H0,2Hb0,3A0..

2Hb0,3C,H0,2Hb0,3H0.
2C,3C#,H0,2Hb0,3A0.
2Hb0,3H0,H0,2Hb0,3H0.
2H0,3C,H0,2Hb0,3A0..

2Hb0,3C#,H0,Hb0,2H0,2A0.
2Hb0,3H0.Hb0,2Hb0,3H0.
2H0,3C,H0,2Hb0,3H0.
2H0,3C,H0,2Hb0,3A0..

2Hb0,3C,H0,2Hb0,3H0.
2Hb0,3H0,2Hb0,H0,2C,2A0.
2Hb0,3H0,Hb0,2Hb0,3C.
3C#,2H0,Hb0,3H0,2A0..

2Hb0,3H0,Hb0,2Hb0,3H0.
2H0,3C,Hb0,2H0,3C.
2H0,3C#,H0,2Hb0,3A0.
2H0,3C#,H0,2Hb0,3A0..

--- END VOCAL TEXT ---


Послушать синтезированный звуковой файл:
http://sp4rk.qc.to/xeo-voice/tat/verse/express_flag/

Стих читает не человек, стих читает компьютер.

0

10

Скачал программу. Неплохо поёт, но потом у меня читает только два первых абзаца, и всё.

0


Вы здесь » Татарский форум » Компьютеры (железо, софт и т.п.) » Синтез татарской речи