Artikulyatsion sintez - Articulatory synthesis

Artikulyatsion sintez uchun 3D vokal traktining modeli Consonant-Vowel koartikulyatsiyasini modellashtirish asosida, nemischa jumla "Lea und Doreen mögen Bananen."asosiy chastota va telefonning davomiyligi jihatidan tabiiy ravishda so'zlashadigan jumlaga qayta tiklandi.[1]

Artikulyatsion sintez uchun hisoblash texnikasiga ishora qiladi nutqni sintez qilish insonning modellari asosida vokal trakti va u erda yuzaga keladigan artikulyatsiya jarayonlari. Vokal traktining shakli bir qancha usullar bilan boshqarilishi mumkin, bu odatda nutq artikulyatorlarining holatini o'zgartirishni o'z ichiga oladi, masalan til, jag ' va lablar. Nutq vokal trakti vakili orqali havo oqimini raqamli simulyatsiya qilish orqali hosil bo'ladi.

Mexanik nutq boshlari

Mexanik qurishga urinishlarning uzoq tarixi bor "gaplashadigan boshlar.".[2] Gerbert (vafot 1003), Albertus Magnus (1198–1280) va Rojer Bekon (1214–1294) barchasi nutq boshlarini qurgan deyishadi (Bug'doy toshi 1837). Biroq, tarixiy tasdiqlangan nutq sintezi boshlanadi Volfgang fon Kempelen (1734-1804), 1791 yilda o'tkazilgan tadqiqotlari to'g'risidagi hisobotni nashr etdi (shuningdek qarang.) Dadli va Tarnoczy 1950 yil ).

Elektr vokal traktining analoglari

Birinchi elektr vokal traktining analoglari Dann (1950), kabi statik edi, Ken Stivens va hamkasblar (1953), Gunnar Fant (1960). Rozen (1958) keyinchalik Dennis (1963) kompyuter yordamida boshqarishga harakat qilgan dinamik vokal traktini (DAVO) qurdi. Dennis va boshq. (1964), Hiki va boshq. (1968) va Baxter va Strong (1969), shuningdek, apparat vokal-trakt analoglarini tavsifladilar. Kelly va Lochbaum (1962) birinchi kompyuter simulyatsiyasini amalga oshirdilar; keyinchalik raqamli kompyuter simulyatsiyalari amalga oshirildi, masalan. Nakata va Mitsuoka (1965), Matsui (1968) va Pol Mermelshteyn (1971) tomonidan. Honda va boshq. (1968) an analog kompyuter simulyatsiya.

Haskins va Maeda modellari

Laboratoriya tajribalari uchun muntazam ravishda ishlatiladigan birinchi dasturiy artikulyatsion sintezator ishlab chiqilgan Haskins Laboratories 1970-yillarning o'rtalarida tomonidan Filipp Rubin, Tom Baer va Pol Mermelshteyn. ASY deb nomlanuvchi ushbu sintezator,[3] da ishlab chiqilgan vokal trakti modellari asosida nutq ishlab chiqarishning hisoblash modeli edi Qo'ng'iroq laboratoriyalari 1960 va 1970 yillarda Pol Mermelshteyn, Sesil Koker va uning hamkasblari tomonidan. Tez-tez ishlatib kelinayotgan yana bir mashhur model - bu Shinji Maeda modelidir, u boshqarish uchun omillarga asoslangan yondashuvni qo'llaydi til shakli.

Zamonaviy modellar

So'nggi paytlarda nutqni tasvirlash, artikulyatsion boshqaruvni modellashtirish va til biomexanikasini modellashtirish sohalarida erishilgan yutuqlar artikulyatsiya sintezini amalga oshirishda o'zgarishlarga olib keldi. [1][doimiy o'lik havola ]. Masalan, Haskins CASY modeli (Konfiguratsiya qilinadigan artikulyatsiya sintezi),[4] tomonidan ishlab chiqilgan Filipp Rubin, Mark Tide [2] va Louis Goldstein [3], bu mittagital vokal traktlarini haqiqiyga mos keladi magnit-rezonans tomografiya (MRI) ma'lumotlari va ovozli traktning 3D modelini yaratish uchun MRI ma'lumotlaridan foydalaniladi. To'liq 3D artikulyatsion sintez modeli Olov Engval tomonidan tavsiflangan. Geometrik asosda 3D artikulyatsion nutq sintezatori Piter Birxolz (VocalTractLab) tomonidan ishlab chiqilgan[5]). The Artikulyatorlar tezligiga yo'nalishlar (DIVA) modeli, nutqni ishlab chiqarish asosida yotadigan asabiy hisob-kitoblarni hisobga oladigan ovqatlanishni boshqarish usuli ishlab chiqilgan Frank H. Gyenter da Boston universiteti. ArtiSynth loyihasi,[6] Sidney Fels boshchiligida [4] da Britaniya Kolumbiyasi universiteti, inson vokal trakti va yuqori nafas yo'llari uchun 3D biomexanik modellashtirish vositasi. Kabi artikulyatorlarni biomexanik modellashtirish til bir qator olimlar, jumladan, Reyner Vilgelms-Trikariko tomonidan kashf etilgan [5], Yoxan Payan [6] va Jan-Mishel Jerar [7], Dzianvu Dang va Kiyoshi Xonda [8].

Tijorat modellari

Nutqni sintez qiladigan tijorat artikulyatsion tizimlaridan biri bu Keyingisi Dastlab Trillium Sound Research kompaniyasi tomonidan ishlab chiqilgan va sotilgan tizim bu tizimning birlashtiruvchi kompaniyasi Kalgari universiteti, bu erda asl tadqiqotning katta qismi o'tkazildi. Turli xil mujassamlashuvlarning yo'q qilinishidan so'ng Keyingisi (boshlagan Stiv Jobs 1980-yillarning oxirlarida va birlashdi Apple Computer 1997 yilda), Trillium dasturi a GNU umumiy jamoat litsenziyasi, ish davom etishi bilan gnuspeech. Dastlab 1994 yilda sotuvga chiqarilgan tizim, Rene Karrening "o'ziga xos mintaqa modeli" tomonidan boshqariladigan odamning og'iz va burun yo'llarining to'lqinli qo'llanmasi yoki uzatish liniyasi analogidan foydalangan holda to'liq artikulyatsiya asosida matnni nutqqa konversiyasini ta'minlaydi.[7]

Shuningdek qarang

Izohlar

  1. ^ Birxolz, Piter (2013). "Artikulyatsion nutq sintezi uchun undosh-unli koartikulyatsiyani modellashtirish". PLOS ONE. 8 (4): e60603. Bibcode:2013PLoSO ... 860603B. doi:10.1371 / journal.pone.0060603. PMC  3628899. PMID  23613734.
  2. ^ Gapiradigan boshlar
  3. ^ ASY
  4. ^ CASY
  5. ^ VocalTractLab
  6. ^ Artisint
  7. ^ Haqiqiy vaqtda artikulyatsion nutq-sintez-qoidalar

Bibliografiya

  • Baxter, Brent va Uilyam J. Strong. (1969). WINDBAG - vokal-trakt analog nutq sintezatori. Amerika akustik jamiyati jurnali, 45, 309 (A).
  • Birkholz P, Jekel D, Kröger BJ (2007) vaqt o'zgaruvchan vokal tizimidagi turbulentlik sababli yo'qotishlarni simulyatsiya qilish. Ovoz, nutq va tilni qayta ishlash bo'yicha IEEE operatsiyalari 15: 1218-1225
  • Birkholz P, Jekel D, Kröger BJ (2006) uch o'lchovli vokal trakti modelini qurish va boshqarish. Akustika, nutq va signallarni qayta ishlash bo'yicha xalqaro konferentsiya materiallari (ICASSP 2006) (Tuluza, Frantsiya) 873–876 betlar
  • Koker. C. H. (1968). Parametrik artikulyatsion model bilan nutq sintezi. Proc. Nutq. Symp., Kyoto, Yaponiya, qog'oz A-4.
  • Coker, C. H. (1976). "Artikulyatsion dinamikasi va boshqaruvi modeli". IEEE ish yuritish. 64 (4): 452–460. doi:10.1109 / PROC.1976.10154.
  • Koker; Fujimura, O. (1966). "Vokal trakti sohasi funktsiyasini spetsifikatsiyasi uchun model". Amerika akustik jamiyati jurnali. 40 (5): 1271. Bibcode:1966ASAJ ... 40.1271C. doi:10.1121/1.2143456.
  • Dennis, Jek B. (1963). Analog vokal traktining kompyuter nazorati. Amerika akustik jamiyati jurnali, 35, 1115 (A).
  • Dadli, Gomer; Tarnoczy, Tomas H. (1950). "Volfgang fon Kempelenning so'zlash apparati". Amerika akustik jamiyati jurnali. 22 (2): 151–66. Bibcode:1950ASAJ ... 22..151D. doi:10.1121/1.1906583.CS1 maint: ref = harv (havola)
  • Dann, Xyu K. (1950). "Tovush rezonanslarini hisoblash va elektr vokal trakti". Amerika akustik jamiyati jurnali. 22 (6): 740–53. Bibcode:1950ASAJ ... 22..740D. doi:10.1121/1.1906681.
  • Engval, O. (2003). Uch o'lchovli til modelida MRI, EMA va EPG o'lchovlarini birlashtirish. Nutq aloqasi, 41, 303-329.
  • Fant, C. Gunnar M. (1960). Nutqni ishlab chiqarishning akustik nazariyasi. Gaaga, Mouton.
  • Gariel, M. (1879). "Mashinaning parlanti de M. Faber". J. Physique Théorique et Appliquée. 8: 274–5. doi:10.1051 / jphystap: 018790080027401.
  • Jerar, JM .; Wilhelms-Tricarico, R .; Perrier, P .; Payan, Y. (2003). "Nutq motorini boshqarishni o'rganish uchun 3D dinamik biomexanik til modeli". Biyomekanikaning so'nggi tadqiqotlari. 1: 49–64.
  • Xenke, V. L. (1966). Kompyuter simulyatsiyasi yordamida nutqni ishlab chiqarishning dinamik artikulyatsion modeli. Nashr qilinmagan doktorlik dissertatsiyasi, MIT, Kembrij, MA.
  • Honda, Takashi, Seiichi Inoue va Yasuo Ogawa. (1968). Inson vokal trakti simulyatorining gibrid boshqaruv tizimi. Akustika bo'yicha VI Xalqaro Kongressning ma'ruzalari, tahrir. Y. Kohasi tomonidan, 175-8-betlar. Tokio, Xalqaro Ilmiy Uyushmalar Kengashi.
  • Kelli, Jon L. va Kerol Lochbaum. (1962). Nutq sintezi. Nutq aloqalari seminarining materiallari, qog'oz F7. Stokgolm, Nutqni uzatish laboratoriyasi, Qirollik texnologiya instituti.
  • Kempelen, Volfgang R. Von. (1791). Mechanismus der menschlichen Sprache nebst der Beschreibung seiner sprechenden Maschine. Wien, J. B. Degen.
  • Maeda, S. (1988). Yaxshilangan artikulyatsion model. Amerika akustik jamiyati jurnali, 84, Sup. 1, S146.
  • Maeda, S. (1990). Nutq paytida kompensatsion artikulyatsiya: artikulyatsion model yordamida vokal-trakt shakllarini tahlil qilish va sintez qilish bo'yicha dalillar. W. J. Hardcastle va A. Marchal (Eds.), Nutqni ishlab chiqarish va nutqni modellashtirish, Kluwer Academic, Dordrecht, 131-149.
  • Matsui, Eiichi. (1968). Kompyuter tomonidan simulyatsiya qilingan ovoz organlari. Akustika bo'yicha VI Xalqaro Kongressning ma'ruzalari, tahrir. Y. Kohasi tomonidan yozilgan, 151-4 betlar. Tokio, Xalqaro Ilmiy Uyushmalar Kengashi.
  • Mermelshteyn, Pol. (1969). Nutqni ishlab chiqarishda artikulyatsion faollikni kompyuter simulyatsiyasi. Sun'iy intellekt bo'yicha xalqaro qo'shma konferentsiya materiallari, Vashington, DC, 1969, ed. D. E. Walker va L. M. Norton tomonidan. Nyu-York, Gordon va buzilish.
  • Mermelshteyn, P. (1973). "Nutqni ishlab chiqarishni o'rganish uchun artikulyatsion model". Amerika akustik jamiyati jurnali. 53 (4): 1070–1082. Bibcode:1973ASAJ ... 53.1070M. doi:10.1121/1.1913427. PMID  4697807.
  • Nakata, Kazuo; Mitsuoka, T. (1965). "Fonematik transformatsiya va bog'langan nutq sintezini boshqarish aspektlari". J. Radio Res. Laboratoriyalar. 12: 171–86.
  • Rahim, M .; Goodyear, C .; Kleyn, V.; Shroeter, J .; Sondhi, M. (1993). "Artikulyatsion nutq sintezida asab tarmoqlaridan foydalanish to'g'risida". Amerika akustik jamiyati jurnali. 93 (2): 1109–1121. Bibcode:1993ASAJ ... 93.1109R. doi:10.1121/1.405559.
  • Rozen, Jorj (1958). "Dinamik analog nutq sintezatori". Amerika akustik jamiyati jurnali. 30 (3): 201–9. Bibcode:1958ASAJ ... 30..201R. doi:10.1121/1.1909541. hdl:1721.1/118106.
  • Rubin, P. E.; Baer, ​​T .; Mermelshteyn, P. (1981). "Pertseptual tadqiqotlar uchun artikulyatsion sintezator". Amerika akustik jamiyati jurnali. 70 (2): 321–328. Bibcode:1981ASAJ ... 70..321R. doi:10.1121/1.386780.
  • Rubin, P., Saltzman, E., Goldshteyn, L., Makgovan, R., Tide, M. va Brauzman, C. (1996). Vazifa dinamik modeliga CASY va kengaytmalar. Nutqni ishlab chiqarishni modellashtirish bo'yicha 1-ESCA o'quv qo'llanmasi va tadqiqot seminarining materiallari - 4-nutqni ishlab chiqarish bo'yicha seminar, 125-128.
  • Stivens, Kennet N .; Kasovskiy, S .; Fant, C. Gunnar M. (1953). "Vokal traktining elektr analogi". Amerika akustik jamiyati jurnali. 25 (4): 734–42. Bibcode:1953ASAJ ... 25..734S. doi:10.1121/1.1907169.

Tashqi havolalar