Musiqa signallari uchun vaqt chastotasini tahlil qilish - Time–frequency analysis for music signals

Musiqa signallari uchun vaqt chastotasini tahlil qilish ning dasturlaridan biridir vaqt-chastota tahlili. Musiqiy tovush kengroq chastota diapazonini egallab, inson vokal tovushiga qaraganda murakkabroq bo'lishi mumkin. Musiqiy signallar vaqt o'zgaruvchan signallar; klassik Fourier konvertatsiyasi ularni tahlil qilish uchun etarli bo'lmasa-da, vaqt chastotasi tahlili bunday foydalanish uchun samarali vosita hisoblanadi. Vaqt-chastota tahlili klassik Furye uslubidan kengaytirilgan. Qisqa vaqt ichida Fourier konvertatsiyasi (STFT), Gabor o'zgarishi (GT) va Wigner tarqatish funktsiyasi (WDF) - bu pianino, fleyta yoki gitara chalingan notalar kabi musiqiy signallarni tahlil qilish uchun foydalidir.

Musiqiy signal haqida ma'lumot

Musiqa - bu ma'lum vaqt oralig'ida barqaror chastotalarga ega bo'lgan tovush turi. Musiqani bir necha usul bilan yaratish mumkin. Masalan, pianino ovozi zarba berish orqali hosil bo'ladi torlar va skripka tovushi tomonidan ishlab chiqarilgan ta'zim qilish. Barcha musiqiy tovushlar o'ziga xos xususiyatlarga ega asosiy chastota va overtones. Fundamental chastota - garmonik qatordagi eng past chastota. Davriy signalda asosiy chastota davr uzunligiga teskari bo'ladi. Overtonlar - bu asosiy chastotaning butun sonlari.

Jadval. 1 asosiy chastota va overton
ChastotaniBuyurtma
f = 440 HzN = 1Asosiy chastota1-garmonik
f = 880 HzN = 21-chi tonna2-garmonik
f = 1320 HzN = 32-chi tonna3-garmonik
f = 1760 HzN = 43-chi tonna4-garmonik

Yilda musiqa nazariyasi, balandlik tovushning qabul qilinadigan asosiy chastotasini aks ettiradi. Biroq, haqiqiy asosiy chastota, qabul qilingan asosiy chastotadan farq qilishi mumkin.

Qisqa vaqt ichida Fourier konvertatsiyasi

Shakl 1 "Chord.wav" audio faylining to'lqin shakli[qayerda? ]
Shakl 2 "Chord.wav" ning Gabor konvertatsiyasi
3-rasm "Chord.wav" spektrogrammasi

Doimiy STFT

Qisqa vaqt ichida Fourier konvertatsiyasi vaqt-chastotani tahlil qilishning asosiy turi hisoblanadi. Agar uzluksiz signal mavjud bo'lsa x(t), biz qisqa vaqt ichida Furyening konvertatsiyasini hisoblashimiz mumkin

qayerda w(t) a oyna funktsiyasi. Qachon w(t) to'rtburchaklar funktsiya bo'lib, transformatsiya Rec-STFT deb nomlanadi. Qachon w(t) Gauss funktsiyasidir, transformatsiya deyiladi Gabor o'zgarishi.

Diskret STFT

Biroq, odatda bizda mavjud bo'lgan musiqiy signal uzluksiz signal emas. Namuna olish chastotasida namuna olinadi. Shuning uchun biz Rec-qisqa vaqtli Fourier konvertatsiyasini hisoblash uchun formuladan foydalana olmaymiz. Biz asl shaklni o'zgartiramiz

Ruxsat bering , , va . Furye qisqa muddatli diskretining ayrim cheklovlari mavjud:

  • qayerda N butun son
  • , qayerda signaldagi eng yuqori chastotadir.

STFT misoli

1-rasmda 44100 Hz namuna olish chastotasi bo'lgan fortepiano musiqiy audio faylining to'lqin shakli ko'rsatilgan. Va 2-rasmda audiofaylning qisqa vaqt ichida o'tkazilgan Fourier konvertatsiyasi (biz bu erda Gabor konvertatsiyasidan foydalanamiz) natijasi ko'rsatilgan. Vaqt chastotasi chizig'idan, dan ko'rishimiz mumkin t = 0 dan 0,5 sekundgacha, uchta nota bilan akkord bor va akkord da o'zgargan t = 0,5, keyin esa yana o'zgargant = 1. Har bir akkorddagi har bir notaning asosiy chastotasi vaqt chastotasi chizig'ida ko'rsatilgan.

Spektrogram

3-rasmda ko'rsatilgan spektrogram Shakl 1da ko'rsatilgan audio faylning. Spectrogram - bu STFT kvadrati, vaqt bo'yicha o'zgaruvchan spektrli tasvir. Signalning spektrogrammasi s(t) kvadratini hisoblash orqali taxmin qilish mumkin kattalik signalning STFT s(t), quyida ko'rsatilganidek:

Spektrogramma juda foydali bo'lishiga qaramay, uning birgina kamchiliklari bor. U chastotalarni bir xil miqyosda aks ettiradi. Shu bilan birga, musiqiy tarozilar chastotalar uchun logaritmik o'lchovga asoslangan. Shuning uchun biz inson eshitish bilan bog'liq bo'lgan chastotani logaritmik miqyosda tavsiflashimiz kerak.

Wigner tarqatish funktsiyasi

The Wigner tarqatish funktsiyasi musiqa signallarini tahlil qilish uchun ham ishlatilishi mumkin. Wigner tarqatish funktsiyasining afzalligi chiqishning yuqori aniqligi; ammo, bu hisoblash jihatidan juda qimmat va o'zaro bog'liq muammoga ega, shuning uchun signallarni bir vaqtning o'zida bir nechta chastotasiz tahlil qilish maqsadga muvofiqdir.

Formula

Wigner tarqatish funktsiyasi bu:

qayerda x(t) signal va x*(t) signalning konjugati hisoblanadi.

Shuningdek qarang

Manbalar

  • Joan Serra, Emiliya Gomes, Perfecto Errera va Xaver Serra, "Qopqoq qo'shiqni identifikatsiyalash uchun qo'llaniladigan xromli ikkilik o'xshashlik va mahalliy tekislash" 2008 yil avgust
  • Uilyam J. Piremyeer, Gregori X. Ueykfild va Meri X.Simoni, "Musiqiy signallarning vaqt chastotasi tahlili", 1996 yil sentyabr.
  • Jeremy F. Alm va Jeyms S. Uoker, "Musiqiy asboblarning vaqt chastotasini tahlil qilish", 2002 y
  • Monika Dorfler, "Musiqiy signallarga vaqt-chastota tahlili nima qilishi mumkin", 2004 yil aprel
  • EnShuo Tsau, Namguk Cho va C.-C. Jey Kuo, "O'zgartirilgan musiqa signallari uchun asosiy chastotani baholash Xilbert-Xuang o'zgarishi "IEEE Xalqaro Multimedia va Expo Konferentsiyasi, 2009 yil.