تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و ویولت – برق

مشخصات فایل

مقطع:کارشناسی ارشد
رشته تحصیلی:مهندسی برق
نوع ارائه:پایان نامه
تعداد صفحات:123
قالب بندی:word قابل ویرایش

نحوه خرید

تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و ویولت – برق

شما میتوانید تنها با یک کلید به راحتی فایل مورد نظر را دریافت کنید. 🙂

برای دسترسی به این فایل ابتدا باید اشتراک خریداری کنید. برای خرید اشتراک بر روی لینک زیر کلیک کنید.

ارتقاء عضویت

چکیده

فهرست مطالب

چکیده……………………………………………………….1

مقدمه…………………………………………….2

فصل اول: مفاهیم اولیه…………………………………4
1-1 مقدمه……………………………………………..5
1-2 سامانه گویش انسان و مدل تولید گفتار………………………………………..5
1-3 آواهاي زبان فارسی…………………………………………8
1 -3-1 آواهاي واكدار و آواهاي بیواك………………………………….9
1 -3-2 همخوان و واکه……………………………………9
1 -3-3 واج و واجگونه……………………………..9
1 -3-4 هجا در زبان فارسی…………………………………………….9
1 -4 مشخصههاي نواي گفتاري……………………………………..10
1-4 -1 زیر و بمی……………………………………………..12

الف) آهنگ……………………………………………..12

ب) نواخت……………………………………………………..12

ج) تکیه………………………………………12

1-4 -2 کشش………………………..12
1-4 -3 شدت……………………………………….13

فصل دوم: تقطیع سیگنال صحبت……………………………………14
2 -1 مقدمه…………………………….15
2 -2 آشکارسازي قطعات واكدار، بیواك و سکوت……………………………………………….15
2-3 تعیین فرکانس فرمنت و گام…………………………………. 19
2-4 قطعهبندي رویدادها…………………………………………………………21
2-4 -1 قطعهبندي بر اساس تغییرات وابستگی طیفی…………………………………..21
2-4 -2 قطعهبندي بر اساس تغییرات آکوستیکی……………………………………………………….23
2-4 -3 قطعهبندي بر اساس تغییرات دامنه و فرکانس فرمنتها………………..32
2 -5 تعیین مرز اصوات انفجاري غیر واكدار…………………………………………..33

فصل سوم: تبدیل ویولت………………………………….35
3-1 مقدمه………………………………………..36
3 -2 مقایسه تبدیل ویولت با FT وSTFTص ………………………………………..37
3 -3 تنوع روشهاي پیادهسازي تحلیل ویولت…………………………………..39

الف) تبدیل ویولت پیوسته…………………………………….39

ب) تبدیل ویولت گسسته………………………………………..41
3 -4 پیادهسازي تبدیل ویولت گسسته توسط فیلتر کردن مرحلهاي (الگوریتم Mallat.)………ا…………..42
3 -5 تنوع توابع ویولت…………………………………………………45

فصل چهارم: شبکه عصبی………………………….50
4-1 مقدمه……………………………………….51
4-2 ساختار مغز انسان……………………………………………….51
4-3 شبکه عصبی چیست؟………………………………53
4-4 طبقهبندي الگوها……………………………………………..54
4-5 یادگیري و تعمیم……………………………………..56
4-6 مدلسازي نرون تنها و اجزاي آن…………………………………………………56
4-7 انواع شبکههاي عصبی مصنوعی از نظر برگشتپذیري…………………………………………….62
4-7-1 شبکههاي پیشخور………………………………………62
4-7-2 شبکههاي پسخور برگشتی………………………………………..62
4-8 معرفی شبکههاي ARTص…………………………………………63
56صFuzzy ART شبکه 9-4
4-9-1 دریافت اطلاعات ورودي……………………………………66
4-10 شبکه Fuzzy ARTMAPص67

فصل پنجم: پیادهسازي روش71
5-1 مقدمه……………………………………………72
5-2 تقطیع سیگنال………………………………………………………………..72
5-3 استخراج مشخصهها جهت اعمال به شبکه عصبی………………………73

الف) نرخ عبور از صفر (ZCR)ص74
ب) انرژي سیگنال………………………………………………74

ج) مشخصههاي استخراج شده از ضرایب ویولت………………..74

د) انرژي طیف فرکانسی سیگنال…………………………………….76
5-4 برچسب زدن قطعات همخوان با استفاده از شبکه عصبی Fuzzy ARTMAPص77
فصل ششم: نتیجهگیري و پیشنهادات79
6-1 نتیجهگیري…………………………………………………80
6-2 پیشنهادات……………………………………………….83
منابع و ماخذ…………………………………………………….84

فهرست منابع فارسی…………………….84

فهرست منابع لاتین…………………………………………85
78صABSTRACT

چکیده:
یکی از کاربردهاي نیازمند پردازش صحبت ، تشخیص2 یا بازشناسی3 صحبت است. سامانههاي تشـخیص صحبت، دربرگیرنده محدوده وسیعی از کاربردها در سامانههاي آموزشی، سامانههاي پردازش واژه، کنترل کامپیوترها بوسیله صحبت و به طور خاص، سامانههاي کنترلی براي افراد نابینا و معلول حرکتی هسـتند . در این میان، شناسایی واجهاي همخوان4 در یک سیگنال صحبت، به دلیل طبیعت ناپایـدار، نامتنـاوب و نامنظمشان، همواره امري پیچیده بوده است. هـدف مـا در این پـروژه، تعیین محـدوده قطعـات همخوان و سکوت و طبقهبندي آنهــا در سیگــنال صحبت با استفاده از روش ترکیبی تـبدیل ویولــت گسسـته (DWT)6 و شبکـه عصبیFuzzy ARTMAP7، میباشد. استفاده از تبدیل ویولت (موجک)، محاسـبات را کاراتر، آسانتر و امکان انجام کاربردهاي بیدرنگ را فراهم میآورد. تبدیل ویولـت به دلیل فراهم آوردن امکـان تحلیل زمـان- فرکانس و تحــلیل چنـدتفکیکی 9 بــراي پــردازش سـیگنا لهـاي ناپایـدار، نظیـر سیگنال صحبت، بسیار منـاسب است. همچنین در این پـروژه از شـبکه عــصبی Fuzzy ARTMAP بـه دلیل داشتن ساز و کار یادگیري سریع، پایدار و بازدهی بالا در کاربردهاي طبقهبندي (به دلیل استفاده از تئوري فازي) استفاده کردهایم.

مقدمه:
براي قطعهبندي سیگنال صحبت در مرتبه رویداد2، از روش قطعهبندي اتوماتیک ارائه شده در مرجع [1] استفاده شده است. در این روش، سه راهکار بر مبناي تغییرات آکوستیکی و طیفی سیگنال صحبت و نیز تغییرات بارز در دادههاي فرمنت3، بکار گرفته شدهاند. به این ترتیب، ابتدا سیگنال صحبت به سه دسته واكدار، بیواك و سکوت (V/U/S)4 طبقهبندي میشود. سپس با در نظر گرفتن همزمان تغییرات طیفی سیگنال در یک دوره کوتاه زمانی، تغییرات در دامنه و فرکانس فرمنتها و مشخصههاي آکوستیکی، مرز میان رویدادها آشکارسازي میشود. در ادامه، با استفاده از تبدیل ویولت و یکسري تحلیلهاي زمانی و فرکانسی، مشخصههاي مربوط به قطعات آشکارسازي شده سیگنال صحبت، استخراج میشود.
تبدیل فـوریه معمولی، اطلاعـات لحظهاي و گـذراي سیگنـال صحبت را از بین مـیبرد. همچنین تبدیل فوریه زمان کوتاه (STFT) ، گرچـه امکان تحلیل همزمان بهتري را در حـوزه زمـان – فرکـانس فـراهـم مـیآورد، اما به علت عدم قـابلیت تفکیکپذیري متغیر در حوزه زمان – فرکانس، اغلب براي تحـلیل سیگنالهـاي صحبت، مناسب نمیباشد. تبدیل ویولت به دلیل دارا بودن قـابلیت تفکیکپذیري متغیر، از پنجـرههاي کوتاه در زمان (گسترده در فرکانس)، جهت بررسی رفتار گذراي سیگنال و از پنجرههاي بزرگ در زمان (متمرکز در فرکانس)، براي بررسی رفتار دراز مدت سیگنال، استفاده میکند. به همین خاطر، تبدیل ویولت، ابزاري نیرومند جهت تحلیل سیگنالهاي غیر ایستـایی نظیر سیگنال صحبت محسوب میشود. در این پروژه، براي تعیین محدوده همخــوانها و سکوت و نیز استخـراج مشخـصههاي آنها از ترکیب تحلیلهاي زمانی و فرکانسی و نیز براي طبقهبندي آنها از شبکه عصبیFuzzy ARTMAPاستفاده شده است.
در فصل اول، به معرفی مفاهیم اولیهاي چون سامانه گویش انسان، مدل تولید گفتار، آواهاي زبان فارسی و مشخصههاي نواي گفتار پرداخته میشود. فصل دوم به موضوع تقطیع سیگنال صحبت پرداخته است. در این فصل، روش بکارگرفته شده جهت آشکارسازي رویدادها در یک سیگنال صحبت و تعیین مرز میان قطعات، شرح داده میشود. در فصــل سوم، اطلاعـاتی پیرامون تبدیل ویولت، مقایسۀ آن با FT1 وSTFT و روشهـاي پیادهسازي تحلیل ویولت آورده شده است. فصل چهارم به موضوع شبکه عصبی اختصاص داده شده است. در این فصل، مفـاهیم اولیه شبکههاي عصبی، انواع شبکههاي عصبی مصنوعـی از نظربرگشتپذیري، شبکه ART، شبکه عصبیFuzzy ART و شبکه عصبی Fuzzy ARTMAP مورد بحث قرار گرفته است. در فصل پنجم، تشریح روند انجام این پروژه و چگونگی بکارگیري امکانات و مفاهیم معرفی شده در فصلهاي پیشین براي رسیدن به اهداف مورد نظر، گنجانده شده است. فصل ششم نیز دربرگیرنده نتایج و پیشنهادات حاصل از انجام این پروژه است.

نتیجه گیري:
همانطور که گفته شد، شناسایی اجزاي جمله، مقوله ایست که امروزه به دلیل کاربردهاي فراوانش، بسیار مورد توجه قرار گرفته است. یکی از کاربردهاي مهم شناسایی اجزاي جمله، بازشناسی صحبت میباشد.
این مورد، کاربردهاي فراوانی دارد که از آن جمله میتوان به استفاده از کامپیوتر بدون بکارگیري صفحه کلید و کاربردهاي بسیار دیگري اشاره کرد. همانطور که میدانیم، این کـاربردها علاوه بر مزایاي فراوان براي افراد سالم، براي معلولین نیز کاریا یهاي بسیاري دارند.
در این پروژه، از 220 جمله فارسی با فرکانس نمونهبرداري 10 کیلوهرتز و دقت 25 بیت، استفاده شده است. همچنین براي کاهش تعداد دستههاي خروجی شبکه عصبی، همخوانها در قالب شش گروه که در جدول (6 -1) مشاهده میشود، تقسیمبندي شدهاند.
جدول 6-1 دستهبندي قطعات همخوان در خروجی شبکه عصبی.
C1 m, n, l, r, y C4 h, x
C2 s, sh, ch, f C5 p, t, k
C3 z, j, zh, v C6 b, d, g
خطاي ناشی از آشکارسازي مرز قطعات با استفاده از روش ذکر شده در فصل دوم، براساس تغییرات وابستگی طیفی، مشخصههاي آکــوستیکی، دامنه و فرکـانس فرمنت ها، به طور میانگین، کمتر از 5 میلیثانیه بدست آمد. در جدول (6 -2) دقت آشکارسازي مرز قطعات همخوان در تلرانسهاي گوناگون، آورده شده است.
جدول 6-2 دقت آشکارسازي مرز قطعات همخوان در تلرانسهاي گوناگون
تلرانس
5 میلیثانیه تلرانس
10 میلیثانیه تلرانس
20 میلیثانیه
قطعات همخوان 78.6% 84.4% 92%
پس از قطعهبندي سیگنال، با استفاده از یک روش ترکیبی، مشخصههاي مربوط به قطعات با بکــارگیري تحلیلهاي زمانی و فرکانسی (از جــمله تبدیل ویولــت) استخــراج و با اعمــال آنها به یک شبکه عصبی Fuzzy ARTMAP برچسبزنی شدهاند. جـدول (6-3)، حــاوي تعــداد دادههـاي مربـوط به هــر دسته از هـمخوانهاست که براي آموزش و آزمایش شبکه عصبی بکار برده شدهاند.
جدول 6-3 تعداد دادههاي مربوط به هر دسته از همخوانها براي آموزش و آزمایش شبکه عصبی.
تعداد دادههاي آموزش تعداد دادههاي آزمایش
C1 170 18
C2 148 16
C3 319 32
C4 104 9
C5 217 20
C6 239 24
مجموع 1197 119
در جدول (6 -4)، نتایج حاصل از طبقهبندي قطعات همخوان مشاهده میشود.
جدول 6-4 نتایج حاصل از طبقهبندي قطعات با استفاده از شبکه عصبی Fuzzy ARTMAP.
C1 C2 C3 C4 C5 C6
تست 89% (16/18) 81% (13/16) 88% (28/32) 89%
(8/)9 83% (16/20) 85% (20/24)
هرچند نتایج بدست آمده با استفاده از شبکه عصبی Fuzzy ARTMAP تفاوت چندانی با نتایج حاصل از این کـار با شبکه عصبی MLP ندارد [20]، امـــا شبکه عصبی Fuzzy ARTMAP بسیار سریعتر از MLP عمل میکند. این موضوع، به دلیل یک تفاوت عمده Fuzzy ARTMAP با MLP در فرآیند یادگیري ایـن دو شبکـه است. شبکـه عصبی Fuzzy ARTMAP یـک فــرآیند یادگـیري بـر مبنـاي تطابق (Match-based) را بکار میگیرد. در این روش، یادگیري بر اساس شباهت میان الگوي ورودي و وزن نرونهاي دسته است. این راهکار، بسیار ممتـازتر از روش یادگیري برمبناي خطاي (Error-based)میان خروجی شبکه و خروجی مطلوب است که در شبکههاي عصبی MLP مورد استفاده قرار میگیرد. دلایل زیادي براي این برتري وجود دارد که از آن جمله میتوان به سهولت استخراج اطلاعات، عدم فرامـوشی و یادگیري سریع در روش یادگیري بر مبناي تطابق در مقایسه با روش مورد استفاده در شبکههاي MLP، اشاره کرد.

نحوه خرید

دانلود رایگان فایل
شما میتوانید تنها با یک کلید به راحتی فایل مورد نظر را دریافت کنید. 🙂

برای دسترسی به این فایل ابتدا باید اشتراک خریداری کنید. برای خرید اشتراک بر روی لینک زیر کلیک کنید.

ارتقاء عضویت

در صورت بروز هر گونه مشکل در روند خرید اینترنتی، بخش پشتیبانی کاربران آماده پاسخگویی به مشکلات و سوالات شما می باشد

راهنمای سایت

برخلاف سایت های دیگر که فایل ها را به صورت تکی می فروشند روال سایت ما این است که شما با عضویت در سایت ما میتوانید از تمام فایل های موجود استفاده کنید.

تمام مطالب سایت فقط برای اعضای سایت رایگان است.

نحوه عضویت در سایت