تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و ویولت – برق

مشخصات فایل

مقطع:کارشناسی ارشد
رشته تحصیلی:مهندسی برق
نوع ارائه:پایان نامه
تعداد صفحات:123
قالب بندی:word قابل ویرایش

نحوه خرید

تعیین محدوده قطعات همخوان و سکوت به روش ترکیبی شبکه عصبی و ویولت – برق

شما میتوانید تنها با یک کلید به راحتی فایل مورد نظر را دریافت کنید. 🙂

برای دسترسی به این فایل ابتدا باید اشتراک خریداری کنید. برای خرید اشتراک بر روی لینک زیر کلیک کنید.

ارتقاء عضویت

چکیده

فهرست مطالب

چکیده……………………………………………………….۱

مقدمه…………………………………………….۲

فصل اول: مفاهیم اولیه…………………………………۴
۱-۱ مقدمه……………………………………………..۵
۱-۲ سامانه گویش انسان و مدل تولید گفتار………………………………………..۵
۱-۳ آواهای زبان فارسی…………………………………………۸
۱ -۳-۱ آواهای واکدار و آواهای بیواک………………………………….۹
۱ -۳-۲ همخوان و واکه……………………………………۹
۱ -۳-۳ واج و واجگونه……………………………..۹
۱ -۳-۴ هجا در زبان فارسی…………………………………………….۹
۱ -۴ مشخصههای نوای گفتاری……………………………………..۱۰
۱-۴ -۱ زیر و بمی……………………………………………..۱۲

الف) آهنگ……………………………………………..۱۲

ب) نواخت……………………………………………………..۱۲

ج) تکیه………………………………………۱۲

۱-۴ -۲ کشش………………………..۱۲
۱-۴ -۳ شدت……………………………………….۱۳

فصل دوم: تقطیع سیگنال صحبت……………………………………۱۴
۲ -۱ مقدمه…………………………….۱۵
۲ -۲ آشکارسازی قطعات واکدار، بیواک و سکوت……………………………………………….۱۵
۲-۳ تعیین فرکانس فرمنت و گام…………………………………. ۱۹
۲-۴ قطعهبندی رویدادها…………………………………………………………۲۱
۲-۴ -۱ قطعهبندی بر اساس تغییرات وابستگی طیفی…………………………………..۲۱
۲-۴ -۲ قطعهبندی بر اساس تغییرات آکوستیکی……………………………………………………….۲۳
۲-۴ -۳ قطعهبندی بر اساس تغییرات دامنه و فرکانس فرمنتها………………..۳۲
۲ -۵ تعیین مرز اصوات انفجاری غیر واکدار…………………………………………..۳۳

فصل سوم: تبدیل ویولت………………………………….۳۵
۳-۱ مقدمه………………………………………..۳۶
۳ -۲ مقایسه تبدیل ویولت با FT وSTFTص ………………………………………..۳۷
۳ -۳ تنوع روشهای پیادهسازی تحلیل ویولت…………………………………..۳۹

الف) تبدیل ویولت پیوسته…………………………………….۳۹

ب) تبدیل ویولت گسسته………………………………………..۴۱
۳ -۴ پیادهسازی تبدیل ویولت گسسته توسط فیلتر کردن مرحلهای (الگوریتم Mallat.)………ا…………..۴۲
۳ -۵ تنوع توابع ویولت…………………………………………………۴۵

فصل چهارم: شبکه عصبی………………………….۵۰
۴-۱ مقدمه……………………………………….۵۱
۴-۲ ساختار مغز انسان……………………………………………….۵۱
۴-۳ شبکه عصبی چیست؟………………………………۵۳
۴-۴ طبقهبندی الگوها……………………………………………..۵۴
۴-۵ یادگیری و تعمیم……………………………………..۵۶
۴-۶ مدلسازی نرون تنها و اجزای آن…………………………………………………۵۶
۴-۷ انواع شبکههای عصبی مصنوعی از نظر برگشتپذیری…………………………………………….۶۲
۴-۷-۱ شبکههای پیشخور………………………………………۶۲
۴-۷-۲ شبکههای پسخور برگشتی………………………………………..۶۲
۴-۸ معرفی شبکههای ARTص…………………………………………۶۳
۵۶صFuzzy ART شبکه ۹-۴
۴-۹-۱ دریافت اطلاعات ورودی……………………………………۶۶
۴-۱۰ شبکه Fuzzy ARTMAPص۶۷

فصل پنجم: پیادهسازی روش۷۱
۵-۱ مقدمه……………………………………………۷۲
۵-۲ تقطیع سیگنال………………………………………………………………..۷۲
۵-۳ استخراج مشخصهها جهت اعمال به شبکه عصبی………………………۷۳

الف) نرخ عبور از صفر (ZCR)ص۷۴
ب) انرژی سیگنال………………………………………………۷۴

ج) مشخصههای استخراج شده از ضرایب ویولت………………..۷۴

د) انرژی طیف فرکانسی سیگنال…………………………………….۷۶
۵-۴ برچسب زدن قطعات همخوان با استفاده از شبکه عصبی Fuzzy ARTMAPص۷۷
فصل ششم: نتیجهگیری و پیشنهادات۷۹
۶-۱ نتیجهگیری…………………………………………………۸۰
۶-۲ پیشنهادات……………………………………………….۸۳
منابع و ماخذ…………………………………………………….۸۴

فهرست منابع فارسی…………………….۸۴

فهرست منابع لاتین…………………………………………۸۵
۷۸صABSTRACT

چکیده:
یکی از کاربردهای نیازمند پردازش صحبت ، تشخیص۲ یا بازشناسی۳ صحبت است. سامانههای تشـخیص صحبت، دربرگیرنده محدوده وسیعی از کاربردها در سامانههای آموزشی، سامانههای پردازش واژه، کنترل کامپیوترها بوسیله صحبت و به طور خاص، سامانههای کنترلی برای افراد نابینا و معلول حرکتی هسـتند . در این میان، شناسایی واجهای همخوان۴ در یک سیگنال صحبت، به دلیل طبیعت ناپایـدار، نامتنـاوب و نامنظمشان، همواره امری پیچیده بوده است. هـدف مـا در این پـروژه، تعیین محـدوده قطعـات همخوان و سکوت و طبقهبندی آنهــا در سیگــنال صحبت با استفاده از روش ترکیبی تـبدیل ویولــت گسسـته (DWT)6 و شبکـه عصبیFuzzy ARTMAP7، میباشد. استفاده از تبدیل ویولت (موجک)، محاسـبات را کاراتر، آسانتر و امکان انجام کاربردهای بیدرنگ را فراهم میآورد. تبدیل ویولـت به دلیل فراهم آوردن امکـان تحلیل زمـان- فرکانس و تحــلیل چنـدتفکیکی ۹ بــرای پــردازش سـیگنا لهـای ناپایـدار، نظیـر سیگنال صحبت، بسیار منـاسب است. همچنین در این پـروژه از شـبکه عــصبی Fuzzy ARTMAP بـه دلیل داشتن ساز و کار یادگیری سریع، پایدار و بازدهی بالا در کاربردهای طبقهبندی (به دلیل استفاده از تئوری فازی) استفاده کردهایم.

مقدمه:
برای قطعهبندی سیگنال صحبت در مرتبه رویداد۲، از روش قطعهبندی اتوماتیک ارائه شده در مرجع [۱] استفاده شده است. در این روش، سه راهکار بر مبنای تغییرات آکوستیکی و طیفی سیگنال صحبت و نیز تغییرات بارز در دادههای فرمنت۳، بکار گرفته شدهاند. به این ترتیب، ابتدا سیگنال صحبت به سه دسته واکدار، بیواک و سکوت (V/U/S)4 طبقهبندی میشود. سپس با در نظر گرفتن همزمان تغییرات طیفی سیگنال در یک دوره کوتاه زمانی، تغییرات در دامنه و فرکانس فرمنتها و مشخصههای آکوستیکی، مرز میان رویدادها آشکارسازی میشود. در ادامه، با استفاده از تبدیل ویولت و یکسری تحلیلهای زمانی و فرکانسی، مشخصههای مربوط به قطعات آشکارسازی شده سیگنال صحبت، استخراج میشود.
تبدیل فـوریه معمولی، اطلاعـات لحظهای و گـذرای سیگنـال صحبت را از بین مـیبرد. همچنین تبدیل فوریه زمان کوتاه (STFT) ، گرچـه امکان تحلیل همزمان بهتری را در حـوزه زمـان – فرکـانس فـراهـم مـیآورد، اما به علت عدم قـابلیت تفکیکپذیری متغیر در حوزه زمان – فرکانس، اغلب برای تحـلیل سیگنالهـای صحبت، مناسب نمیباشد. تبدیل ویولت به دلیل دارا بودن قـابلیت تفکیکپذیری متغیر، از پنجـرههای کوتاه در زمان (گسترده در فرکانس)، جهت بررسی رفتار گذرای سیگنال و از پنجرههای بزرگ در زمان (متمرکز در فرکانس)، برای بررسی رفتار دراز مدت سیگنال، استفاده میکند. به همین خاطر، تبدیل ویولت، ابزاری نیرومند جهت تحلیل سیگنالهای غیر ایستـایی نظیر سیگنال صحبت محسوب میشود. در این پروژه، برای تعیین محدوده همخــوانها و سکوت و نیز استخـراج مشخـصههای آنها از ترکیب تحلیلهای زمانی و فرکانسی و نیز برای طبقهبندی آنها از شبکه عصبیFuzzy ARTMAPاستفاده شده است.
در فصل اول، به معرفی مفاهیم اولیهای چون سامانه گویش انسان، مدل تولید گفتار، آواهای زبان فارسی و مشخصههای نوای گفتار پرداخته میشود. فصل دوم به موضوع تقطیع سیگنال صحبت پرداخته است. در این فصل، روش بکارگرفته شده جهت آشکارسازی رویدادها در یک سیگنال صحبت و تعیین مرز میان قطعات، شرح داده میشود. در فصــل سوم، اطلاعـاتی پیرامون تبدیل ویولت، مقایسۀ آن با FT1 وSTFT و روشهـای پیادهسازی تحلیل ویولت آورده شده است. فصل چهارم به موضوع شبکه عصبی اختصاص داده شده است. در این فصل، مفـاهیم اولیه شبکههای عصبی، انواع شبکههای عصبی مصنوعـی از نظربرگشتپذیری، شبکه ART، شبکه عصبیFuzzy ART و شبکه عصبی Fuzzy ARTMAP مورد بحث قرار گرفته است. در فصل پنجم، تشریح روند انجام این پروژه و چگونگی بکارگیری امکانات و مفاهیم معرفی شده در فصلهای پیشین برای رسیدن به اهداف مورد نظر، گنجانده شده است. فصل ششم نیز دربرگیرنده نتایج و پیشنهادات حاصل از انجام این پروژه است.

نتیجه گیری:
همانطور که گفته شد، شناسایی اجزای جمله، مقوله ایست که امروزه به دلیل کاربردهای فراوانش، بسیار مورد توجه قرار گرفته است. یکی از کاربردهای مهم شناسایی اجزای جمله، بازشناسی صحبت میباشد.
این مورد، کاربردهای فراوانی دارد که از آن جمله میتوان به استفاده از کامپیوتر بدون بکارگیری صفحه کلید و کاربردهای بسیار دیگری اشاره کرد. همانطور که میدانیم، این کـاربردها علاوه بر مزایای فراوان برای افراد سالم، برای معلولین نیز کاریا یهای بسیاری دارند.
در این پروژه، از ۲۲۰ جمله فارسی با فرکانس نمونهبرداری ۱۰ کیلوهرتز و دقت ۲۵ بیت، استفاده شده است. همچنین برای کاهش تعداد دستههای خروجی شبکه عصبی، همخوانها در قالب شش گروه که در جدول (۶ -۱) مشاهده میشود، تقسیمبندی شدهاند.
جدول ۶-۱ دستهبندی قطعات همخوان در خروجی شبکه عصبی.
C1 m, n, l, r, y C4 h, x
C2 s, sh, ch, f C5 p, t, k
C3 z, j, zh, v C6 b, d, g
خطای ناشی از آشکارسازی مرز قطعات با استفاده از روش ذکر شده در فصل دوم، براساس تغییرات وابستگی طیفی، مشخصههای آکــوستیکی، دامنه و فرکـانس فرمنت ها، به طور میانگین، کمتر از ۵ میلیثانیه بدست آمد. در جدول (۶ -۲) دقت آشکارسازی مرز قطعات همخوان در تلرانسهای گوناگون، آورده شده است.
جدول ۶-۲ دقت آشکارسازی مرز قطعات همخوان در تلرانسهای گوناگون
تلرانس
۵ میلیثانیه تلرانس
۱۰ میلیثانیه تلرانس
۲۰ میلیثانیه
قطعات همخوان ۷۸٫۶% ۸۴٫۴% ۹۲%
پس از قطعهبندی سیگنال، با استفاده از یک روش ترکیبی، مشخصههای مربوط به قطعات با بکــارگیری تحلیلهای زمانی و فرکانسی (از جــمله تبدیل ویولــت) استخــراج و با اعمــال آنها به یک شبکه عصبی Fuzzy ARTMAP برچسبزنی شدهاند. جـدول (۶-۳)، حــاوی تعــداد دادههـای مربـوط به هــر دسته از هـمخوانهاست که برای آموزش و آزمایش شبکه عصبی بکار برده شدهاند.
جدول ۶-۳ تعداد دادههای مربوط به هر دسته از همخوانها برای آموزش و آزمایش شبکه عصبی.
تعداد دادههای آموزش تعداد دادههای آزمایش
C1 170 18
C2 148 16
C3 319 32
C4 104 9
C5 217 20
C6 239 24
مجموع ۱۱۹۷ ۱۱۹
در جدول (۶ -۴)، نتایج حاصل از طبقهبندی قطعات همخوان مشاهده میشود.
جدول ۶-۴ نتایج حاصل از طبقهبندی قطعات با استفاده از شبکه عصبی Fuzzy ARTMAP.
C1 C2 C3 C4 C5 C6
تست ۸۹% (۱۶/۱۸) ۸۱% (۱۳/۱۶) ۸۸% (۲۸/۳۲) ۸۹%
(۸/)۹ ۸۳% (۱۶/۲۰) ۸۵% (۲۰/۲۴)
هرچند نتایج بدست آمده با استفاده از شبکه عصبی Fuzzy ARTMAP تفاوت چندانی با نتایج حاصل از این کـار با شبکه عصبی MLP ندارد [۲۰]، امـــا شبکه عصبی Fuzzy ARTMAP بسیار سریعتر از MLP عمل میکند. این موضوع، به دلیل یک تفاوت عمده Fuzzy ARTMAP با MLP در فرآیند یادگیری ایـن دو شبکـه است. شبکـه عصبی Fuzzy ARTMAP یـک فــرآیند یادگـیری بـر مبنـای تطابق (Match-based) را بکار میگیرد. در این روش، یادگیری بر اساس شباهت میان الگوی ورودی و وزن نرونهای دسته است. این راهکار، بسیار ممتـازتر از روش یادگیری برمبنای خطای (Error-based)میان خروجی شبکه و خروجی مطلوب است که در شبکههای عصبی MLP مورد استفاده قرار میگیرد. دلایل زیادی برای این برتری وجود دارد که از آن جمله میتوان به سهولت استخراج اطلاعات، عدم فرامـوشی و یادگیری سریع در روش یادگیری بر مبنای تطابق در مقایسه با روش مورد استفاده در شبکههای MLP، اشاره کرد.

نحوه خرید

دانلود رایگان فایل
شما میتوانید تنها با یک کلید به راحتی فایل مورد نظر را دریافت کنید. 🙂

برای دسترسی به این فایل ابتدا باید اشتراک خریداری کنید. برای خرید اشتراک بر روی لینک زیر کلیک کنید.

ارتقاء عضویت

در صورت بروز هر گونه مشکل در روند خرید اینترنتی، بخش پشتیبانی کاربران آماده پاسخگویی به مشکلات و سوالات شما می باشد

راهنمای سایت

برخلاف سایت های دیگر که فایل ها را به صورت تکی می فروشند روال سایت ما این است که شما با عضویت در سایت ما میتوانید از تمام فایل های موجود استفاده کنید.

تمام مطالب سایت فقط برای اعضای سایت رایگان است.

نحوه عضویت در سایت

آخرین مطالب

مطالب مرتبط