پردازش صوت (Sound processing):
پردازش سیگنالهای صوتی روشی است که در آن الگوریتمها و روش های پیچیده بر روی سیگنال های صوتی اعمال میشود. سیگنالهای صوتی، بازنمایی پدیده صدا هستند که به شکل سیگنالهای دیجیتال و آنالوگ تولید میشوند. در پردازش صوت به انجام عمليات مختلف بر روي قطعات صوتي پرداخته ميشود. براي مثال بهبود کيفيت صوت يا افزايش حجم صوت و تقويت آن و صدهاي کاربرد ديگر. لذا دستگاه شنوايي انسان مقصد مشترک خروجي اين نوع پردازش ها است. سیگنال های صوتی نمونه های الکترونیکی امواج صوتی به صورت امواج طولی ای که در هوا حرکت میکنند می باشند و دارای تراکم و سرعت و دامنه هستند. انرژی درون سیگنال های صوتی، عموما با واحد دسیبل dB اندازه گیری می شود. امروزه بدلیل وجود مشکلات زیاد در ارسال امواج کانال های رادیویی به گیرنده ها، پردازش سیگنال های صوتی امری ضروری است. پردازش صوت شامل تشخیص صوت، تبدیل صوتبه متن، تولید صوت خودکار، تحلیل احساسات و بسیاری از کاربردهای دیگر مرتبط با صوت است. با پردازش صوت، به صورت خودکار صوت تشخیص داده می شود، و می توان صوت را به متن تبدیل کرد، به صورت خودکار صوت تولید شود و یا اطلاعات مرتبط با صوت استخراج شود. برای پردازش صوت، الگوریتمهای پردازش سیگنال، پردازش زبان طبیعی و شبکههای عصبی عمیق استفاده میشود. در حالت کلی هدف از پردازش صوت، افزایش کیفیت صدا و تجزیه و تحلیل صوت در سیستمهای کامپیوتری است.
کاربردهای پردازش صوت:
برخي از کاربردهای پردازش صوت و گفتار در زمينه هاي زير هستند:
- شبکه هاي تلفني و ارتباطهاي صوتي از دور
- تشخيص و توليد الگوهاي صوتي انساني
- ذخيره و نگهداري و تکثير موسيقي با کيفيت بالا
- پخش و نوشتن يک فايل صوتي
- ترکيب سيگنال هاي صوتي
- ايجاد افکت هاي صوتي
هدف از این دوره آموزشی:
هدف این دوره آموزش، پردازش داده های صوتی و مدل سازی آنها با روش های یادگیری عمیق است که از یک سیگنال صوتی به عنوان ورودی استفاده می کند و دنباله ای از پردازش ها روی آن انجام می شود. برای ساخت و آموزش یک مدل یادگیری صوت از ابتدا، کل چارچوب را پیاده سازی کرده ایم و در نهایت مدل را ارزیابی شده است. از مجموعه داده های مختلفی برای طبقه بندی صوت و تشخیص احساسات در صوت استفاده شده است. این داده شامل تعداد زیادی سیگنال صوتی است که هر یک با چند لیبل مختلف توصیف شده اند که اطلاعات روشنی از صوت را ارائه می دهند. هدف از این دوره یادگیری و پردازش صوت با یادگیری ماشین و هوش مصنوعی در پایتون می باشد. در این دوره با فیلم آموزشی کامل روند پردازش صوت و چالش ها و روش های قبلی توضیح داده می شود و مجموعه های داده ای معرفی می شوند و عملیات آموزش و تست شبکه با سیگنال صوتی انجام می گیرد. خروجی های حاصل از مدل یادگیری روی هر یک از شبکه ها نشان داده می شود. کدها قابلیت آموزش روی داده های دلخواه خودتان را دارد و می توانید عملیات حاشیه نویسی صدا رابرای دیتاست خودتون با آن انجام دهید. ابتدا مرور کاملی روی پایتون و یادگیری ماشین و یادگیری عمیق انجام می شود. سپس تئوری پردازش صوت و چالش ها بحث و بررسی می شوند. در نهایت، پیاده سازی یک سیستم کامل طبقه بندی صوت و تشخیص احساسات در صوت با یادگیری عمیق انجام می شود. بدون شک یکی از بهترین دوره ها برای یادگیری و پردازش داده ای صوتی است که با زبان فارسی و روان توضیح داده شده است. امیدواریم که این آموزش از “بیگ لرن” هم مثل سایر آموزش ها مورد تایید و رضایت شما مخاطبان گرامی قرار گیرد.
بخش اول: مرور کامل روی پایتون
آموزش برنامه نویسی پایتون ویدئو
بخش دوم: مرور یادگیری ماشین و یادگیری عمیق
آموزش مروری یادگیری ماشین و یادگیری عمیق ویدئو
بخش سوم: شناخت داده صوتی و پردازش ها
تفاوت sound و voice
صوت چیست؟
طول موج Wave length
دامنه یا Amplitude
فرکانس یا Frequency
طیف یا Spectrum
نحوه استخراج طیف یا Spectrum
سمپل ریت sampling rate
امواج الکترومغناطیس
پردازش صوت چیست؟
سطوح کلی در پردازش صوت؟
نمونه برداری از سیگنال آنالوگ
پردازش گفتار با هوش مصنوعی؟
کاربردهای تشخیص گفتار
شبکه های عمیق برای تشخیص صوت
کتابخانه های پردازش صدا/صوت
مراحل کلی در تشخیص گفتار
روش های استخراج ویژگی از سیگنال صوتی
بخش چهارم: پردازش های سطح پایین و سطح بالا در پردازش صدا با پایتون
خواندن داده صوتی
تبدیل سیگنال صوتی به عدد (رقمی سازی)
تغییر sampling rate صدا
نمایش طیف فرکانسی سیگنال صوتی
نمایش طول موج و دامنه صوتی
استخراج ویژگی های طیفی از صدا
تغییر فرمت فایل صوتی
ترکیب یا Concatenate فایل های صوتی
محاسبه cross_similarity بین صوت ها
تبدیل صوت به متن (َAudio to Text)
تولید صوت مصنوعی با شبکه عمیق Audio generator
بخش پنجم: طبقه بندی صدا (تشخیص جنسیت صدا) با پایتون
خواندن داده صوتی و کتابخانه های لازم
تبدیل سیگنال صوتی به عدد (رقمی سازی)
استخراج ویژگی طیف فرکانسی از سیگنال صوتی
استخراج ویژگی های طیفی از صدا
تقسیم داده ها به train-test
آموزش شبکه عمیق با keras
ارزیابی کامل مدل طبقه بندی صوت
طبقه بندی نمونه صداها (تشخیص جنسیت) با مدل یادگیری عمیق
بخش ششم: تشخیص احساسات در صدا با یادگیری عمیق در پایتون
خواندن داده صوتی و کتابخانه های لازم
تبدیل سیگنال صوتی به عدد (رقمی سازی)
استخراج ویژگی طیف فرکانسی از سیگنال صوتی
استخراج ویژگی های طیفی از صدا
تقسیم داده ها به train-test
آموزش شبکه عمیق با keras
ارزیابی کامل مدل طبقه بندی صوت
تشخیص احساسات در نمونه صداها با مدل عمیق
نظرات
2 دیدگاه برای آموزش پردازش صوت با پایتون
برای فرستادن دیدگاه، باید وارد شده باشید.
کیوان
خیلی ممنون از آقای دکتر برای تدریس این دوره. روان و قابل فهم بود
علیرضا
سلام
دوره خیلی خوب و روان تدریس شده بود. فقط کاش سطوح پیشرفته پردازش صوت نیز در اینده به دوره اضافه شود