قیمت 40,000 تومان 25,000 تومان

امتیاز 0 از 0 رأی
بدون امتیاز 0 رای
40,000 تومان 25,000 تومان
ویژگی های دوره
place
نوع دوره: غیر حضوری
local_library
سطح دوره: فوق حرفه ای
traffic
پیش نیاز: پایتون
language
زبان: فارسی
access_time
ویدئویی(کیفیت HD)
playlist_add_check
ناشر : بیگ لرن
storage
232 مگابایت
supervisor_account
روش پشتیبانی: ارسال تیکت

حاشیه نویسی تصاویر ؟

در دنیای حاضر با گسترش سریع داده ها، اطلاعات زیادی در بستر وب در حال جریان است. یکی از مهمترین داده های که روزانه در اینترنت در حال استفاده است، تصاویر می باشند. وقتی ما یک تصویر را داخل گوگل جستجو می کنیم، موتور جستجوی گوگل براساس متنی که ما وارد می کنیم، یکسری تصاویر مرتبط را برای ما پیدا می کند که در اکثر موارد تصاویر بازیابی شده توسط گوگل با هدف ما سازگار است. پس می توان گفت که گوگل هم از یک الگوریتم بازیابی تصویر استفاده می کند تا تصاویری را که دارای عناصر مدنظر کاربر هستند به او نمایش دهد. اما اینکه گوگل چطوری تشخصیص می دهد که در تصاویر مورد نظر چه اشیایی وجود دارد؟ براساس حاشیه نویسی‌هایی است که روی تصاویر مورد نظر انجام شده است. حاشیه نویسی تصاویر به فرایند تولید کلماتی که محتوای تصویر را توصیف کنند اطلاق می شود، هدف حاشیه‌نویسی تصاویر تولید کلماتی است که توصیف گرهای مناسبی برای تصاویر هستند[4]. در واقع حاشیه نویسی مجموعه‌ای از کلمه یا کلماتی که بیانگر معنا و مفهوم واقعی تصویر است با تصاویر همراه می شود منظور از معنا و مفهوم واقعی مفاهیمی نزدیک به برداشت انسانها ازتصویر است. در واقع، حاشیه‌نویسی خودکار تصاویر به ایجاد خودکار برچسب‌های متنی مطابق با محتوای بصری تصاویر دلالت دارد. حاشیه نویسی تصویر انتساب کلمات به یک تصویر تا مشخص شود که در یک تصویر چه عناصری وجود دارد. که یکی از مهم ترین روش های بازیابی تصویر است.[2] اولین گام در حاشیه نویسی تصویر استخراج ویژگی های موثر از تصویر است. ویژگی های بصری و معنایی ابزارهای اصلی در حاشیه نویسی تصویر هستند که حاشیه بندی تصویر می تواند بر اساس ویژگی های سطح پایین تصویر صورت گیرد، ویژگی های رنگ، بافت، … می توانند به عنوان ویژگی هایی برای حاشیه نویسی استفاده کرد که انتخاب ویژگی های مناسب از تصویر و مدل حاشیه نویسی تاثیر زیادی در کارائی سیستم خواهند داشت. با توجه به رشد تصاوير ديجيتال در دنياي امروز، نياز به روش هایي كارا براي بازیابی تصاوير احساس مي شود. به دليل اهميت بالاي اين روش در فهم تصاوير ديجيتال، امروزه روش هاي مختلفي براي حاشيه نويسي تصاوير پيشنهاد داده شده اند.

A dog on grass and some pink flowers
A dog on grass and some pink flowers

کاربردهای توصیف تصاویر ؟

در واقع، حاشيه نويسي تصاوير به بازيابي و دسته بندي تصاوير گفته مي شود كه هر دسته بيانگر كلمه يا عبارتي در مورد تصوير است .لذا می‌توان گفت با گسترش استفاده از تصاویر دیجیتال، عملیات پردازش این تصاویر نیز گسترش یافته است، و با ظهور مفاهیمی همچون بینایی ماشین و هوش مصنوعی، گستردگی پژوهشی و کاربردي بیشتري پیدا کرده است[7]. با مطرح شدن موضوع بینایی ماشین، علاقه به تجزیه و تحلیل اطلاعات تصاویر دیجیتال بالا رفت و نیاز به ماشینی که قابلیت تجزیه و تحلیل و اخذ تصمیم درست براساس مشاهدات را داشته باشد باعث شده که پژوهش ها و تحقیقات زیادي در این زمینه صورت گیرد، و با کمک روش هاي پردازش تصویر، بینایی ماشین و هوش مصنوعی، سعی در ارائه ي روش هاي مختلف براي حل دسته ي وسیعی از این گونه مسائل شده است. در کل می توان گفت که بازیابی تصویر شامل پنج روش اصلی است.

  • بازیابی دستی و سنتی تصویر: بازیابی توسط انسان به صورت دستی صورت می‌گیرد.
  • بازیابی متنی تصویر: براساس ویژگی های سطح پایین تصویر بازیابی صورت می‌گیرد.
  • حاشیه نویسی تصاویر وب : براساس محتوای وب سایت تصویر بازیابی صورت می‌گیرد.
  • حاشیه نویسی خودکار تصاویر و بازیابی متن‌ها: براساس ویژگی های بصری و معنایی و با الگوریتم های یادگیری ماشین بازیابی صورت می‌گیرد.

هدف روشهاي بازیابی تصاویر براساس مفهوم تولید سیستم بازیابی تصویري است که قادر به پاسخ گویی درخواستهاي متنی باشد[12]. این روشها بازیابی تصاویر را براساس معنا و مفهوم واقعی انجام میدهند. براي بازیابی تصاویر با درخواستهاي متنی باید مجموعه‌اي از کلمات توصیفگر مفهوم تصویر با هر تصویر همراه شود، یعنی باید تصاویر را حاشیه‌نویسی کنیم. تنها در صورتی که مجموعه‌هاي تصاویر حاشیه دار باشند، امکان بازیابی براساس مفهوم و درخواستهاي متنی فراهم میشود. هنگام بازیابی، درخواست متنی با متن حاشیه‌هاي هر تصویر مقایسه شده و تصاویر منطبق با درخواست به عنوان پاسخ انتخاب میشوند. باید توجه داشت که در تولید سیستم حاشیه‌نویسی خودکار، دانش هر سیستم کاملا وابسته به مجموعه‌ي آموزش آن سیستم و دامنه‌ي مفاهیم مورد یادگیري به کمک مجموعه‌ي آموزش است. همانطور که در شکل ‏4‑2 مشخص است، داده معمولاً با پیش پردازش به ویژگی ها تبدیل می‌شود. سپس، از تکنیک هاي یادگیري ماشین استفاده می کنیم تا نوعی مدل از داده هاي جمع آوري شده درست کنیم. براي رسیدن به هدفمان، الگوریتم “یادگیري” ماشین ویژگی هاي جمع آوري شده ما را تحلیل کرده و وزن‌ها، حدود آستانه و دیگر پارامتر ها را تنظیم می‌کند، به طوري که بیشترین کارایی را بر اساس اهداف به دست آورد. مقصود ما از گزاره یادگیري، همین فرآیند تنظیم پارامتر براي رسیدن به هدف همیشه مهم است که ارزیابی کنیم روش هاي یادگیري ماشین چقدر خوب کار می کنند.

در روش خودکار سعی بر این است تا فرآیند حاشیه‌نویسی تصاویر به طور کامل توسط ماشین انجام شود.  در سالهای اخیر حاشیه نويسی اتوماتیک تصاوير با هدف ايجاد پل بر روی اين شکاف معنائی، جذابیت‌های بسیاری را پیدا نموده است. هدف اولیه حاشیه نويسی اتوماتیک ايجاد برچسب هائی برای تصاوير بدون برچسب می باشد و هدف نهائی آن ايجاد رابط مبتنی بر متن برای جستجوی تصاوير و کمک به کاربران می باشد که در صورت موفقیت، هر کاربر با روشهای مشابه جستجو در اسناد متنی، قادر به جستجوی تصاوير خواهد بود. بعضی سیستم‌هاي خودکار یا نیمه خودکار قدرت یادگیري از آن چه کاربران وارد می‌کنند را نیز دارند، تا در مورد تصاویر جدید حاشیه‌هاي دقیق تري تولید کنند. یکی از نمونه‌هاي استفاده از این روش‌ها بازي‌هاي هدف دار است. در سالهاي اخیر با تعریف استفاده از رویکرد مبتنی بر محتوا و مفهوم از حاشیه نویسی خودکار استفاده می شود[25]. در این رویکرد جدید ، تصاویر به صورت خودکار در مجموعه‌اي از مفاهیم از پیش تعریف شده اشیاء طبقه بندي می شوند . سیستم ، تصاویر را بدون دخالت انسان حاشیه‌نویسی مینماید. همچنین از روي تعداد زیادي تصاویر حاشیه نویسی شده مدل مفهومی آن را یاد میگیرد. از این مدل براي حاشیه‌نویسی جدید استفاده میکند و در بازیابی تنها یک پرس و جو براي تقاضاي مورد نیاز کاربر انجام میشود به دلیل آنکه پرسوجوها با مفاهیم سطح بالا ارتباط موثري دارند. این روش مشکلات دو روش حاشیه‌نویسی دستی و نیمه خودکار را حل مینماید. در برچسب گذاری تصاویر توجه به موارد زیر اهمیت دارد:

  • حاشیه نویسی تصویر یکی از مهمترین روش های بازیابی تصاویر است.
  • روش های مختلف حاشیه نویسی تصویر وجود دارد که مهمترین و پرکاربردترین آنها حاشیه نویسی خودکار است.
  • ویژگی های سطح پایین تصویر نمی توانند مفهوم کامل تصویر را مشخص کنند.
  • شکاف معنایی یکی از چالش های روش های مبتنی بر متن و مبتنی بر محتوا است.
  • حاشیه نویسی خودکار با ویژگی های بصری و معنایی می تواند کارایی بهتری را داشته باشد.
  • تشخیص نوع ویژگی استخراج شده اهمیت زیادی در دقت الگوریتم دارد و بهتر است از ترکیب ویژگی های محلی و سراسری استفاده کرد.
  • استفاده از روش های یادگیری ماشین عملکرد بهتری را نسبت به روش های آماری دارند.

حاشیه نویسی تصاویر با یادگیری عمیق ؟

یادگیری عمیق از طریق شبکه‌های عصبی مصنوعی که شباهت زیادی به کارکرد مغز دارند، انجام می‌گیرد و تحلیل اطلاعات در این روش شباهات زیادی به روش مغز انسان‌ها دارد. سیستم‌های یادگیری عمیق نیازی به دستورات و راهنمایی برنامه نویس‌های انسان ندارند. در اینجا می‌توانید با نمونه‌های بی‌نظیری از به‌کارگیری یادگیری عمیق آشنا شوید. برای درک محتوای تصویر و یک الگوی زبان از حوزه پردازش زبان طبیعی ، هر دو روش از دید رایانه ای لازم است تا درک تصویر به کلمات به ترتیب درست تبدیل شود. اخیراً ، روشهای یادگیری عمیق در نمونه هایی از این مشکل به نتایج پیشرفته ای رسیده است. روشهای یادگیری عمیق نتایج پیشرفته ترین مشکلات مربوط به تولید عنوان را نشان داده اند. آنچه که در مورد این روشها چشمگیر ترین است، این است که یک مدل می تواند به جای اینکه نیاز به تهیه داده های پیشرفته یا خط لوله ای از مدل های خاص طراحی شده باشد ، برای پیش بینی یک عنوان ، با توجه به عکس تعریف شود. در این آموزش ما ، چگونگی ایجاد یک مدل یادگیری عمیق  برای حاشیه نویسی تصاویر را از ابتدا خواهید دید. ما به یک موضوع جالب توجه در مورد چند مودال نگاهی می اندازیم که در آن می خواهیم هر دو تصویر و پردازش متن را برای ساختن یک برنامه مفید Deep Learning مفید ، با عنوان تصویربرداری ترکیب کنیم. حاشیه نویسی تصاویر به فرآیند تولید توضیحات متنی از یک تصویر – مبتنی بر اشیاء و اعمال موجود در تصویر اشاره دارد. درست قبل از توسعه اخیر شبکه های عصبی عمیق ، این مشکل حتی توسط پیشرفته ترین محققان Computer Vision قابل تصور نبود. اما با ظهور Deep Learning در صورت داشتن مجموعه داده های مورد نیاز ، می توان این مشکل را به راحتی حل کرد.

هدف از این دوره آموزشی ؟

هدف اصلی در اینجا قرار دادن CNN-RNN برای ایجاد یک مدل خودکار نوشتن تصویر است که از یک تصویر به عنوان ورودی استفاده می کند و دنباله ای از متن را که حاشیه نویسی تصویر است ، تولید می کند. یک مدل زیرنویس به دو مؤلفه اصلی ، CNN و RNN متکی است. زیرنویس همه چیز در مورد ادغام این دو است تا بتواند قدرتمندترین خصوصیات آنها یعنی ترکیب شود. CNN ها در حفظ اطلاعات و تصاویر فضایی ، و RNN با هر نوع داده متوالی مانند تولید دنباله ای از کلمات به خوبی کار می کند. بنابراین با ادغام این دو ، می توانید مدلی را تهیه کنید که بتواند الگوهای و تصاویر را پیدا کند ، و سپس از آن اطلاعات برای تولید توضیحی در مورد آن تصاویر کمک بگیرید. بنابراین اکنون CNN به عنوان یک استخراج کننده از ویژگی ها عمل می کند که اطلاعات موجود در تصویر اصلی را در یک نمایش کوچکتر فشرده می کند. از آنجا که محتوای تصویر را در یک بردار ویژگی کوچکتر کدگذاری می کند ، از این رو این CNN اغلب رمزگذار نامیده می شود. وقتی این بردار ویژگی را پردازش می کنیم و از آن به عنوان ورودی اولیه RNN زیر استفاده می کنیم ، آنرا رمزگشایی می نامیم زیرا RNN وکتور ویژگی فرآیند را رمزگشایی می کند و آن را به یک زبان طبیعی تبدیل می کند. ما قصد داریم RNN را برای پیش بینی کلمه بعدی یک جمله بر اساس کلمات قبلی آموزش دهیم. برای این ما زیرنویس های مرتبط با تصویر را به لیستی از کلمات نشانه گذاری تبدیل می کنیم. این رمزگذاری هر رشته را به لیستی از اعداد صحیح تبدیل می کند. معماری مدل ما در اینجا شبیه به Google Model است ، اما من جزئیات زیادی را ساده کردم تا اجرای و همچنین آموزش آسان تر شود. معماری کلی مدل در زیر نشان داده شده است:

وظیفه حاشیه نویسی تصویر را می توان به صورت منطقی به دو ماژول تقسیم کرد – یکی مدل مبتنی بر تصویر – که ویژگی ها و تفاوت های ظریف را از تصویر ما استخراج می کند ، و دیگری یک مدل مبتنی بر زبان – که ویژگی ها و اشیاء داده شده توسط تصویر ما را ترجمه می کند. برای مدل مبتنی بر تصویر (مثلاً رمزگذار) – ما معمولاً به یک مدل شبکه عصبی Convolutional اعتماد می کنیم. و برای مدل مبتنی بر زبان  ما به یک شبکه عصبی بازگشتی هستیم. معمولاً ، یک CNN از پیش آماده شده ویژگی هایی را از تصویر ورودی ما استخراج می کند. بردار ویژگی به صورت خطی تبدیل شده است تا از ابعاد مشابه ابعاد ورودی شبکه RNN / LSTM برخوردار باشد. این شبکه به عنوان یک الگوی زبان در بردار ویژگی های ما آموزش داده می شود. ما ابتدا ویژگی هایی را استخراج می کنیم و آنها را بصورت آفلاین به عنوان آرایه های شماره گیر داخل محلی خود ذخیره می کنیم. تا آنجا که من می بینم ، این باعث افزایش قابل ملاحظه بهره وری محاسباتی ما شده است ، زیرا ما اطمینان حاصل کردیم که فقط یک بار استخراج ویژگی ها را انجام می دهیم. ما برای ساختن و آموزش یک مدل نوشتن تصویر از ابتدا ، کل چارچوب را پیاده سازی کرده ایم و در نهایت مدل را ارزیابی کرده ایم.  ما از مجموعه داده Flilckr8K استفاده می کنیم. این شامل 8000 تصویر است که هر یک با پنج زیرنویس مختلف جفت شده اند که توضیحات روشنی از تصویر را ارائه می دهند. مجموعه داده شامل توضیحات مختلفی برای هر تصویر است. هدف از این پروژه عملی حاشیه نویسی تصاویر با یادگیری عمیق در پایتون می باشد. در این پروژه با فیلم آموزشی کامل روند توصیف تصویر انجام می شود و مجموعه های داده ای معرفی می شوند و عملیات آموزش و تست شبکه انجام می شود. خروجی های حاصل از حاشیه نویسی تصاویر روی هر یک از شبکه ها نشان داده می شود. بدون شک یکی از بهترین پروژه های عمیق برای حاشیه نویسی تصویر می باشد که با زبان ساده و روان فارسی توضیح داده شده است.

موارد موجود در این دوره آموزشی ؟

معرفی حاشیه نویسی تصاویر ویدئو

پیش نمایش
خصوصی

پردازش داده های تصاویر ویدئو

خصوصی

بارگیری مجموعه داده های آموزش ویدئو

خصوصی

پیش پردازش تمیز کردن داده ها ویدئو

خصوصی

درک کامل از داده ها با پایتون ویدئو

خصوصی

جمع آوری داده ها برای حاشیه نویسی تصاویر ویدئو

خصوصی

راهکارهای ارائه شده برای توصیف تصاویر ویدئو

خصوصی

چالش ­های موجود در توصیف / حاشیه نویسی تصاویر ویدئو

خصوصی

کاربردها و مزایای توصیف / حاشیه نویسی تصاویر ویدئو

خصوصی

پردازش داده های متنی ویدئو

خصوصی

آماده سازی داده با استفاده از توابع تولید ویدئو

خصوصی

جاسازی کلمات (Word Embeddings) ویدئو

خصوصی

معرفی معماری مدل عمیق برای توصیف تصاویر ویدئو

خصوصی

پیاده سازی مدل عمیق برای توصیف / حاشیه نویسی تصاویر ویدئو

خصوصی

کاربردها و مزایای توصیف تصاویر ویدئو

خصوصی

پیاده سازی شبکه عمیق ویدئو

خصوصی

آموزش ایجاد لایه های عمیق ویدئو

خصوصی

کاربردها و مزایای توصیف تصاویر ویدئو

خصوصی

آموزش ایجاد مدل باناظر عمیق ویدئو

خصوصی

کاربردها و مزایای توصیف تصاویر ویدئو

خصوصی

ایجاد دیکشنری کلمات ویدئو

خصوصی

آموزش تنظیم پارامترهای مدل باناظر عمیق ویدئو

خصوصی

نمایش خروجی های شبکه ویدئو

خصوصی

ارزیابی مدل روی تصاویر دلخواه تستی ویدئو

خصوصی

ارزیابی کامل روی داده های تست ویدئو

خصوصی

نمایش خروجی های شبکه ویدئو

خصوصی

اجرای پروژه ها روی GPU گوگل ویدئو

خصوصی

کاربردها و مزایای توصیف تصاویر ویدئو

خصوصی

توضیح خط به خط کدها ویدئو

خصوصی

کدهای پروژه فایل های ضمیمه

خصوصی

اجرای پروژه ها روی GPU گوگل ویدئو

خصوصی

درخواست مشاوره

برای کسب اطلاعات بیشتر درباره این دوره درخواست مشاوره خود را ارسال کنید و یا با ما در تماس باشید.

درخواست مشاوره

نیاز به مشاوره دارید؟

در صورتی که نیاز به مشاوره دارید می توانید فرم را تکمیل نمایید و یا با ما در تماس باشید

درخواست مشاوره رایگان

moreدوره های مرتبط

انتخاب ویژگی با یادگیری عمیق

انتخاب ویژگی با یادگیری عمیق این دوره در حال اماده سازی در صورتی که تمایل به اگاهی از آن دارید،…

رایگان!

توصیف تصاویر با یادگیری عمیق

توصیف تصاویر ؟ تصاویر همواره بخش مهمی از اخبار و مطالب در دنیای مجازی به شمار می آیند. استخراج اطلاعات…
40,000 تومان 30,000 تومان

بازسازی و رفع نویز تصاویر با یادگیری عمیق

حذف نویز از تصاویر ؟ کاهش نویز یک فرآیند حذف نویز از سینگال است‌.این سیگنال می‌تواند مربوط به یک تصویر،…
34,000 تومان 25,000 تومان

استخراج ویژگی از تصاویر با شبکه یادگیری عمیق

استخراج ویژگی ؟ هدف استخراج ویژگی این است که داده‌های خام به شکل قابل استفاده‌تری برای پردازش‌های آماری بعدی درآیند.…
36,000 تومان 25,000 تومان

chat_bubble_outlineنظرات

قوانین ثبت دیدگاه

  • دیدگاه های فینگلیش تایید نخواهند شد.
  • دیدگاه های نامرتبط به مطلب تایید نخواهد شد.
  • از درج دیدگاه های تکراری پرهیز نمایید.
  • امتیاز دادن به دوره فقط مخصوص دانشجویان دوره می باشد.

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *