نگاهی به فرآیند بینایی در مغز

یکی از سخت ترین کارهایی که در مغز انجام می شود فرآیند بینایی است و به همین دلیل 50 درصد از مغز به بینایی و پردازش های مربوط به آن اختصاص یافته است.
همانطور که در تصویر زیر مشخص است فرآیند بینایی در مغز به صورت سلسله مراتبی از ناحیه ی v1 شروع میشود و با گذر از نواحی v2 و v4 به ناحیه ی IT می رسد.

که در ناحیه ی IT با کار گذاشتن الکترودها و گرفتن خروجی های مختلف بر اساس دیدن اشیاء مختلف می توان به صورت تجربی تشخیص داد که فرد چه چیزی را می بینید. در واقع با بررسی خروجی های ناحیه IT میتوان چیزی که فرد در لحظه دیده است را تشخیص داد. به عنوان مثال می توان فردی را که در حال خواب دیدن است زیر آزمایش قرار داد و با گرفتن خروجی های این ناحیه خواب او را ضبط کرد و بعد از بیدار شدن خوابش را به صورت یک فیلم به او نشان داد.
چرا فرآیند بینایی در مغز به صورت سلسله مراتبی است؟
با کار گذاشتن الکترود در بخشهای مختلف مغز یک موجود می توان فهمید که بر اساس چیزی که میبیند در قسمت های مختلف مغزش یک سری اکتیویشن های مختلفی اتفاق می افتد. به عنوان مثال در قسمت v2 در 60 میلی ثانیه اکتیویشن نشان داده می شود و در قسمت IT حدودا بعد از 100 میلی ثانیه اکتیویشن نشان داده می شود. بنابراین می توان نتیجه گرفت که این اتفاق ها بر اساس یک سلسله مراتب خاص هست که نشان داده می شود:

چرا مغز نیاز به تبدیل تصاویر از محیط پیکسل دارد؟ یا به عبارتی دیگر چرا مغز نیاز به داشتن این سلسله مراتب دارد؟ چون دیتاها در دنیای واقعی بی نهایت است لذا ما با مفهومی تحت عنوان Invariant object recognition (بازشناسی اشیا مستقل از تغییرات آنها) سروکار خواهیم داشت. به عنوان مثال ممکنه ما اتومبیل های مختلفی را داشته باشیم ولی تمام انواع اتومبیل ها در رنگها و اندازه های مختلف را تحت عنوان اتومبیل می شناسیم.

فضاهای نورونی خوب و بد

اگر یک شی  به صورت زیر روی فضای نورونی n-بعدی ترسیم کنیم هرکدام از نورون ها مقداری خواهند داشت و در نتیجه یک نقطه در این فضای نورونی مشخص می‌شود:

اگر این شئ تغییراتی کند، به عنوان مثال اگر سر شخص کمی بچرخد در همان فضا موقعیت سر شخص بر اساس مقادیر مختلف هرکدام از محورهای نورونی مقداردهی می شود و اگر تمام تغییرات یک فرد را در این فضای n بعدی رسم کنیم می‌توانیم  یک حجم در این فضا را به این شئ خاص در تمام تغییراتش نسبت داد.
اکنون یک فضای نورونی خوب را به صورت زیر می‌توان ترسم کرد:

و فضای نورونی یک شخص را با یک ابرصفحه (در فضای دو بعدی با خط، در سه بعدی با صفحه و در فضای n بعدی با ابرصفحه) تفکیک کنیم و به آن بفهمانیم که اگر بالای ابرصفحه را دیدی شخص A و اگر پایین صفحه را دیدی شخص B را دیده ایی.
مسئله ایی که در اینجا مطرح میشود این است که اگر مشخصه ها را به صورت پیکسلی و درهم تنیده به صورت زیر داشته باشیم ما نمیتوانیم با استفاده از ابر صفحه فضاها را از هم تفکیک کنیم:


در اینجا مغز در قالب ساختار سلسله مراتبی قابلیت تفکیک این فضای پیکسلی را دارد یعنی به صورت زیر میتواند فضای A و B را ازهم جدا کند:

بعد از این تجزیه می توان با یک طبقه‌بند ساده A و B را تشخیص داد. بر این اساس اگر به انسان یک شی با تغییرات خاصی نشان بدهند این شی در فضایی خاصی از این فضای نورونی قرار میگیرد و اگر یک شی دیگر را نشان بدهند باز در قسمت دیگری از این فضای نورونی قرار خواهد گرفت.

فوتر سایت

اسلایدر سایدبار

درباره ما

درباره ما

ما گروهی از دانشجویان رشته کامپیوتر دانشگاه شهید رجایی هستیم که به راهنمایی و تدریس استاد علی‌رضا اخوان‌پور به دنیای یادگیری عمیق پا گذاشتیم و دوست داریم چیزهایی که در این مسیر یادمی‌گیریم رو به اشتراک بذاریم.

شبکه های اجتماعی

مطالب اخیر