با نگاه کردن به یک فرد تنها صدای او را بشنوید! – هدفون هوش مصنوعی

با پیشرفت فناوری‌های نوین، محققان موفق به توسعه یک سیستم هوش مصنوعی شده‌اند که به افرادی که از هدفون‌های هوشمند استفاده می‌کنند، اجازه می‌دهد تا با نگاه کردن به یک فرد سخنگو به مدت سه تا پنج ثانیه، صدای او را “ثبت” کنند. این سیستم که به نام شنوایی هدفمند گفتار یا هدفون هوش مصنوعی شناخته می‌شود، قادر است تمامی صداهای دیگر محیط را حذف کرده و تنها صدای سخنگوی ثبت‌ شده را به‌صورت زنده پخش کند. این ویژگی حتی زمانی که کاربر در محیط‌های پر سر و صدا حرکت کرده و دیگر به سمت سخنگو نگاه نمی‌کند نیز عمل می‌کند.

در ادامه اطلاعات دقیق‌تری درباره این تکنولوژی می‌خوانیم.

هدفون هوش مصنوعی

آیا هدفون هوش مصنوعی همان فناوری حذف کننده نویز است؟

ممکن است با مطالعه مقدمه این مطلب تصور کنید که هدفون هوشمند، همان هدفون‌های حذف کننده نویز محیط هستند که امروزه بسیار کاربرد دارند. اما در این قسمت بررسی می‌کنیم که این موضوع درست نیست. هدفون‌های حذف‌کننده نویز توانایی ایجاد یک فضای صوتی خالی را دارند، اما باز هم صداها از محیط می‌توانند تکنولوژی حذف نویز را تحت تاثیر قرار دهند که این یک چالش برای پژوهشگران است.

به‌عنوان مثال، آخرین نسخه از هدفون‌های AirPods Pro اپل به طور خودکار زمانی که کاربر در حال استفاده از هدفون است، سطح صداها را برای وی کنترل می‌کند. اما  باز هم کاربر قادر نیست کنترلی روی انتخاب شخصی که می‌خواهد به صدای او گوش دهد یا زمان این اتفاق داشته باشد.

از این رو یک تیم از دانشگاه واشنگتن سیستم هوش مصنوعی‌ را توسعه داده‌اند که به کاربر هدفون هوش مصنوعی اجازه می‌دهد با نگاه کردن به یک سخنگو به مدت سه تا پنج ثانیه، صدای او را “ثبت” کند. این سیستم سپس تمامی صداهای دیگر محیط را حذف کرده و تنها صدای سخنگوی ثبت‌شده را به‌صورت زنده پخش می‌کند، این فناوری حتی در محیط‌های شلوغ و زمانی که کاربر دیگر به سخنگو توجهی ندارد نیز به فعالیت خود ادامه می‌دهد.

هدفون هوش مصنوعی

بررسی عملکرد هدفون‌های هوش مصنوعی

برای استفاده از هدفون‌ هوش مصنوعی، شخصی که هدفون‌های مجهز به میکروفون‌های معمولی به گوش دارد، دکمه‌ای را فشار می‌دهد و همزمان سر خود را به سمت شخص سخنگو می‌چرخاند. امواج صوتی از صدای آن سخنگو باید به طور همزمان به میکروفون‌های دو طرف هدفون برسند؛ البته برای این سیستم یک حاشیه خطای ۱۶ درجه‌ای نیز وجود دارد.

 سپس هدفون‌ها سیگنال صدا را به یک پردازنده تعبیه‌شده که الگوهای صوتی را از یکدیگر تفکیک می‌کند، ارسال خواهد کرد. بعد از آن سیستم بر صدای سخنگو تمرکز کرده آن را از سایر نویزهای محیط جدا و برای شنونده پخش می‌کند.

این فرآیند حتی زمانی که شنونده و گوینده هر دو در حال حرکت باشند نیز ادامه پیدا خواهد کرد. هر چقدر سیستم هوش مصنوعی هدفون بر صدای سخنگو بیشتر تمرکز کند، داده‌های آموزشی بیشتری را کسب کرده و توانایی خود را از این طریق بهبود می‌بخشد.

نتایج آزمایش عملکرد سیستم هوش مصنوعی هدفون

تیم پژوهشگران ابداع کننده این فناوری، سیستم خود را روی ۲۱ نفر آزمایش کردند و این افراد به طور متوسط وضوح صدای سخنگوی ثبت‌شده را تقریبا دو برابر بالاتر از صدای فیلترنشده نشان دادند.

این کار بر اساس تحقیقات قبلی تیم درباره “شنوایی معنایی” بنا شده است که به کاربران اجازه می‌دهد دسته‌های صدای خاص صدا مانند صدای پرنده یا انسان را که قصد شنیدن آن را دارند انتخاب کرده و دیگر صداهای محیط را حذف کنند.

محدودیت‌ها و آینده سیستم

در حال حاضر، این سیستم فقط می‌تواند داده‌های صوتی یک سخنگو را ثبت کند و تنها زمانی قادر به ثبت سیگنال است که صدای بلند دیگری از جهت سخنگو به سمت هدفون هوشمند نیاید.

با این حال اگر کاربر از کیفیت صدا راضی نباشد، می‌تواند ثبت صدای سخنگو را دوباره انجام دهد تا وضعیت صدا بهبود یابد. تیم هدفون هوش مصنوعی در حال توسعه این سیستم به هدفون‌های کوچک‌تر و حتی انتقال این فناوری بر روی سمعک‌ها هستند، بنابراین آینده روشنی برای این فناوری در نظر گرفته می‌شود.

سخن پایانی

توسعه هدفون‌های هوشمند با استفاده از سیستم هوش مصنوعی شنوایی هدفمند، یک پیشرفت بزرگ در حوزه فناوری‌های صوتی است. این سیستم می‌تواند تجربه شنیداری کاربران را در محیط‌های پر سر و صدا بهبود بخشد و امکان تمرکز بر صدای یک سخنگوی خاص را فراهم کند.

این نوآوری می‌تواند در آینده کاربردهای گسترده‌ای در سمعک‌ها و سایر فناوری‌های صوتی داشته باشد. با ادامه تحقیق و توسعه، انتظار می‌رود که سیستم‌های مشابه با قابلیت‌های پیشرفته‌تر و در اندازه‌های کوچک‌تر در دسترس عموم قرار گیرند و تجربه شنیداری بهتری را برای کاربران فراهم کنند.

نظر خود را به اشتراک بگذارید

ایمیل شما منتشر نخواهد شد. فیلدهای ضروری با * مشخص شده‌اند.