با پیشرفت فناوریهای نوین، محققان موفق به توسعه یک سیستم هوش مصنوعی شدهاند که به افرادی که از هدفونهای هوشمند استفاده میکنند، اجازه میدهد تا با نگاه کردن به یک فرد سخنگو به مدت سه تا پنج ثانیه، صدای او را “ثبت” کنند. این سیستم که به نام شنوایی هدفمند گفتار یا هدفون هوش مصنوعی شناخته میشود، قادر است تمامی صداهای دیگر محیط را حذف کرده و تنها صدای سخنگوی ثبت شده را بهصورت زنده پخش کند. این ویژگی حتی زمانی که کاربر در محیطهای پر سر و صدا حرکت کرده و دیگر به سمت سخنگو نگاه نمیکند نیز عمل میکند.
در ادامه اطلاعات دقیقتری درباره این تکنولوژی میخوانیم.
آیا هدفون هوش مصنوعی همان فناوری حذف کننده نویز است؟
ممکن است با مطالعه مقدمه این مطلب تصور کنید که هدفون هوشمند، همان هدفونهای حذف کننده نویز محیط هستند که امروزه بسیار کاربرد دارند. اما در این قسمت بررسی میکنیم که این موضوع درست نیست. هدفونهای حذفکننده نویز توانایی ایجاد یک فضای صوتی خالی را دارند، اما باز هم صداها از محیط میتوانند تکنولوژی حذف نویز را تحت تاثیر قرار دهند که این یک چالش برای پژوهشگران است.
بهعنوان مثال، آخرین نسخه از هدفونهای AirPods Pro اپل به طور خودکار زمانی که کاربر در حال استفاده از هدفون است، سطح صداها را برای وی کنترل میکند. اما باز هم کاربر قادر نیست کنترلی روی انتخاب شخصی که میخواهد به صدای او گوش دهد یا زمان این اتفاق داشته باشد.
از این رو یک تیم از دانشگاه واشنگتن سیستم هوش مصنوعی را توسعه دادهاند که به کاربر هدفون هوش مصنوعی اجازه میدهد با نگاه کردن به یک سخنگو به مدت سه تا پنج ثانیه، صدای او را “ثبت” کند. این سیستم سپس تمامی صداهای دیگر محیط را حذف کرده و تنها صدای سخنگوی ثبتشده را بهصورت زنده پخش میکند، این فناوری حتی در محیطهای شلوغ و زمانی که کاربر دیگر به سخنگو توجهی ندارد نیز به فعالیت خود ادامه میدهد.
بررسی عملکرد هدفونهای هوش مصنوعی
برای استفاده از هدفون هوش مصنوعی، شخصی که هدفونهای مجهز به میکروفونهای معمولی به گوش دارد، دکمهای را فشار میدهد و همزمان سر خود را به سمت شخص سخنگو میچرخاند. امواج صوتی از صدای آن سخنگو باید به طور همزمان به میکروفونهای دو طرف هدفون برسند؛ البته برای این سیستم یک حاشیه خطای ۱۶ درجهای نیز وجود دارد.
سپس هدفونها سیگنال صدا را به یک پردازنده تعبیهشده که الگوهای صوتی را از یکدیگر تفکیک میکند، ارسال خواهد کرد. بعد از آن سیستم بر صدای سخنگو تمرکز کرده آن را از سایر نویزهای محیط جدا و برای شنونده پخش میکند.
این فرآیند حتی زمانی که شنونده و گوینده هر دو در حال حرکت باشند نیز ادامه پیدا خواهد کرد. هر چقدر سیستم هوش مصنوعی هدفون بر صدای سخنگو بیشتر تمرکز کند، دادههای آموزشی بیشتری را کسب کرده و توانایی خود را از این طریق بهبود میبخشد.
نتایج آزمایش عملکرد سیستم هوش مصنوعی هدفون
تیم پژوهشگران ابداع کننده این فناوری، سیستم خود را روی ۲۱ نفر آزمایش کردند و این افراد به طور متوسط وضوح صدای سخنگوی ثبتشده را تقریبا دو برابر بالاتر از صدای فیلترنشده نشان دادند.
این کار بر اساس تحقیقات قبلی تیم درباره “شنوایی معنایی” بنا شده است که به کاربران اجازه میدهد دستههای صدای خاص صدا مانند صدای پرنده یا انسان را که قصد شنیدن آن را دارند انتخاب کرده و دیگر صداهای محیط را حذف کنند.
محدودیتها و آینده سیستم
در حال حاضر، این سیستم فقط میتواند دادههای صوتی یک سخنگو را ثبت کند و تنها زمانی قادر به ثبت سیگنال است که صدای بلند دیگری از جهت سخنگو به سمت هدفون هوشمند نیاید.
با این حال اگر کاربر از کیفیت صدا راضی نباشد، میتواند ثبت صدای سخنگو را دوباره انجام دهد تا وضعیت صدا بهبود یابد. تیم هدفون هوش مصنوعی در حال توسعه این سیستم به هدفونهای کوچکتر و حتی انتقال این فناوری بر روی سمعکها هستند، بنابراین آینده روشنی برای این فناوری در نظر گرفته میشود.
سخن پایانی
توسعه هدفونهای هوشمند با استفاده از سیستم هوش مصنوعی شنوایی هدفمند، یک پیشرفت بزرگ در حوزه فناوریهای صوتی است. این سیستم میتواند تجربه شنیداری کاربران را در محیطهای پر سر و صدا بهبود بخشد و امکان تمرکز بر صدای یک سخنگوی خاص را فراهم کند.
این نوآوری میتواند در آینده کاربردهای گستردهای در سمعکها و سایر فناوریهای صوتی داشته باشد. با ادامه تحقیق و توسعه، انتظار میرود که سیستمهای مشابه با قابلیتهای پیشرفتهتر و در اندازههای کوچکتر در دسترس عموم قرار گیرند و تجربه شنیداری بهتری را برای کاربران فراهم کنند.