به گزارش خبرگزاری ایمنا و به نقل از تککرانچ، شرکت آنتروپیک، از بازیگران اصلی حوزه هوش مصنوعی مولد، قابلیت صوتی جدیدی را برای چتبات Claude معرفی کرده که در حال حاضر بهصورت آزمایشی (بتا) برای کاربران نسخه موبایل در دسترس قرار گرفته است.
این ویژگی جدید، امکان برقراری گفتوگوی کامل و گفتاری با مدل Claude را فراهم کرده و به کاربران اجازه میدهد بدون نیاز به تایپ، تنها با فرمان صوتی با سیستم تعامل برقرار کنند. بر اساس بیانیه منتشرشده در شبکه اجتماعی X و مستندات بهروزرسانیشده شرکت، این قابلیت قرار است طی هفتههای آینده بهطور گستردهتری منتشر شود.
براساس گزارشها، حالت صوتی با مدل Claude Sonnet 4 فعال میشود و یکی از اهداف اصلی آن، فراهمسازی امکان استفاده از Claude در موقعیتهایی است که تایپ کردن دشوار یا غیرممکن است (نظیر رانندگی یا انجام چندوظیفهای (Multitasking)). اطلاعات کلیدی همچنان بهصورت متنی روی صفحه نمایش داده میشوند تا امکان مرور و ثبت محتوا حفظ شود.
با توجه به رقابت شدید میان شرکتهای فعال در حوزه هوش مصنوعی تعاملی، از جمله OpenAI با سرویس ChatGPT و گوگل با قابلیت Gemini Live، آنتروپیک نیز در تلاش است تا با افزودن امکانات صوتی، تجربه کاربری را به سطحی شهودیتر و شبیه به تعاملات انسانی ارتقا دهد. در همین راستا، کاربران قادرند بهصورت گفتاری درباره اسناد، تصاویر و موضوعات گوناگون با Claude صحبت کنند و حتی صدای دلخواه خود را از میان پنج گزینه موجود انتخاب کنند.
امکان جابهجایی سریع بین ورودی صوتی و متنی نیز برای کاربران فراهم شده و در پایان هر مکالمه، نه تنها متن کامل گفتوگو بلکه خلاصهای از محتوای آن نیز ارائه میشود. این ویژگیها بهطور خاص برای بهرهگیری در حوزههای بهرهوری فردی و تجاری طراحی شدهاند.
با این حال، این قابلیت صوتی با محدودیتهایی همراه است. کاربران نسخه رایگان، تنها قادر به انجام حدود ۲۰ تا ۳۰ مکالمه صوتی در ماه هستند و سقف استفاده رایگان شامل مکالمات صوتی نیز میشود، در مقابل کاربران اشتراکدار میتوانند از مزایای بیشتری بهرهمند شوند که از جمله آنها، اتصال به Google Workspace است؛ این اتصال به آنها اجازه میدهد از طریق فرامین صوتی به اطلاعات تقویم و ایمیلهای خود دسترسی پیدا کنند.
لازم به ذکر است که ادغام کامل با Google Docs در حال حاضر تنها برای حسابهای سازمانی Claude فعال شده است، مایک کریگر، مدیر ارشد محصول آنتروپیک، در گفتوگویی با روزنامه فایننشال تایمز اشاره کرده است که این شرکت در حال همکاری با آمازون و استارتاپ ElevenLabs برای توسعه ویژگیهای پیشرفتهتر صوتی است. با اینحال، جزئیات نهایی این همکاریها هنوز منتشر نشده و مشخص نیست کدامیک از این پروژهها به مرحله عملیاتی رسیدهاند، با افزودهشدن این قابلیت جدید، رقابت در بازار چتباتهای صوتی بیشازپیش شدت یافته و شرکتهای فعال در حوزه هوش مصنوعی بهسمت خلق تجربههایی نزدیکتر به تعامل انسانی گام برمیدارند.