نرم افزار آی او تایپ فعالیت خود را از سال ۱۳۹۴ با هسته ای از دانشجویان دانشگاه شهید بهشتی تهران آغاز کرد و در طی مدت کوتاهی به عنوان نرم افزار پیشتاز در حوزه هوشمصنوعی و تحلیل صوت تبدیل شده است. از جمله سرویس های برجسته نرم افزار آی او تایپ می توان به تبدیل گفتار به نوشتار (تبدیل همزمان سخن به متن) ، تبدیل فایل صوتی به متن ، وب سرویس تبدیل گفتار به نوشتار ، سرویس آفلاین یا self-hosted تایپ صوتی اشاره کرد. تیم توسعه نرم افزار iotype همواره در تلاش است تا سرویس دقیق، سریع و پایدار را در اختیار کاربران گرامی قرار دهد.
ای او تایپ (IoType) نرم افزار تحت وب تبدیل گفتار به نوشتار به زبان فارسی می باشد. با استفاده از این نرم افزار، بدون هیچ ابزار اضافه یا نصب نرم افزار، گفتار فارسی را به متن تبدیل نمایید. ویرایشگر متن این نرم افزار تحت وب، امکانات کاملی برای مدیریت ، ویرایش و قالب بندی متن دارد. همچنین شما می توانید متن حاصل از تبدیل گفتار به نوشتار را در فرمت های Docx (فایل word) یا به صورت txt دریافت نمایید. در حال حاضر امکان تایپ صوتی به سه زبان فارسی، انگلیسی و عربی در نرم افزار وجود دارد. برای شروع تایپ صوتی ، یک میکرفون مناسب (میکروفن داخلی لپ تاپ یا میکروفن با کیفیت خارجی) و اینترنت با کیفیت مطلوب، مورد نیاز است. نرم افزار تبدیل صدا به متن فارسی برای وبلاگ نویسان، دانشجویان، خبرنگاران، مترجمان و به طور کلی تمام افرادی که با تایپ متن سروکار دارند، مناسب است. در صورتی که در فرآیند تبدیل صدا به متن با مشکلی مواجه شدید با مراجعه به بخش راهنما، تقریبا تمامی پرسش ها و مشکلات احتمالی پاسخ داده شده است.
در فرآیند تبدیل فایل صوتی به متن ، کاربر با اعلام مدت زمان فایل صوتی و انتخاب زبان فایل صوتی ، برآورد اولیه از هزینه و مدت زمان تحویل فایل متنی تبدیل شده از صوتی را دریافت خواهد کرد. در مرحله بعد پس از بارگذاری فایل صوتی ، فرآیند تبدیل ویس به متن آغاز می شود. در این فرآیند ابتدا فایل صوتی توسط نرم افزار پردازش شده و به متن تبدیل می شود ، سپس برای اطمینان از دقت و رفع نقص های احتمالی فایل توسط اپراتور بررسی شده تا نتیجهای بی نقص تحویل کاربران داده شود. طبیعتا هرچه کیفیت و شمرده بودن فایل صوتی بیشتر باشد ، دقت تبدیل و مدت زمان تحویل آن کمتر خواهد شد.
نرم افزار iotype به منظور بهرهمندی توسعه دهندگان نرم افزار از سرویسهای مربوط به ASR فارسی ، پردازش صدا و تبدیل همزمان صوت به متن API های خود را در دو ساختار تبدیل همزمان صدا به متن (Realtime Speech Recognize) و ساختار ارسال فایل، دریافت متن ارائه می دهد. در API تبدیل همزمان صدا به متن توسعه دهنده می تواند همزمان صدا (یا محتوی یک فایل صوتی) را از کاربر خود به صورت stream (بستههای داده پشت سر هم) دریافت نموده و با ارسال آنها از طریق پروتکل wss (WebSocket Secured) به سرورهای iotype متن صوتهای ارسالی را به صورت stream دریافت نماید. در ساختار API ارسال فایل و دریافت متن ، توسعه دهنده فایل صوتی خود را به API تایپ صوتی فارسی از طریق درخواست Http ارسال کرده و متن آن را دریافت می کند.