Teknologi lip reading pembaca bibir

Teknologi pembaca bibir baru yang dikembangkan di University of East Anglia (UEA) dapat membantu dalam memecahkan kejahatan dan memberikan bantuan komunikasi bagi orang-orang dengan pendengaran dan gangguan berbicara.

Visual teknologi pengenalan suara dibuat oleh Dr Helen L. Beruang dan Prof Richard Harvey dari UEA School of Sciences Computing dapat diterapkan “tempat di mana audio tidak cukup baik untuk menentukan apa yang orang katakan”, kata Dr Beruang.

Dr Bear yang temuannya akan dipresentasikan pada International Conference on Acoustics, Speech and Signal Processing (ICASSP) di Shanghai mengatakan masalah yang unik dengan menentukan pidato muncul ketika suara tidak tersedia seperti yang di rekaman CCTV atau jika audio tidak memadai dan tidak ada petunjuk untuk memberikan konteks percakapan. Suara ‘/ p /,’ ‘/ b /,’ dan ‘/ m /’ semua terlihat serupa di bibir, tapi sekarang teknologi klasifikasi mesin pembaca bibir dapat membedakan antara suara untuk terjemahan yang lebih akurat.

bibir-tersenyum

Dr Bear mengatakan: “Kami masih belajar ilmu pidato visual dan apa yang orang perlu tahu untuk membuat model pengakuan bukti bodoh untuk membaca bibir, tetapi sistem klasifikasi ini meningkatkan pada metode membaca bibir sebelumnya dengan menggunakan sebuah novel metode pelatihan untuk pengklasifikasi.

“Berpotensi, sistem pembaca bibir yang kuat bisa diterapkan dalam sejumlah situasi dari investigasi kriminal untuk hiburan. Lip reading telah digunakan untuk menentukan kata pemain telah berteriak di saat-saat di lapangan, tetapi kemungkinan untuk menjadi yang paling penggunaan praktis dalam situasi di mana ada tingkat tinggi suara, seperti di mobil atau pesawat terbang cockpits.

“Sementara masih ada perbaikan yang harus dilakukan, sistem seperti itu bisa diadaptasi untuk digunakan untuk berbagai tujuan misalnya untuk orang-orang dengan gangguan atau gangguan berbicara lain, mesin lip-reading yang baik bisa menjadi bagian dari. audio visual sistem pengenalan”.

Prof Harvey mengatakan: “Lip reading adalah salah satu masalah yang paling menantang dalam kecerdasan buatan sehingga bagus untuk membuat kemajuan pada salah satu aspek rumit yang adalah bagaimana untuk melatih mesin untuk mengenali penampilan dan bentuk bibir manusia”.

Penelitian ini merupakan bagian dari proyek tiga tahun dan didukung oleh Engineering and Physical Sciences Research Council (EPSRC).

Leave a Reply

Your email address will not be published. Required fields are marked *