Membuat Transkrip Audio menggunakan Amazon Transcribe
Sebagai developer, membuat transkripsi panggilan customer service atau membuat subtitle pada konten audio dan video adalah tantangan umum yang membutuhkan kemampuan ucapan-ke-teks. Tantangan ini dapat diatasi dengan membangun model machine learning kita sendiri dari awal. Namun, opsi ini butuh waktu lama, mahal, dan membutuhkan keahlian machine learning. Kita dapat menggunakan Amazon Transcribe, layanan yang dilatih sebelumnya dan terkelola penuh, yang menyediakan transkripsi cepat dan berkualitas tinggi, daripada menggunakan cara yang sulit.
Apa itu Amazon Transcribe?
Amazon Transcribe adalah layanan ASR yang memudahkan developer untuk menambahkan kemampuan speech-to-text ke aplikasi mereka, dan Amazon Translate adalah layanan MT yang memberikan terjemahan bahasa yang cepat, berkualitas tinggi, dan terjangkau.
Menggunakan Amazon Transcribe
Menggunakan API Amazon Transcribe, kita dapat menganalisis file audio yang disimpan di Amazon Simple Storage Service (S3) dan membuat layanan tersebut mengembalikan file teks dari ucapan yang ditranskripsikan.
Langkah 1 : Memuat bucket S3 dan mengunggah file audio sampel
Pada langkah ini kita akan mengunduh file audio sampel, membuat bucket S3, lalu mengunggah file sampel ke bucket S3. Transcribe mengakses file audio dan video untuk transkripsi secara khusus dari bucket S3.
Pertama-tama kita akan menyiapkan file audio sample. File tersebut bisa kita unduh di sini
Kita akan menggunakan akun AWS kita. Dalam hal ini, saya akan menggunakan Classroom yang disediakan oleh Digital Talent Scholarship. Klik Go to classroom.
Kita akan dialihkan ke Workbench kita. Klik AWS Console dan jendela browser baru akan terbuka di AWS Management Console.
Pada halaman AWS Management Console, Ketikkan “S3” di bilah penelusuran dan pilih “S3” untuk membuka konsol atau klik saja di bilah Recently visited services.
Di dasbor S3 pilih Create bucket (Buat bucket).
Jika ini adalah kali pertama kita membuat bucket, kita akan melihat layar yang tampak seperti gambar yang diilustrasikan di sini. Jika kita sudah pernah membuat bucket S3, dasbor S3 kita akan mencantumkan semua bucket yang pernah dibuat.
Masukkan nama bucket. Nama bucket harus unik di antara semua nama bucket yang ada di Amazon S3. Lalu, pilih Wilayah tempat kita akan membuat bucket.
Pilih Next (Berikutnya).
Kita memiliki banyak opsi bermanfaat untuk bucket S3 kitatermasuk Pembuatan Versi, Pencatatan Akses Server, Tag, Pencatatan Tingkat Objek, dan Enkripsi Default. Kita tidak akan mengaktifkan semua fitur tersebut untuk kali ini.
Pilih Next (Berikutnya).
Pada langkah ini kita memiliki kemampuan untuk menyesuaikan pengaturan izin untuk bucket S3 kita selama proses pembuatan bucket S3.
Biarkan nilai default lalu pilih Next (Berikutnya).
Tinjau pengaturan konfigurasi kita lalu pilih Create Bucket (Buat bucket).
Kita akan melihat bucket baru di konsol S3. Klik nama bucket untuk menavigasi ke dalam bucket.
Kita berada di halaman beranda bucket kita.
Pilih Upload (Unggah).
Unggah file transcribe-sample.mp3 dengan memilih Add files (Tambahkan file) dan memilih file ATAU menyeret file transcribe-sample.mp3 ke kotak unggahan.
Pilih Upload (Unggah).
Dengan demikian, sample audio kita telah siap untuk digunakan.
Langkah 2 : Membuat tugas transkripsi
Pada langkah ini kita akan membuat dan menjalankan tugas transkripsi menggunakan konsol Amazon Transcribe.
Dari bilah menu bagian atas, pilih Services (Layanan) kemudian mulai ketikkan Transcribe di bilah pencarian, lalu pilih Amazon Transcribe untuk membuka konsol layanan.
Pada halaman utama konsol Amazon Transcribe, buka panel navigasi dan klik Transcription jobs (Tugas transkripsi).
Pada halaman Tugas transkripsi, klik Create job (Buat tugas).
Pada halaman Buat tugas transkripsi, di bidang Name (Nama), ketikkan transcribe-sample.
Biarkan Bahasa default adalah English (Bahasa Inggris).
Selanjutnya, klik Browse S3 pada bilah Input data untuk menggunakan sample audio yang telah sebelumnya diunggah ke S3 bucket. Lalu klik Choose.
Biarkan Output data adalah Service-managed S3 bucket. Lalu klik Next.
Kita memiliki banyak opsi bermanfaat untuk Amazon Transcribe termasuk Audio setting, content removal, dan customization. Tidak ada dari opsi ini yang digunakan dalam tutorial ini.
Pilih Create (Buat) untuk memulai tugas transkripsi.
Langkah 3 : Meninjau hasil transkripsi
Pada langkah ini, kita akan mempelajari cara memeriksa progres dan meninjau hasil tugas transkripsi kita.
Setelah kita mengklik tombol Create (Buat), kita akan melihat layar Tugas transkripsi. Layar akan menampilkan status transcribe-sample. Status dapat berupa In progress (Dalam proses), Complete (Selesai), atau Failed (Gagal).
Ketika status Selesai, klik tautan transcribe-sample di kolom Name (Nama) untuk melihat hasil transkripsi.
Berikutnya, kita akan melihat detail transcribe-sample. Gulir ke bawah ke panel Transcription (Transkripsi) untuk melihat hasil tugas transkripsi. Di panel JSON kita dapat melihat hasil transkripsi karena akan dikembalikan dari API Transcribe atau AWS CLI.
Langkah 4 : Menghapus resources
Pada langkah ini kita akan menghapus file sampel dari bucket S3 kita untuk menghindari biaya yang tidak perlu.
Di menu navigasi bagian atas, klik Services (Layanan) dan mulai ketikkan S3 di bilah pencarian, lalu pilih S3 untuk membuka konsol.
Temukan bucket yang kita buat sebelumnya. Klik nama bucket untuk melihat konten bucket.
Pilih file transcribe-sample.mp3 yang terdapat dalam bucket kita dan dari menu Actions (Tindakan), pilih Delete (Hapus). Konfirmasi penghapusan.
Kesimpulan
Amazon Transcribe memungkinkan perubahan suara ke teks dalam skala besar. Kita bisa menggunakan Amazon Transcribe untuk berbagai file audio atau video, seperti panggilan customer service, pertemuan bisnis, siaran TV, dan video sesuai permintaan kita.
Harga
Amazon Transcribe
*Menggunakan Region Asia Pasifik (Singapura)
Untuk informasi lebih lengkap, klik disini
Amazon S3 (Simple Storage Service)
*Menggunakan Region Asia Pasifik (Singapura)
Untuk informasi lebih lengkap, klik disini
Lebih lanjut
Untuk harga yang lebih komprehensif, menyeluruh sesuai kebutuhan kita, disarankan untuk menggunakan AWS Pricing Calculator. AWS Pricing Calculator memungkinkan kita menjelajahi layanan AWS dan membuat perkiraan biaya case study kita di AWS. Kita dapat memodelkan dan mensimulasikan sebelum membangunnya, menjelajahi harga dan penghitungan, serta menemukan jenis instance dan persyaratan kontrak yang tersedia yang memenuhi kebutuhan kita. Klik disini untuk informasi lebih lengkap.
Referensi
https://docs.aws.amazon.com/transcribe/latest/dg/what-is-transcribe.html
https://aws.amazon.com/getting-started/hands-on/create-audio-transcript-transcribe/?nc1=h_ls
https://aws.amazon.com/id/transcribe/pricing/
https://aws.amazon.com/id/s3/pricing/
Komentar
Posting Komentar